针对Nginx日志的相关运维操作记录

在分析服务器运行情况和业务数据时，nginx日志是非常可靠的数据来源，而掌握常用的nginx日志分析命令的应用技巧则有着事半功倍的作用，可以快速进行定位和统计。

1）Nginx日志的标准格式（可参考：http://www.cnblogs.com/kevingrace/p/5893499.html）

log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '

             '$status $body_bytes_sent "$http_referer" '

             '"$http_user_agent" $request_time';

记录的形式如下：

192.168.28.22 - - [28/Feb/2018:04:01:11 +0800] "GET /UserRecommend.php HTTP/1.1" 200 870 "http://wwww.kevin.www/grace/index.html"

"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30)" 320

日志格式说明：
$remote_addr 远程请求使用的IP地址
$remote_user 远端登录名
$time_local 时间，用普通日志时间格式(标准英语格式)
$request 请求的第一行
$status 状态。
$body_bytes_sent 请求返回的字节数，包括请求头的数据
$http_referer 请求头Referer的内容
$http_user_agent 请求头User-Agent的内容
$request_time 处理完请求所花时间，以秒为单位

Apache日志的标准格式

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %T " combined

    CustomLog log/access_log combined

记录的形式如下：

192.168.28.23 - frank [28/Feb/2018:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 "http://www.example.com/start.html"

"Mozilla/4.08 [en] (Win98; I ;Nav)"

日志格式说明：
%h 请求使用的IP地址
%l 远端登录名(由identd而来，如果支持的话)，除非IdentityCheck设为"On"，否则将得到一个"-"。
%u 远程用户名(根据验证信息而来；如果返回status(%s)为401，可能是假的)
%t 时间，用普通日志时间格式(标准英语格式)
%r 请求的第一行
%s 状态。对于内部重定向的请求，这个状态指的是原始请求的状态，---%>s则指的是最后请求的状态。
%b 以CLF格式显示的除HTTP头以外传送的字节数，也就是当没有字节传送时显示'-'而不是0。
\"%{Referer}i\" 发送到服务器的请求头Referer的内容。
\"%{User-Agent}i\" 发送到服务器的请求头User-Agent的内容。
%T 处理完请求所花时间，以秒为单位。
%I 接收的字节数，包括请求头的数据，并且不能为零。要使用这个指令你必须启用mod_logio模块。
%O 发送的字节数，包括请求头的数据，并且不能为零。要使用这个指令你必须启用mod_logio模块。

Nginx 日志字段解释

说明	字段名	示例
主机头	$host	域名 kevin.bo.com
服务器ip	$server_addr	192.168.10.109
端口	$server_port	80
客户ip	$remote_addr	172.17.12.18
客户	$remote_user	-
时间	$time_iso8601	2018-11-04T10:13:40+09:00
状态码	$status	204
发送主体大小	$body_bytes_sent	0
发送总大小	$bytes_sent	140
请求总大小	$request_length	578
请求主体大小	$request_body	-
请求时间	$request_time	0.001
请求方式	$request_method	GET
uri	$uri	/rest/quickreload/latest/18747370
变量	$args	since=1559180602998&_=1559181197999
协议	$server_protocol	HTTP/1.1
cookie	$cookie_nid	-
记录从哪个页面链接访问过来	$http_referer	http://kevin.bo.com/pages/viewpage.action?pageId=18747370
客户端信息	$http_user_agent	Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36
客户端真实ip（经过反向代理）	$http_x_forwarded_for	-
编码	$http_accept_encoding	gzip, deflate
当前通过一个连接获得的请求数量	$connection_requests	1
后端ip	$upstream_addr	192.168.10.33:8090
后端状态码	$upstream_status	204
后端响应时间	$upstream_status	0.001
后台缓存	$upstream_cache_status	-
后端接口状态	$upstream_http_x_status	-

配置文件
log_format main '$host\t$server_addr\t$server_port\t$remote_addr\t'
'$remote_user\t$time_iso8601\t$status\t'
'$body_bytes_sent\t$bytes_sent\t$request_length\t'
'$request_body\t$request_time\t$request_method\t'
'$uri\t$args\t$server_protocol\t$cookie_nid\t'
'$http_referer\t$http_user_agent\t$http_x_forwarded_for\t'
'$http_accept_encoding\t$connection_requests\t$upstream_addr\t'
'$upstream_status\t$upstream_response_time\t$upstream_cache_status\t$upstream_http_x_status';

2）Nginx日志切割

#!/bin/sh

# 设置日志文件备份文件名

#logfilename=`date +%Y%m%d`

logfilename=`date +\%Y\%m\%d -d "1 days ago"`

# 设置日志文件原始路径

logfilepath=/opt/nginx/logs/

# 设置日志备份文件路径

backupfilepath=/opt/data/logs/nginx/  

LOG_FILE='access error log_mm log_db'

for j in $LOG_FILE

do

        cd ${logfilepath}

        tar zcvf ${backupfilepath}$j/${logfilename}.tar.gz $j.log

        rm -rf $j.log

done  

kill -USR1 `cat  /opt/nginx/nginx.pid

===================================================
apache日志切割

#!/bin/bash

# 获取昨天的日期

logfilename=`date -d yesterday +%Y_%m_%d`

today=`date +%Y.%m.%d`

# 设置日志文件原始路径

logfilepath=/opt/apache2/logs/

# 设置日志备份文件路径

backupfilepath=/opt/data/logs/apache/  

echo "get access log:"

# 打包压缩访问日志文件

cd ${logfilepath}

tar zcvf ${backupfilepath}access/${logfilename}.tar.gz access_${logfilename}.log

rm -rf access_${logfilename}.log  

echo "get error log:"

# 打包压缩错误日志文件

cd ${logfilepath}

tar zcvf ${backupfilepath}error/${logfilename}.tar.gz error_${logfilename}.log

rm -rf error_${logfilename}.log  

echo "done @"${today}

==========================================================

3）日志定时清理的脚本

#!/bin/sh

####################### clear logs #########################

### nginx ###

#clear nginx access log(by hour .log) 2 days ago

/usr/bin/find /opt/data/logs/nginx/access -mtime +2 -name "access.log*" -exec rm -rf {} \;  

#clear nginx (access,error,log_mm,log_db) log(by day tar.gz) 10 days ago

NGINX='access error log_mm log_db'

for i in $NGINX

do

        /usr/bin/find /opt/data/logs/nginx/$i -mtime +10 -name "*tar.gz" -exec rm -rf {} \;

done  

### apache ###

#clear apache (access,error) log(by day tar.gz) 10 days ago

APACHE='access error'

for j in $APACHE

do

        /usr/bin/find /opt/data/logs/apache/$j -mtime +10 -name "*tar.gz" -exec rm -rf {} \;

done  

### other log ###

#clear (txt/mq,txt/auto,txt/man) log(by day .log) 10 days ago

OTHER='txt/mq txt/auto txt/man'

for k in $OTHER

do

        /usr/bin/find /opt/data/logs/$k -mtime +10 -name "*log" -exec rm -rf {} \;

done

=============在分析nginx日志时常用命令总结=============

1. 利用grep ,wc命令统计某个请求或字符串出现的次数

比如统计GET /app/kevinContent接口在某天的调用次数，则可以使用如下命令：

[root@Fastdfs_storage_s1 ~]# cat /usr/local/nginx/logs/access.log | grep 'GET /app/kevinContent' | wc -l

其中cat用来读取日志内容，grep进行匹配的文本搜索，wc则进行最终的统计。

当然只用grep也能实现上述功能：

[root@Fastdfs_storage_s1 ~]# grep 'GET /app/kevinContent'  /usr/local/nginx/logs/access.log -c

2. 统计所有接口的调用次数并显示出现次数最多的前二十的URL

[root@Fastdfs_storage_s1 ~]# cat /usr/local/nginx/logs/access.log|awk '{split($7,b,"?");COUNT[b[1]]++;}END{for(a in COUNT) print  COUNT[a], a}'|

sort -k1 -nr|head -n20 

2722 /

10 /group1/M00/00/00/wKgKylqT3OCAUrqYAAAwK2jUNaY262.png

9 /group1/M00/00/00/wKgKylqUxBOAFo8hAAKHUIZ3K9s443.jpg

6 /group1/M00/00/00/wKgKylqUrceAGkPOAAAwK2jUNaY843.png

4 /group1/M00/00/00/wKgKylqTsFCAdeEuAAKHUIZ3K9s287.png

3 /group2/M00/00/00/wKgKy1qUtu2Acai1AAKHUIZ3K9s555.jpg

2 /favicon.ico

1 /group2/M00/00/00/wKgKy1qT3P-Ae-vQAAKHUIZ3K9s459.png

1 /group2/M00/00/00/wKgKy1qT3P-Ae-vQAAKHUIZ3K9s459.jpg

1 /group1/M00/00/00/wKgKylqUyMuAdkLwAAAwK2jUNaY176.png

1 /group1/M00/00/00/wKgKylqUtuyAA5xrAAKHUIZ3K9s226.jpg

1 /group1/M00/00/00/wKgKylqUscKAa4NXAAKHUIZ3K9s530.jpg

1 /group1/M00/00/00/wKgKylqTsFCAdeEuAAKHUIZ3K9s287.jpg

1 /group1/M00/00/00/wKgKylqT4ESAHdNjAAKHUIZ3K9s730.jpg

1 /group1/M00/00/00/wKgKylqT3-6AbEeUAAKHUIZ3K9s742.png

解释说明：

这里awk是按照空格把每一行日志拆分成若干项，其中$7对应的就是URL，当然具体对应的内容和使用nginx时设置的日志格式有关。

这样就可以通过拆分提取出IP，URL，状态码等信息。split是awk的内置函数，在此的意思是按照“？”将URL进行分割得到一个数组，并赋值给b。

COUNT[b[1]]++表示相同的接口数目加1。sort用来排序，-k1nr表示要把进行排序的第一列作为数字看待，并且结果倒序排列。

head -n20意为取排名前二十的结果。

3. 统计报错的接口

统计nginx日志中报错较多的接口，对于分析服务器的运行情况很有帮助，也可以有针对性的修复bug和性能优化。

[root@Fastdfs_storage_s1 ~]# cat /usr/local/nginx/logs/access.log|awk '{if($9==500) print $0}'|

awk '{split($7,b,"?");COUNT[b[1]]++;}END{for(a in COUNT) print  COUNT[a], a}'|sort -k 1 -nr|head -n10

先用awk’{if(9==500)print0}’过滤出500错误的日志，然后在此基础上做统计，其思路同2类似！

4. 统计HTTP响应状态码

通过统计响应状态码可以看出服务器的响应情况，比如499较多时可以判断出服务器响应缓慢，再结合3可以找出响应慢的接口，

这样就能有针对性进行性能分析和优化。

[root@Fastdfs_storage_s1 ~]# cat /usr/local/nginx/logs/access.log |awk '{counts[$(9)]+=1}; END {for(code in counts) print code, counts[code]}'

| sort -k 2 -nr

200 2733

304 20

404 11

5. 统计服务器并发量

[root@Fastdfs_storage_s1 ~]# cat /usr/local/nginx/logs/access.log |grep '10.15.19.138'| awk '{COUNT[$4]++}END{for( a in COUNT) print a,COUNT[a]}'

|sort -k 2 -nr|head -n20

nginx转发请求时可以记录响应请求的服务器IP,先通过grep过滤出某个服务器所有的请求，然后统计各个时间点的并发请求响应的数量即可得到某个服务器的并发量。

$4对应的是响应时间。当然，如果把grep的内容更换成某个接口也就可以统计出该接口对应的并发量了。

6. grep多条件与或操作

有时候我们需要在nginx日志通过多个条件来查找某些特定请求，比如我需要找个某个用户浏览文章的请求，则可以需要同时匹配两个条件：

浏览文章接口GET /app/kevinContent和userId=59h7hrrn。

grep对应的与操作命令如下：

[root@Fastdfs_storage_s1 ~]# grep -E "GET /app/kevinContent.*userId=59h7hrrn" /usr/local/nginx/logs/access.log

grep与命令格式： grep -E “a.*b” file，ab条件同时成立

而grep或命令的格式为：grep -E “a|b” file ，ab两个条件有一个成立即可。

7. grep打印匹配的前后几行

有时候我们需要查找某个特定请求的前后几行的请求，以观察用户的关联操作情况。grep提供了一下几条命令：

# grep -C 5 'parttern' inputfile    //打印匹配行的前后5行。

# grep -A 5 'parttern' inputfile    //打印匹配行的后5行

# grep -B 5 'parttern' inputfile    //打印匹配行的前5行

grep -An  或grep -A n

grep -Bn  或grep -B n

grep -Cn  或grep -C n

如下，打印出access.log日志文件中匹配/app/kevinContent关键字符所在行的前后各10行

[root@Fastdfs_storage_s1 ~]# grep -C 10 'GET /app/kevinContent' /usr/local/nginx/logs/access.log

针对Nginx日志的相关运维操作记录的更多相关文章

nginx日志相关运维操作记录
在分析服务器运行情况和业务数据时,nginx日志是非常可靠的数据来源,而掌握常用的nginx日志分析命令的应用技巧则有着事半功倍的作用,可以快速进行定位和统计. 1)Nginx日志的标准格式(可参考: ...
Redis 相关运维操作
背景 Redis作为目前全球最流行的KV存储,除了使用之外,还需要做好日常的运维工作.关于运维相关的工作,本文从以下方面进行介绍说明(Redis5.0以上): 内存方面客户端连接方面工具方面说明 ...
MongoDB副本集（一主一备+仲裁）环境部署-运维操作记录
MongoDB复制集是一个带有故障转移的主从集群.是从现有的主从模式演变而来,增加了自动故障转移和节点成员自动恢复.MongoDB复制集模式中没有固定的主结点,在启动后,多个服务节点间将自动选举产生一 ...
Linux内存运维操作及常用命令
Linux内存运维操作及常用命令 1.问题诊断 1.1 什么是 Linux 服务器 Load Average? 1.2如何查看 Linux 服务器负载? 1.3服务器负载高怎么办? 1.4如何查看服务 ...
Linux 针对nginx日志文件做ip防刷限制
针对nginx日志做ip访问限制 1.cat /var/log/server/nginx/access.log| awk -F '?' '/optionid/{print $1}'|awk '{pri ...
Nginx+upstream针对后端服务器容错的运维笔记
熟练掌握Nginx负载均衡的使用对运维人员来说是极其重要的!下面针对Nignx负载均衡upstream容错机制的使用做一梳理性说明: 一.nginx的upstream容错 1)nginx 判断节点失效 ...
Linux bash运维操作日志审计（单服务器）
目前公司有几台机器比较重要,需要把所有用户的操作记录下来,于是就是参照资料来完成 1. vim /etc/profile.d/oplogrc.sh logdir=/opt/oplog userdir= ...
2015年br运维操作归档
归档2015年在br做运维时常用的命令,主要梳理出log的过滤操作. 对于日志文本的处理,常见还是sed和awk,具体如下: 统计ip访问量: cat nginx.log |awk '{print $ ...
WebLogic11g-常用运维操作
转:http://www.codeweblog.com/weblogic11g-%e5%b8%b8%e7%94%a8%e8%bf%90%e7%bb%b4%e6%93%8d%e4%bd%9c/ 希望这篇 ...

随机推荐

解决Linux终端乱码的两则例子
现象描述我们先来说一下出现乱码的原因. 例子先举个实际的例子,我们一般通过ssh远程到服务器上进行操作.当在终端上执行一些有输出的任务时,有可能会遇到乱码,特别是输出中有中文时. 比如,我登陆上o ...
Django电商项目---完成商品主页显示day2
利用DjangoAdmin初始化数据库创建项目 python manage.py startapp df_goods 添加配置 manas/urls.py manas/settings.py 新创建 ...
记录：一个SQL SERVER奇怪的问题。
今天遇到了一个奇怪的问题.始终没搞清楚是怎么回事.先记一下 1.首先有张表a,包含字段编号.日期(varchar(250)),数值发生日期字段有非正常日期字符串,有NULL,空字符串,可能是误触键 ...
17秋软件工程团队第五次作业 Alpha Scrum1
题目:团队作业--Alpha冲刺 17秋软件工程团队第五次作业 Alpha Scrum1 各个成员在 Alpha 阶段认领的任务伟航:督促和监督团队进度,协调组内合作港晨:APP前端页面编写: ...
ug nx7.5安装方法(图文详解)
UG7.5,也称NX7.5,自卑西门子收购,软件名字已经改为SIEMENS NX了,ug7.5是一套集成了CAD.CAE 和CAM解决方案,能为设计师们提供最功能齐全的设计环境,能够大大 ...
【Ansible 文档】【译文】Playbooks 变量
Variables 变量自动化的存在使得重复的做事情变得很容易,但是我们的系统不可能完全一样. 在某些系统中,你可能想要设置一些与其他系统不一样的行为和配置. 同样地,远程系统的行为和状态也可以影响 ...
react redux学习之路
React 自学 chapter one React新的前端思维方式 React的首要思想是通过组件(Component)来开发应用.所谓组件,简单说,指的是能够完成某个特定功能的独立的.可重用的代码 ...
网络流（四）dinic算法
传送门: 网络流(一)基础知识篇网络流(二)最大流的增广路算法网络流(三)最大流最小割定理网络流(四)dinic算法网络流(五)有上下限的最大流网络流(六)最小费用最大流问题转自:http ...
webpack-dev-server的简单使用
webpack-dev-server的简单使用 1.npm install webpack-dev-server --save-dev 2.配置 package.json "scripts& ...
Nginx完美解决前后端分离端口号不同导致的跨域问题
笔者在做前后端分离系统时,出现了很多坑,比如前后端的url域名相同,但是端口号不同.例如前端页面为:http://127.0.0.1/ , 后端api根路径为 http://127.0.0.1:888 ...

针对Nginx日志的相关运维操作记录

说明

字段名

示例

主机头

$host

域名 kevin.bo.com

服务器ip

$server_addr

192.168.10.109

端口

$server_port

80

客户ip

$remote_addr

172.17.12.18

客户

$remote_user

-

时间

$time_iso8601

2018-11-04T10:13:40+09:00

状态码

$status

204

发送主体大小

$body_bytes_sent

0

发送总大小

$bytes_sent

140

请求总大小

$request_length

578

请求主体大小

$request_body

-

请求时间

$request_time

0.001

请求方式

$request_method

GET

uri

$uri

/rest/quickreload/latest/18747370

变量

$args

since=1559180602998&_=1559181197999

协议

$server_protocol

HTTP/1.1

cookie

$cookie_nid

-

记录从哪个页面链接访问过来

$http_referer

http://kevin.bo.com/pages/viewpage.action?pageId=18747370

客户端信息

$http_user_agent

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36

客户端真实ip（经过反向代理）

$http_x_forwarded_for

-

编码

$http_accept_encoding

gzip, deflate

当前通过一个连接获得的请求数量

$connection_requests

1

后端ip

$upstream_addr

192.168.10.33:8090

后端状态码

$upstream_status

204

后端响应时间

$upstream_status

0.001

后台缓存