转: Logstash 讲解与实战应用

原创 qw87112 2016-08-20 16:06:07 评论(1)40217人阅读

一、Logstash 介绍

Logstash 是一款强大的数据处理工具，它可以实现数据传输，格式处理，格式化输出，还有强大的插件功能，常用于日志处理。

官网地址:https://www.elastic.co/products/logstash

工作流程

Logstash 工作的三个阶段：

input 数据输入端，可以接收来自任何地方的源数据。

file：从文件中读取
syslog：监听在514端口的系统日志信息，并解析成RFC3164格式。
redis：从redis-server list 中获取
beat：接收来自Filebeat的事件

Filter 数据中转层，主要进行格式处理，数据类型转换、数据过滤、字段添加，修改等，常用的过滤器如下。

grok: 通过正则解析和结构化任何文本。Grok 目前是logstash最好的方式对非结构化日志数据解析成结构化和可查询化。logstash内置了120个匹配模式，满足大部分需求。
mutate: 在事件字段执行一般的转换。可以重命名、删除、替换和修改事件字段。
drop: 完全丢弃事件，如debug事件。
clone: 复制事件，可能添加或者删除字段。
geoip: 添加有关IP地址地理位置信息。

output 是logstash工作的最后一个阶段，负责将数据输出到指定位置，兼容大多数应用，常用的有:

elasticsearch: 发送事件数据到 Elasticsearch，便于查询，分析，绘图。
file: 将事件数据写入到磁盘文件上。
mongodb:将事件数据发送至高性能NoSQL mongodb，便于永久存储，查询，分析，大数据分片。
redis:将数据发送至redis-server，常用于中间层暂时缓存。
graphite: 发送事件数据到graphite。http://graphite.wikidot.com/
statsd: 发送事件数据到 statsd。

二、安装logstash

# 配置yum源，新建yum文件

vim /etc/yum.repos.d/es.repo

# 加入以下内容

[kibana-4.5]

name=Kibana repository for 4.5.x packages

baseurl=http://packages.elastic.co/kibana/4.5/centos

gpgcheck=1

gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch

enabled=1

[beats]

name=Elastic Beats Repository

baseurl=https://packages.elastic.co/beats/yum/el/$basearch

enabled=1

gpgkey=https://packages.elastic.co/GPG-KEY-elasticsearch

gpgcheck=1

# 执行安装指令

yum install logstash -y

三、使用命令行运行一个简单的logstash程序

logstash/bin/logstash -e 'input{stdin{}}output{stdout{codec=>rubydebug}}'

# 输入 abc 输出如下

{

"message" => "abc",

"@version" => "1",

"@timestamp" => "2016-08-20T03:33:00.769Z",

"host" => "iZ23tzjZ"

}

四、配置语法讲解

logstash使用{ }来定义配置区域，区域内又可以包含其插件的区域配置。

# 最基本的配置文件定义，必须包含input 和 output。

input{

stdin{ }

}

output{

stdout{

codec=>rubydebug

}

# 如果需要对数据进操作，则需要加上filter段

input{

stdin{ }

}

filter{

# 里面可以包含各种数据处理的插件，如文本格式处理 grok、键值定义 kv、字段添加、

# geoip 获取地理位置信息等等...

}

output{

stdout{

codec=>rubydebug

}

# 可以定义多个输入源与多个输出位置

input{

stdin{ }

file{

path => ["/var/log/message"]

type => "system"

start_position => "beginning"

}

output{

stdout{

codec=>rubydebug

}

file {

path => "/var/datalog/mysystem.log.gz"

gzip => true

}

启动方式

# 通过手动指定配置文件启动

/bin/logstash -f /etc/logstash/conf.d/nginx_logstash.conf

# 以daemon方式运行，则在指令后面加一个 & 符号

/bin/logstash -f /etc/logstash/conf.d/nginx_logstash.conf &

# 如果是通过rpm包安装的logstash则可以使用自带的脚本启动

/etc/init.d/logstash start

# 通过这种方式启动，logstash会自动加载 /etc/logstash/conf.d/ 下的配置文件

五、filebeat基本讲解

filebeat是基于原先 logstash-forwarder 的源码开发而来，无需JAVA环境，运行起来更轻便，无疑是业务服务器端的日志收集工具。

配置

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

# 配置文件路径 "/etc/filebeat/filebeat.yml"

# 一个配置文件可以包含多个prospectors，一个prospectors可以包含多个path。

filebeat:

# List of prospectors to fetch data.

prospectors:

# Each - is a prospector. Below are the prospector specific configurations

-

paths:

- /var/log/messages

input_type: log

document_type: messages

-

paths:

- /alidata/log/nginx/access/access.log.json

input_type: log

document_type: nginxacclog

-

paths:

- /alidata/www/storage/logs/laravel.log

input_type: log

document_type: larlog

-

paths:

- /alidata/www/500_error/500_error.log

input_type: log

document_type: error500

-

paths:

- /alidata/www/deposit/deposit.log

input_type: log

document_type: deposit

-

paths:

- /alidata/www/call_error.log

input_type: log

document_type: call_error

-

paths:

- /alidata/www/weixin_deposit.log

input_type: log

document_type: weixin_deposit

-

paths:

- /alidata/log/php/php-fpm.log.slow

input_type: log

document_type: phpslowlog

# 多行处理

multiline:

pattern: '^[[:space:]]'

negate: true

match: after

# Additional prospector

registry_file: /var/lib/filebeat/registry

############################# Libbeat Config ##################################

# Base config file used by all other beats for using libbeat features

############################# Output ##########################################

# 输出数据到 redis

output:

redis:

host: "10.122.52.129"

port: 6379

password: "123456"

# 输出数据到 logstash ，一般两者选用其一

logstash:

hosts: ["10.160.8.221:5044"]

############################# Shipper #########################################

shipper:

# 打上服务器tag

name: "host_2"

############################# Logging #########################################

logging:

files:

rotateeverybytes: 10485760 # = 10MB

filebeat主要配置就是这个配置文件了，设定好之后启动服务就会自动从源拉取数据发送到指定位置，当数据为普通行数据时，filebeat会自动为其添加字段信息，其中一项字段 @timestamp 为filebeat读取到这条数据的时间，默认格式为UTC时间，比中国大陆时间早8小时。

如果数据为json格式，而数据中已包含@timestamp字段，filebeat处理时会把@timestamp字段值替换为filebeat读取到该行数据的当前UTC时间。

六、实战运用

架构一

nginx 日志格式配置

log_format json '{"@timestamp":"$time_iso8601",'

'"slbip":"$remote_addr",'

'"clientip":"$http_x_forwarded_for",'

'"serverip":"$server_addr",'

'"size":$body_bytes_sent,'

'"responsetime":$request_time,'

'"domain":"$host",'

'"method":"$request_method",'

'"requesturi":"$request_uri",'

'"url":"$uri",'

'"appversion":"$HTTP_APP_VERSION",'

'"referer":"$http_referer",'

'"agent":"$http_user_agent",'

'"status":"$status"}';

filebeat 配置

filebeat:

# List of prospectors to fetch data.

prospectors:

# Each - is a prospector. Below are the prospector specific configurations

-

paths:

- /alidata/log/nginx/access/access.log.json

input_type: log

document_type: nginxacclog

############################# Output ##########################################

output:

logstash:

hosts: ["10.160.8.221:5044"]

# 其他部分配置省略。

logstash 配置（此处logstash用于接收filebeat的数据，然后转存redis）

input {

beats {

port => 5044

codec => "json"

}

filter {

if [type] == "nginxacclog" {

geoip {

source => "clientip"

target => "geoip"

database => "/u01/elk/logstash/GeoLiteCity.dat"

add_field => [ "[geoip][coordinates]","%{[geoip][longitude]}" ]

add_field => [ "[geoip][coordinates]","%{[geoip][latitude]}" ]

}

mutate {

convert => [ "[geoip][coordinates]","float" ]

}

output{

if [type] == "nginxacclog" {

redis {

data_type => "list"

key => "nginxacclog"

host => "127.0.0.1"

port => "26379"

password => "123456"

db => "0"

}

if [type] == "messages" {

redis {

data_type => "list"

key => "messages"

host => "127.0.0.1"

port => "26379"

password => "123456"

db => "0"

}

logstash 配置（此处logstash用于读取redis list中的数据，然后转存elasticsearch）

input{

redis {

host => "10.10.1.2"

port => "26379"

db => "0"

key => "nginxacclog"

threads => 300

password => "123456"

data_type => "list"

codec => "json"

}

redis {

host => "10.10.1.2"

port => "26379"

db => "0"

key => "messages"

password => "123456"

threads => 50

data_type => "list"

codec => "json"

}

output {

if [type] == "nginxacclog" {

elasticsearch {

hosts => ["127.0.0.1:9200"]

index => "logstash-nginxacclog-%{+YYYY.MM.dd}"

manage_template => true

flush_size => 50000

idle_flush_time => 10

workers => 2

}

if [type] == "messages" {

elasticsearch {

hosts => ["127.0.0.1:9200"]

index => "logstash-messages-%{+YYYY.MM.dd}"

manage_template => true

flush_size => 50000

idle_flush_time => 30

workers => 1

}

关键指令解释:

threads 开启多少个线程读取redis数据，也就是从redis输入到logstash的速度，线程越多读取速度越快，但是根据接收节点的接收速度来设置，如果输入过快，接收速度不够，则会出现丢数据的情况，设置一个最佳的threads值需要和接收节点做反复测试才能得出。

flush_size 控制logstash向Elasticsearch批量发送数据，上面的配置表示，logstash会努力赞到50000条数据一次发送给Elasticsearch。

idle_flush_time 控制logstash多长时间向Elasticsearch发送一次数据，默认为1秒，根据以上配置，logstash积攒数据未到flush_size 10秒后也会向Elasticsearch发送一次数据。

workers 建议设置为1或2，如果机器性能不错可以设置为2. 不建议设置的更高。

架构二

filebeat 配置（从日志文件读取到的数据直接缓存至redis队列）

filebeat:

# List of prospectors to fetch data.

prospectors:

# Each - is a prospector. Below are the prospector specific configurations

-

paths:

- /alidata/log/nginx/access/access.log.json

input_type: log

document_type: nginxacclog

############################# Output ##########################################

output:

redis:

host: "10.160.8.221"

port: 26379

password: "123456"

document_type 自定义日志类型，在logstash中可通过type判断做不同的处理。

logstash 配置（此处logstash用于读取redis list中的数据，然后转存mongodb）

input {

redis {

host => "10.160.8.221"

port => "26379"

key => "filebeat"

data_type => "list"

password => "123456"

threads => 50

}

redis {

host => "10.160.8.221"

port => "26379"

key => "mycat"

data_type => "list"

password => "123456"

threads => 50

type => "mycat"

}

output {

if [type] == "mycat" {

mongodb{

collection => "mycat%{+yyyyMMdd}"

isodate => true

database => "logdb"

uri => "mongodb://log_user:123456@10.10.1.102:27017/logdb"

}

if [type_xi09wnk] == "nginxacclog" {

mongodb{

collection => "nginx_accress%{years_dik3k}%{months_dik3k}%{days_dik3k}"

isodate => true

database => "logdb"

uri => "mongodb://log_user:123456@10.10.1.102:27017/logdb"

}

https://blog.csdn.net/qq897958555/article/details/53504221

logback通过kafka接入ELK详解

ELK日志相关的更多相关文章

搭建ELK日志分析平台
(上)—— ELK介绍及搭建 Elasticsearch 分布式集群 http://blog.51cto.com/zero01/2079879 (下)—— 搭建kibana和logstash服务器 h ...
ELK 日志分析体系
ELK 日志分析体系 ELK 是指 Elasticsearch.Logstash.Kibana三个开源软件的组合. logstash 负责日志的收集,处 ...
ELK日志分析系统的应用
收集和分析日志是应用开发中至关重要的一环,互联网大规模.分布式的特性决定了日志的源头越来越分散, 产生的速度越来越快,传统的手段和工具显得日益力不从心.在规模化场景下,grep.awk 无法快速发挥作 ...
ELK日志收集平台部署
需求背景由于公司的后台服务有三台,每当后台服务运行异常,需要看日志排查错误的时候,都必须开启3个ssh窗口进行查看,研发们觉得很不方便,于是便有了统一日志收集与查看的需求. 这里,我用ELK集群,通 ...
开源组件ELK日志系统配置与管理
ELK日志系统介绍开源实时日志分析ELK平台能够完美的解决我们上述的问题,ELK由ElasticSearch.Logstash和Kiabana三个开源工具组成.官方网站:https://www.el ...
Java中多环境Logback配置与ELK日志发送
Java中多环境Logback配置与ELK日志发送一.项目基于SpringBoot实现,引入SpringBoot相关库后,本文还要讲上传到ELK的Logstash,所以需要在pom.xml中加入 ...
CentOs 7.3下ELK日志分析系统搭建
系统环境为了安装时不出错,建议选择这两者选择一样的版本,本文全部选择5.3版本. System: Centos release 7.3 Java: openjdk version "1.8 ...
创业公司做数据分析（四）ELK日志系统（转）
http://blog.csdn.net/zwgdft/article/details/53842574 作为系列文章的第四篇,本文将重点探讨数据采集层中的ELK日志系统.日志,指的是后台服务中产生的 ...
浅谈ELK日志分析平台
作者:珂珂链接:https://zhuanlan.zhihu.com/p/22104361来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 小编的话 “技术干货”系列文章 ...

随机推荐

重设域管理员密码-window server 2008 R2
How to Reset Your Forgotten Domain Admin Password on Server 2008 R2 Forgetting your password is alwa ...
Azure Paas SQL 修改用户名密码的相关问题
现总结如下,供您参考: 1) 如何单独修改每个数据库的密码? 在portal中,我们提供了一个最高权限的,可管理服务器下所有数据库的服务器用户跟密码,但在实际使用中,由于权限过大,会有潜在的安全隐 ...
006-GO VSCode 自动提示功能提示PANIC
通过vscode开发go,之前一直正常,后来不知什么原因自动提示一直提示:PANIC, 解决方法: (1)重新下载gocode go get -u github.com/nsf/gocode (2)重 ...
JAVA i++于++i的区别
大家看一下下面一个程序: 一.问题说明 Test.java public class Test { public static void main(String[] args) { int i = 1 ...
C# ListView用法
ListView是个较为复杂的控件 1.定义把它拽进来,系统会自动在Designer.cs里添加一个 this.listView1 = new System.Windows.For ...
SpringMVC学习笔记五：使用converter进行参数数据转换
转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6832898.html 一:SpringMVC数据绑定机制 1:request到达SpringMVC框架时,框 ...
〖Linux〗Kubuntu KDE开机后总是提示“system program problem detected”的解决方法
自从从Ubuntu切换到了Kubuntu之后,就经常在开机的时候提示“system program problem detected”: 查看 /var/crash/ 发现都是一些无关痛痒的程序在关机 ...
ROS中发布激光扫描消息
激光雷达工作时会先在当前位置发出激光并接收反射光束,解析得到距离信息,而后激光发射器会转过一个角度分辨率对应的角度再次重复这个过程.限于物理及机械方面的限制,激光雷达通常会有一部分“盲区”.使用激光雷 ...
9、redis之事务2-Jedis的八种调用方式(事务、管道、分布式)介绍
1.普通同步 @Test public void test1Normal() { Jedis jedis = new Jedis("localhost"); long start ...
Citrix Port（常用端口）
组件类型端口描述 CitrixLicenseServer 许可管理器守护程序 TCP 27000 处理初始接触点的许可证要求(Lmadmin.exe) 思杰供应商守护程序 TCP 7 ...

ELK日志相关

转: Logstash 讲解与实战应用

ELK日志相关的更多相关文章

随机推荐

热门专题