项目需要将日志收集起来做存储分析，数据的流向为rsyslog（收集） -> kafka（消息队列） -> logstash(清理) -> es、hdfs；今天我们先将如何利用rsyslog进行日志收集到kafka。

一、环境准备

通过对 rsyslog官方文档查看,得知 rsyslog对 kafka的支持是 v8.7.0版本后才提供的支持.通过 ChangeLog 也可以看出 V8.X的版本变化.

最新V8稳定版已经提供RPM包的Rsyslog-kafka插件了,直接yum安装即可,添加yum源：

[rsyslog_v8]

name=Adiscon CentOS-$releasever - local packages for $basearch

baseurl=http://rpms.adiscon.com/v8-stable/epel-$releasever/$basearch

enabled=1

gpgcheck=0

gpgkey=http://rpms.adiscon.com/RPM-GPG-KEY-Adiscon

protect=1

添加后 yum install rsyslog rsyslog-kafka.x86_64即可完成安装。

二、配置

1. 处理原则

input submit received messages to rulesets, zero or many
ruleset contains rule, rule consist of a filter and an action list
actions consist of the action call itself (e.g. ”:omusrmsg:”) as well as all action-defining configuration statements ($Action... directives)

2. Statement Types 表达式类型

通常利用RainerScript type statements进行非常简洁明了的配置声明，例如：

mail.info /var/log/mail.log

3. 流程控制

Control structures
过滤条件
1. Selector: 传统方式，格式如下:
  
  <facility>[,facility...][,*].[=,!]<priority>[,priority...][,*];<facility>[,facility...][,*].[=|!]<priority>[,priority...][,*]...
  
  其中默认facility为auth, authpriv, cron, daemon, kern, lpr, mail, mark, news, security (same as auth), syslog, user, uucp and local0 through local7；
  
  默认priority为debug, info, notice, warning, warn (same as warning), err, error (same as err), crit, alert, emerg, panic (same as emerg)；
  
  2） Property-based filters： new filter type. 形式如下：
  
  :property, [!]compare-operation, "value"
  
  分别对应名字，比较符，需要对比的字段。比较符包括 contains, isequal, startswith, regex, ereregex
  
  3） Expression based filters:
  
  if expr then action-part-of-selector-line
2. BSD-style blocks:
3. 例子： if $syslogfacility-text == 'local0' and $msg startswith 'DEVNAME' and not ($msg contains 'error1' or $msg contains 'error0') then /var/log/somelog

4. 数据处理:支持set, unset, reset操作

备注： Only message json (CEE/Lumberjack) properties can be modified by the set, unset andreset statements

5. input

有很多种input模块, 我们以imfile模块为例, 此模块将所有的文本文件内容逐行转到syslog中.

input(type="imfile" tag="kafka" file="analyze.log" ruleset="imfile-kafka"[, Facility=local.7])

6. outputs

也叫作actions，处理动作，格式如下

 action (

        type="omkafka"

        topic="kafka_test"

        broker="10.120.169.149:9092"

    )

7. Rulesets and Rules

Rulesets包括多条rule，一条规则就是rsyslog处理消息的一种方式, 每个规则包含filter和actions

input(type="imfile" tag="kafka" file="analyze.log" ruleset="rulesetname")

ruleset(name="rulesetname") {

    action(type="omfile" file="/path/to/file")

    action(type="..." ...)

    /* and so on... */

}

通过input里面的ruleset配置，将输入流进入ruleset进行规则匹配，然后执行action操作，完成对流的处理。

8. Queue parameters

将不同的输入流进入不同的队列并行处理数据，通常在ruleset或者action中配置，默认只有一个队列。配置参数例子

action(type="omfwd" target="192.168.2.11" port="10514" protocol="tcp"

       queue.filename="forwarding" queue.size="1000000" queue.type="LinkedList"

      )

9. templates

这是rsyslog一个重要的特性，它可以让用户自定义输入流格式，同样也可以用于动态生成日志文件，默认是原始格式。

一般表达式如下：

template(parameters) { list-descriptions }

list : 列表模板，包含name, type="list"，多个constant和property对。

template(name="tpl1" type="list") {

    constant(value="Syslog MSG is: '")

    property(name="msg")

    constant(value="', ")

    property(name="timereported" dateFormat="rfc3339" caseConversion="lower")

    constant(value="\n")

    }

string: 字符串自定义格式模块，由name, type="string", string="<onstant text and replacement variables>"，例如

%TIMESTAMP:::date-rfc3339% %HOSTNAME%%syslogtag%%msg:::sp-if-no-1st-sp%%msg:::drop-last-lf%\n"

将每个日志字段通过自定义变量和处理方式（property replacer）得到全局能读取的日志变量。

注意：

原始格式： v6之前的格式，$template strtpl,"PRI: %pri%, MSG: %msg%\n"。
利用action里的template参数将templates和action进行绑定，如

action(template=TEMPLATENAME,type="omfile" file="/var/log/all-msgs.log")

三. 实例

增加一个将nginx access日志通过rsyslog传输到kafka的实例，将nginx_kafka.conf放入到/etc/rsyslog.d目录中，重启rsyslog即可。

# 加载omkafka和imfile模块

module(load="omkafka")

module(load="imfile")

# nginx template

template(name="nginxAccessTemplate" type="string" string="%hostname%<-+>%syslogtag%<-+>%msg%\n")

# ruleset

ruleset(name="nginx-kafka") {

    #日志转发kafka

    action (

        type="omkafka"

        template="nginxAccessTemplate"

        confParam=["compression.codec=snappy", "queue.buffering.max.messages=400000"]

        partitions.number="4"

        topic="test_nginx"

        broker="10.120.169.149:9092"

        queue.spoolDirectory="/tmp"

        queue.filename="test_nginx_kafka"

        queue.size="360000"

        queue.maxdiskspace="2G"

        queue.highwatermark="216000"

        queue.discardmark="350000"

        queue.type="LinkedList"

        queue.dequeuebatchsize="4096"

        queue.timeoutenqueue="0"

        queue.maxfilesize="10M"

        queue.saveonshutdown="on"

        queue.workerThreads="4"

    )

}

# 定义消息来源及设置相关的action

input(type="imfile" Tag="nginx,aws" File="/var/log/access.log" Ruleset="nginx-kafka")

检查conf文件是否正确可以运行rsyslogd debug模式rsyslogd -dn运行，看日志输出结果，或者直接运行rsyslogd -N 1检查conf文件是否正确。

作者：modeyangg_cs
链接：https://www.jianshu.com/p/1b7fdb1cff3c
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

日志收集之rsyslog to kafka的更多相关文章

9.3 k8s结合ELK实现日志收集
数据流: logfile -> filebeat > kafka(依赖zookeeper)-> logstash -> elasticsearch -> kibana 1 ...
ELK+kafka构建日志收集系统
ELK+kafka构建日志收集系统原文 http://lx.wxqrcode.com/index.php/post/101.html 背景: 最近线上上了ELK,但是只用了一台Redis在 ...
ELK+Kafka 企业日志收集平台(一)
背景: 最近线上上了ELK,但是只用了一台Redis在中间作为消息队列,以减轻前端es集群的压力,Redis的集群解决方案暂时没有接触过,并且Redis作为消息队列并不是它的强项:所以最近将Redis ...
【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
rsyslog+LogAnalyzer 日志收集
Linux 之rsyslog+LogAnalyzer 日志收集系统一.LogAnalyzer介绍 LogAnalyzer工具提供了一个易于使用,功能强大的前端,用于搜索,查看和分析网络活动数据,包括 ...
日志收集之kafka
日志收集之kafka http://www.jianshu.com/p/f78b773ddde5 一.介绍 Kafka是一种分布式的,基于发布/订阅的消息系统.主要设计目标如下: 以时间复杂度为O(1 ...
日志收集ELK+kafka相关博客
SpringBoot+kafka+ELK分布式日志收集使用 logstash + kafka + elasticsearch 实现日志监控 Kibana 安装与汉化 windows系统安装运行f ...
Go语言学习之11 日志收集系统kafka库实战
本节主要内容: 1. 日志收集系统设计2. 日志客户端开发 1. 项目背景 a. 每个系统都有日志,当系统出现问题时,需要通过日志解决问题 b. 当系统机器比较少时,登陆到服务器上查看即可 ...
SpringBoot+kafka+ELK分布式日志收集
一.背景随着业务复杂度的提升以及微服务的兴起,传统单一项目会被按照业务规则进行垂直拆分,另外为了防止单点故障我们也会将重要的服务模块进行集群部署,通过负载均衡进行服务的调用.那么随着节点的增多,各个 ...

随机推荐

HTML[2种特殊选择器]_伪类选择器&属性选择器
本文介绍两种特殊的选择器 1.伪类选择器 2.属性选择器 1.伪类选择器 ...: nth-of -type (x) x为同类型兄弟元素中的排名例如: <body> <ul> ...
Spring IOC Container原理解析
Spring Framework 之 IOC IOC.DI基础概念关于IOC和DI大家都不陌生,我们直接上martin fowler的原文,里面已经有DI的例子和spring的使用示例 <In ...
Tomcat 源码环境搭建
Tomcat 源码搭建下载源码下载地址 :https://tomcat.apache.org/download-80.cgi#8.5.35 下载之后解压缩导入Idea 添加pom.xml文件 & ...
JavaScript 数组常用方法(二)
写在前面:续接上篇 JavaScript 数组常用方法数组常用方法第二弹来了: some && every 描述: every()与some()方法都是JS中数组的迭代方法. so ...
linux中文件查找、whereis、which、输出命令
1.文件查找(find):find是最常⻅和最强⼤的查找命令格式:find / -name 文件名,比如:find / -name mysql. (1).模糊查找:*是代表所有的,?是代表⼀个字 ...
javascriptRemke之类的继承
前言:es6之前在js中要实现继承,就必须要我们程序员在原型链上手动继承多对象的操作,但是结果往往存在漏洞,为解决这些问题,社区中出现了盗用构造函数.组合继承.原型式继承.寄生式继承等一系列继承方式, ...
【UE4】GAMES101 图形学作业1：mvp 模型、视图、投影变换
总览到目前为止,我们已经学习了如何使用矩阵变换来排列二维或三维空间中的对象.所以现在是时候通过实现一些简单的变换矩阵来获得一些实际经验了.在接下来的三次作业中,我们将要求你去模拟一个基于CPU 的光 ...
Java：Object对象小记
Java:Object对象小记对 Java 中的 Object 对象,做一个微不足道的小小小小记 Object 的常用方法有哪些 clone() 方法:用于创建并返回当前对象的一份拷贝: 在Java ...
[no code][scrum meeting] Alpha 6
项目内容会议时间 2020-04-13 会议主题后端技术细节分析会议时长 30min 参会人员 PM+后端组成员 $( "#cnblogs_post_body" ).cat ...
【二食堂】Beta - Scrum Meeting 6
Scrum Meeting 6 例会时间:5.19 18:30~18:50 进度情况组员当前进度今日任务李健 1. 实体标注的优化基本已经实现,后端有bug,还没有进行接口调用 issue 2 ...

日志收集之rsyslog to kafka