Flume配置文件写法总结

一、agent

　　第一步是定义agent(代理)及agent下的sources、channels、sinks的简称，如下：

　　a1.sources = r1
　　a1.sinks = k1
　　a1.channels = c1

二、sources

　　第二步是定义sources(接收数据源)，以下是常见的sources类型：

　　1.type = netcat　　=>监视一个端口，需要端口名称、端口号：

　　　　bind = localhost

　　　　port = 44444

　　2.type = exec　　=>监视一个文件，需要命令行、命令行使用的脚本

　　　　command = tail -F /opt/jars/calllog.csv

　　　　shell = /usr/bin/bash -c

　　3.type = spooldir　　=>监视一个文件夹，需要文件夹路径

　　　　可以添加进入文件夹文件的后缀名、可以添加绝对路径的文件名、通过正则表达式过滤以tmp结尾的文件

　　　　spoolDir = /root/spooldir

　　　　fileSuffix = .COMPLETED

　　　　fileHeader = true

　　　　ignorePattern = ([^]*\.tmp)

　　4.selector.type = replicating　　=>将数据量复制给多个channel

　　5.type = avro　　=>通过端口接收数据，需要端口名称、端口号

　　　　bind = hd1-1

　　　　port = 4141

三、channels

　　第三步是设置channel(管道)的类型等

　　1.tpye = memory　　=>使用内存为管道，设置内存总容量、每次传输的容量

　　　　capacity =1000

　　　　transactionCapacity =100

　　2.使用磁盘作为管道

四、sink

　　第四步是设置sink(下沉)的类型和细节设置

　　1.type = logger　　=>输出日志文件，用于监控端口直接在端口输出接受的数据

　　2.type = hdfs　　=>输出到hdfs，

　　　　hdfs.path = hdfs://hd1-1:9000/flume/%Y%m%d/%H　　=>设置hdfs的路径

　　　　hdfs.filePrefix = logs-　　=>设置文件的前缀

　　　　hdfs.round = true　　=>按照时间滚动文件夹

　　　　hdfs.roundValue = 1　　=>多长时间创建一个新文件夹

　　　　hdfs.roundUnit = minute　　=>定义时间的单位

　　　　hdfs.useLocalTimeStamp = true　　=>使用本地时间戳

　　　　hdfs.batchSize = 500　　=>积攒到少event后flush到hdfs一次

　　　　hdfs.fileType = DataStream　　=>设置文件类型，可支持压缩

　　　　hdfs.rollInterval = 30　　=>多久生成一个新文件

　　　　hdfs.rollSize = 134217700　　=>设置每个文件的滚动大小

　　　　hdfs.rollCount = 0　　=>滚动与Event无关

　　　　hdfs.minBlockReplicas = 1　　=>最小冗余数(及备份数，hdfs自带无需配置)

　　3.type = avro　　=>将数据发送到端口，需要设置端口名称、端口号

　　　　hostname = hd1-1

　　　　port = 4141

　　4.type = file_roll　　=>将数据传输到本地文件，需要设置文件路径

　　　　sink.directory = /root/flume2　　注意flume2文件夹需要自己创建

　　5.type = org.apache.flume.sink.kafka.KafkaSink　　=>将数据传输到kafka

　　　　需要设置集群的机器名称和端口号、主题、batchSize、Ack机制

　　　　brokerList = hd1-1:9092,hd1-2:9092,hd1-3:9092

　　　　topic = calllog

　　　　batchSize = 20

　　　　requiredAcks =1 　　ACK机制（1、0、-1，1是最安全的）

五、bind

　　a1.sources.r1.channels = c1

　　a1.sinks.k1.channel = c1

Flume配置文件写法总结的更多相关文章

flume配置文件
读文件log传入kafka中 agent.sources = s1 agent.channels = c1 agent.sinks = k1 agent.sources.s1.type=exec ag ...
2018.12.15 struts.xml 一般配置文件写法 && 配置动态方法
struts.xml 原始配置文件配置 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE s ...
python中配置文件写法
import os BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__))) print(BASE_DIR) USE ...
log4j配置文件写法
### direct log messages to stdout ###log4j.rootLogger=DEBUG,stdoutlog4j.appender.stdout=org.apache.l ...
pxelinux.0：winboot：网络引导（启动）wim格式的windows PE系统：配置文件写法
关键:加载wimboot引导模块,并传入参数 todo:通过标准kenerl的append传入启动参数..........todo.todo default menu.c32 label wimboo ...
ipxe(可选)：winboot：网络引导（启动）wim格式的windows PE系统：配置文件写法
ipxe 无盘[网络]引导wim格式的pe系统 wimboot引导程序需要为其提供4个内核参数 bcd bootmgr boot.sdi boot.wim 所需文件附件以下是我的可用的ipxe的配置 ...
Flume-Hbase-Sink针对不同版本flume与HBase的适配研究与经验总结
https://cloud.tencent.com/developer/article/1025430 Flume-Hbase-Sink针对不同版本flume与HBase的适配研究与经验总结 mike ...
Flume 详解&实战
Flume 1. 概述 Flume是一个高可用,高可靠,分布式的海量日志采集.聚合和传输的系统.Flume基于流式架构,灵活简单. Flume的作用 Flume最主要的作用就是,实时读取服务器本地磁盘 ...
Flume（3）source组件之NetcatSource使用介绍
一.概述: 本节首先提供一个基于netcat的source+channel(memory)+sink(logger)的数据传输过程.然后剖析一下NetcatSource中的代码执行逻辑. 二.flum ...

随机推荐

Codeforces 438E The Child and Binary Tree [DP，生成函数，NTT]
洛谷 Codeforces 思路看到计数和\(998244353\),可以感觉到这是一个DP+生成函数+NTT的题. 设\(s_i\)表示\(i\)是否在集合中,\(A\)为\(s\)的生成函数,即 ...
基础常用的数据结构 Collection Map
map是键值对的集合接口,它的实现类主要包括:HashMap,TreeMap,Hashtable以及LinkedHashMap等.其中这四者的区别如下(简单介绍): HashMap:我们最常用的Map ...
ES6之Set与Map加深理解
Set 类似于数组,但是成员的值都是唯一的,没有重复的值,有序. Set函数可以接受一个数组(或者具有 iterable 接口的其他数据结构)作为参数,用来初始化. 用途数组去重: [...new ...
PHP实现网络Socket及IO多路复用
一直以来,PHP很少用于socket编程,毕竟是一门脚本语言,效率会成为很大的瓶颈,但是不能说PHP就无法用于socket编程,也不能说PHP的socket编程性能就有多么的低,例如知名的一款PHP ...
css样式之补充。。。
css常用的一些属性: 1.去掉下划线 :text-decoration:none ;2.加上下划线: text-decoration: underline; 3.调整文本和图片的位置(也就是设置元素 ...
Python实战一
要求:用户输入用户名和密码错误三次,就对该用户进行锁定,不让其进行登录. def match(name,pwd): '''匹配用户输入的信息,进行判断''' falg = True while fal ...
selenium 操作键盘
send_keys(Keys.ENTER) 按下回车键send_keys(Keys.TAB) 按下Tab制表键send_keys(Keys.SPACE) 按下空格键spacesend_keys(Kye ...
AI-认证
AI-认证做登录验证 #models.py class Users(models.Model): user=models.CharField(max_length=32) pwd=models.Ch ...
vs2017初学c++环境配置及使用教程
https://blog.csdn.net/jmpan_sjtu/article/details/79053169 https://blog.csdn.net/luoyu510183/article/ ...
配置frp
一.下载下载地址:https://github.com/fatedier/frp/releases 下载linux_amd64的,如果是32位系统就下载linux_386 二.安装有公网IP的服务 ...

Flume配置文件写法总结

Flume配置文件写法总结的更多相关文章

随机推荐

热门专题