FLume监控文件夹，将数据发送给Kafka以及HDFS的配置文件详解

详细配置文件flume-conf.properties如下：

############################################

#  producer config

###########################################

#agent section

producer.sources = s

producer.channels = c c1

producer.sinks = r r1

#source section

#producer.sources.s.type = exec

#producer.sources.s.command = tail -f -n+1 /usr/local/test.log

producer.sources.s.type = spooldir

producer.sources.s.spoolDir = /usr/local/testlog

producer.sources.s.fileHeader = true

producer.sources.s.batchSize = 100

producer.sources.s.channels = c c1

# Each sink's type must be defined

producer.sinks.r.type = org.apache.flume.plugins.KafkaSink

producer.sinks.r.metadata.broker.list=127.0.0.1:9092

producer.sinks.r.partition.key=0

producer.sinks.r.partitioner.class=org.apache.flume.plugins.SinglePartition

producer.sinks.r.serializer.class=kafka.serializer.StringEncoder

producer.sinks.r.request.required.acks=0

producer.sinks.r.max.message.size=1000000

producer.sinks.r.producer.type=sync

producer.sinks.r.custom.encoding=UTF-8

producer.sinks.r.custom.topic.name=topcar

#store in HDFS

producer.sinks.r1.type = hdfs

producer.sinks.r1.channel = c1

producer.sinks.r1.hdfs.path=hdfs://node2:9000/user/flume/events/%Y-%m-%d-%H

producer.sinks.r1.hdfs.filePrefix=events-

#producer.sinks.r1.hdfs.fileSuffix = .log #设定后缀

producer.sinks.r1.hdfs.round = true

producer.sinks.r1.hdfs.roundValue = 10

producer.sinks.r1.hdfs.roundUnit = minute

#--文件格式:默认SequenceFile，可选 DataStream \ CompressedStream

producer.sinks.r1.hdfs.fileType=DataStream

#--Format for sequence file records. “Text” or “Writable”

producer.sinks.r1.hdfs.writeFormat=Text

producer.sinks.r1.hdfs.rollInterval=0

#--触发roll操作的文件大小in bytes (0: never roll based on file size)

producer.sinks.r1.hdfs.rollSize=128000000

#--在roll操作之前写入文件的事件数量(0 = never roll based on number of events)

producer.sinks.r1.hdfs.rollCount=0

producer.sinks.r1.hdfs.idleTimeout=60

#--使用local time来替换转移字符 (而不是使用event header的timestamp)

producer.sinks.r1.hdfs.useLocalTimeStamp = true

producer.channels.c1.type = memory

producer.channels.c1.capacity = 1000

producer.channels.c1.transactionCapacity=1000

producer.channels.c1.keep-alive=30

#Specify the channel the sink should use

producer.sinks.r.channel = c

# Each channel's type is defined.

producer.channels.c.type = memory

producer.channels.c.capacity = 1000

############################################

#   consumer config

###########################################

consumer.sources = s

consumer.channels = c

consumer.sinks = r

consumer.sources.s.type = seq

consumer.sources.s.channels = c

consumer.sinks.r.type = logger

consumer.sinks.r.channel = c

consumer.channels.c.type = memory

consumer.channels.c.capacity = 100

consumer.sources.s.type = org.apache.flume.plugins.KafkaSource

consumer.sources.s.zookeeper.connect=127.0.0.1:2181

consumer.sources.s.group.id=testGroup

consumer.sources.s.zookeeper.session.timeout.ms=400

consumer.sources.s.zookeeper.sync.time.ms=200

consumer.sources.s.auto.commit.interval.ms=1000

consumer.sources.s.custom.topic.name=topcar

consumer.sources.s.custom.thread.per.consumer=4

Flume启动命令如下：

bin/flume-ng agent --conf conf --conf-file conf/flume-conf.properties --name producer -Dflume.root.logger=INFO,console

FLume监控文件夹，将数据发送给Kafka以及HDFS的配置文件详解的更多相关文章

Python 的 pyinotify 模块监控文件夹和文件的变动
官方参考: https://github.com/seb-m/pyinotify/wiki/Events-types https://github.com/seb-m/pyinotify/wiki/I ...
Storm监控文件夹变化统计文件单词数量
监控指定文件夹,读取文件(新文件动态读取)里的内容,统计单词的数量. FileSpout.java,监控文件夹,读取新文件内容 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ...
【.Net 学习系列】-- FileSystemWatcher 监控文件夹新生成文件，并在确认文件没有被其他程序占用后将其移动到指定文件夹
监控文件夹测试程序: using System; using System.Collections.Generic; using System.IO; using System.Linq; using ...
[转帖]Linux下inotify监控文件夹状态，发生变化后触发rsync同步
Linux下inotify监控文件夹状态,发生变化后触发rsync同步 https://www.cnblogs.com/fjping0606/p/6114123.html 1.安装工具--inotif ...
1.8-1.10 大数据仓库的数据收集架构及监控日志目录日志数据，实时抽取之hdfs系统上
一.数据仓库架构二.flume收集数据存储到hdfs 文档:http://flume.apache.org/releases/content/1.9.0/FlumeUserGuide.html#hd ...
网卡配置文件详解用户管理与文件权限篇文件与目录权限软连接 tar解压命令 killall命令 linux防火墙 dns解析设置计划任务crond服务软件包安装阿里云 yum源安装
Linux系统基础优化及常用命令 Linux基础系统优化引言没有,只有一张图. Linux的网络功能相当强悍,一时之间我们无法了解所有的网络命令,在配置服务器基础环境时,先了解下网络参数设定命令. ...
Nagios监控平台搭建及配置文件详解
Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员, ...
Spring配置文件详解 – applicationContext.xml文件路径
Spring配置文件详解 – applicationContext.xml文件路径 Java编程 spring的配置文件applicationContext.xml的默 ...
如何用R来处理数据表的长宽转换（图文详解）
不多说,直接上干货! 很多地方都需用到这个知识点,比如Tableau里. 通常可以采取如python 和 r来作为数据处理的前期. Tableau学习系列之Tableau如何通过数据透视表方式读取 ...

随机推荐

Loadrunner参数化如何在记事本中将参数值显示超过100个参数值
Loadrunner参数化如何在记事本中将参数值显示超过100个参数值 1.loadrunner的参数值没有最大的限度, 可以修改C:\Program Files\HP\LoadRunner\conf ...
LOADRUNNER连接ORACLE数据库的方法
LOADRUNNER连接ORACLE数据库的方法最近正在做一个测试数据库性能的项目,直接写出来的连接数据库并且进行数据库查询和插入的脚本在VUSER_INIT中(连接数据库)#include ...
Python数据分析之pandas
Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利 ...
模拟界面请求到web服务器
客户端 package com.lsw.client; import java.io.*; import java.net.*; import java.util.*; public class HT ...
牛客练习赛3 F - 监视任务
链接:https://www.nowcoder.net/acm/contest/13/F来源:牛客网题目描述
链路跟踪技术traceId的总结和实践
目录写作背景什么是链路跟踪目前常见的链路跟踪技术及其优缺点链路跟踪技术的实现原理代码示例背景由于最近系统上线后,访问量达,出现线上问题后往往无从下手排查,即使打印了很多日志,依然无法快速 ...
JAVA内存泄漏解决办法
JVM调优工具 Jconsole,jProfile,VisualVM Jconsole : jdk自带,功能简单,但是可以在系统有一定负荷的情况下使用.对垃圾回收算法有很详细的跟踪.详细说明参考这里 ...
js date 相关
BZOJ 1061: [Noi2008]志愿者招募 [单纯形法]【学习笔记看另一篇吧】
1061: [Noi2008]志愿者招募 Time Limit: 20 Sec Memory Limit: 162 MBSubmit: 3975 Solved: 2421[Submit][Stat ...
洛谷 P4884 多少个1？
题面在这里好久没做题了2333,竟然还一次A了,神奇大概就是等比数列然后把分母乘过去,然后直接BSGS就行了,就是要写快速乘恩... #include<bits/stdc++.h> # ...

FLume监控文件夹，将数据发送给Kafka以及HDFS的配置文件详解

详细配置文件flume-conf.properties如下：

Flume启动命令如下：

FLume监控文件夹，将数据发送给Kafka以及HDFS的配置文件详解的更多相关文章

随机推荐

热门专题