flume kafka 配置指南

1、官方网站也有配置：

https://flume.apache.org/FlumeUserGuide.html#kafka-source

2、clodera 官方配置

https://www.cloudera.com/documentation/kafka/2-0-x/topics/kafka_flume.html

 tier1.sources  = source1

 tier1.channels = channel1

 tier1.sinks = sink1

 tier1.sources.source1.type = org.apache.flume.source.kafka.KafkaSource

 tier1.sources.source1.zookeeperConnect = zk01.example.com:

 tier1.sources.source1.topic = weblogs

 tier1.sources.source1.groupId = flume

 tier1.sources.source1.channels = channel1

 tier1.sources.source1.interceptors = i1

 tier1.sources.source1.interceptors.i1.type = timestamp

 tier1.sources.source1.kafka.consumer.timeout.ms = 

 tier1.channels.channel1.type = memory

 tier1.channels.channel1.capacity =

 tier1.channels.channel1.transactionCapacity = 

 tier1.sinks.sink1.type = hdfs

 tier1.sinks.sink1.hdfs.path = /tmp/kafka/%{topic}/%y-%m-%d

 tier1.sinks.sink1.hdfs.rollInterval =

 tier1.sinks.sink1.hdfs.rollSize =

 tier1.sinks.sink1.hdfs.rollCount =

 tier1.sinks.sink1.hdfs.fileType = DataStream

 tier1.sinks.sink1.channel = channel1

tier1.sources  = source1

 tier1.channels = channel1

 tier1.sinks = sink1

 tier1.sources.source1.type = exec

 tier1.sources.source1.command = /usr/bin/vmstat

 tier1.sources.source1.channels = channel1

 tier1.channels.channel1.type = memory

 tier1.channels.channel1.capacity =

 tier1.channels.channel1.transactionCapacity = 

 tier1.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink

 tier1.sinks.sink1.topic = sink1

 tier1.sinks.sink1.brokerList = kafka01.example.com:,kafka02.example.com:

 tier1.sinks.sink1.channel = channel1

 tier1.sinks.sink1.batchSize =

tier1.sources = source1

tier1.channels = channel1

tier1.sinks = sink1

tier1.sources.source1.type = exec

tier1.sources.source1.command = /usr/bin/vmstat

tier1.sources.source1.channels = channel1

tier1.channels.channel1.type = org.apache.flume.channel.kafka.KafkaChannel

tier1.channels.channel1.capacity =

tier1.channels.channel1.transactionCapacity =

tier1.channels.channel1.brokerList = kafka02.example.com:,kafka03.example.com:

tier1.channels.channel1.topic = channel2

tier1.channels.channel1.zookeeperConnect = zk01.example.com:

tier1.channels.channel1.parseAsFlumeEvent = true

tier1.sinks.sink1.type = hdfs

tier1.sinks.sink1.hdfs.path = /tmp/kafka/channel

tier1.sinks.sink1.hdfs.rollInterval =

tier1.sinks.sink1.hdfs.rollSize =

tier1.sinks.sink1.hdfs.rollCount =

tier1.sinks.sink1.hdfs.fileType = DataStream

tier1.sinks.sink1.channel = channel1

总结：

这样配置以后我们可以通过监控，或者消费kafka console打印效果

/bin/kafka-console-consumer.sh --bootstrap-server master:9092 --topic topicTest2 --from-beginning

flume kafka 配置指南的更多相关文章

Scala + Thrift+ Zookeeper+Flume+Kafka配置笔记
1. 开发环境 1.1. 软件包下载 1.1.1. JDK下载地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downl ...
Flume - Kafka日志平台整合
1. Flume介绍 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供 ...
Kafka权威指南——broker的常用配置
前面章节中的例子,用来作为单个节点的服务器示例是足够的,但是如果想要把它应用到生产环境,就远远不够了.在Kafka中有很多参数可以控制它的运行和工作.大部分的选项都可以忽略直接使用默认值就好,遇到一些 ...
【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
hadoop 之 kafka 安装与 flume -> kafka 整合
62-kafka 安装 : flume 整合 kafka 一.kafka 安装 1.下载 http://kafka.apache.org/downloads.html 2. 解压 tar -zxvf ...
Flume+Kafka+Strom基于伪分布式环境的结合使用
目录: 一.Flume.Kafka.Storm是什么,如何安装? 二.Flume.Kafka.Storm如何结合使用? 1) 原理是什么? 2) Flume和Kafka的整合 3) Kafka和St ...
【Flume NG用户指南】（1）设置
作者:周邦涛(Timen) Email:zhoubangtao@gmail.com 转载请注明出处: http://blog.csdn.net/zhoubangtao/article/details ...
【Flume NG用户指南】（2）构造
作者:周邦涛(Timen) Email:zhoubangtao@gmail.com 转载请注明出处: http://blog.csdn.net/zhoubangtao/article/details ...
最新 Zookeeper + Flume + Kafka 简易整合教程
在大数据领域有很多耳熟能详的框架,今天要介绍的就是 zookeeper.flume.kafka.因为平时是做数据接入的,所以对这些实时的数据处理系统不是很熟悉.通过官网的简要介绍,搭建了一套简要的平台 ...

随机推荐

20165205 预习作业三 Linux安装及学习
Linux安装及学习安装Ubuntu 1)安装版本在安装VirtualBox时选择了VirtualBox 5.2.6 platform package 安装Ubuntu时选择了Ubuntu 16. ...
excel 获取提取数字
=MID(A2,MIN(FIND({0,1,2,3,4,5,6,7,8,9},A2&"0123456789")),2*LEN(A2)-LENB(A2)) 第一,如果需要提取 ...
20.多线程.join()和setDaemon()的使用
1.join()方法 join ()方法:主线程A中,创建了子线程B,并且在主线程A中调用了B.join(),那么,主线程A会在调用的地方等待,直到子线程B完成操作后,才可以接着往下执行,那么在调用这 ...
CentOS修改locale解决调用API乱码问题
查看所有的locale语言 locale 查看当前操作系统使用的语言 echo $LANG 永久设置系统locale语言 vi /etc/profile LANG="zh_CN.UTF-8& ...
idea 安装三方插件的方法
<一>在线安装 1,File -> Setting -> Plugins, 大红框内是已经安装的插件,可以搜索 2, 点击上图小红框内的按钮, 如下,搜索自己想要的插件,选中, ...
白鹭引擎 - 事件机制 ( Event, addEventListener, dispatchEvent )
1, 自定义事件, MyEvent class MyEvent extends egret.Event { /** * 一般会定义一个 DATA 字段作为事件 * 绑定事件监听器时, 一般用类.DA ...
CKEditor 5
1.官网 https://ckeditor.com/ckeditor-5/download/ 2.
elasticsearch-ik
因lucene默认采用英文且英文通过空格就可以断句.而中文则是词组,如果不加载中文词库或插件则会变为一个一个字而非词组,因此需要加载中文词库. 不加分词库所看到的中文分词效果. post _analy ...
SpringBoot配置swagger2(亲测有效，如果没有配置成功，欢迎在下方留言)
一.导包: <dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swa ...
python catch socket timeout
python catch socket timeout import socket try: # do something. except socket.timeout as e: # socket ...

flume kafka 配置指南

flume kafka 配置指南的更多相关文章

随机推荐

热门专题