Flume exec 测试

环境：ubuntu 1604

软件：①apache-flume-1.7.0-bin.tar.gz，解压后放到 /usr/local/ 下面。②sudo apt-get install apache2，然后sudo service apache2 start 启动服务。--第二步是为了安装httpd服务器，CentOS上直接yum install httpd即可。

配置：

larry@linux:~/opt/flume-conf$ cat demo.properties

# 示例: 一个单节点的Flume 配置

# 命名该agent（a1）的components。

a1.sources = r1

a1.sinks = k1

a1.channels = c1

# 描述/配置 source

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /var/log/apache2/access.log

# 描述 sink

a1.sinks.k1.type = logger

# 使用一个内存型 channel -- 能够缓存 events

a1.channels.c1.type = memory

a1.channels.c1.capacity =

a1.channels.c1.transactionCapacity = 

# 将 source和 sink 绑定到 channel。

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

这个配置，就是将tail命令产生的数据流发送到logger ，所以启动flume-ng的时候需要指定logger（因为默认的logger肯定不是输出到控制台的，而且级别也太高）。

启动：flume-ng agent --conf /usr/local/apache-flume-1.7.0-bin/conf --conf-file demo.properties --name a1 -Dflume.root.logger=INFO,console

--conf 是用于指定conf文件的路径，该路径通常包含了一些环境设置，即通用配置。

--conf-file 则是指定当前agent任务需要加载的配置文件。

--name 是指定加载--conf-file配置文件中的某个agent，这是因为一个配置文件可以有多组agent。

-Dflume.root.logger，其实是指定Java的选项，该选项会传递给Java程序。在这里，就是设置该应用的整体日志的级别和输出。

另外，需要注意flume-ng 后面的agent，不要忘记输入~

实验：浏览器访问 127.0.0.1，然后刷新、刷新、刷新。。

结果：

Flume exec 测试的更多相关文章

一次flume exec source采集日志到kafka因为单条日志数据非常大同步失败的踩坑带来的思考
本次遇到的问题描述,日志采集同步时,当单条日志(日志文件中一行日志)超过2M大小,数据无法采集同步到kafka,分析后,共踩到如下几个坑.1.flume采集时,通过shell+EXEC(tail -F ...
大数据笔记（十九）——数据采集引擎Sqoop和Flume安装测试详解
一.Sqoop数据采集引擎采集关系型数据库中的数据用在离线计算的应用中强调:批量 (1)数据交换引擎: RDBMS <---> Sqoop <---> HDFS.HBas ...
Flume 测试 Kafka 案例
Flume Kafka 测试案例,Flume 的配置. a1.sources = s1 a1.channels = c1 a1.sinks = k1 a1.sources.s1.type = netc ...
Apache Flume 简介
转自:http://blog.163.com/guaiguai_family/blog/static/20078414520138100562883/ Flume 是 Cloudera 公司开源出来的 ...
Flume环境搭建_五种案例
Flume环境搭建_五种案例 http://flume.apache.org/FlumeUserGuide.html A simple example Here, we give an example ...
Flume篇---Flume安装配置与相关使用
一.前述 Copy过来一段介绍Apache Flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制.flume具有高可用, ...
nginx+ flume
nginx 作用: 做负载均衡 nginx和lvs的区别:nginx可以做反向代理 1.上传nginx安装包 tar -zxvf tengine-2.1.02.安装环境依赖 gcc opens ...
Hadoop生态圈-Flume的组件之自定义Sink
Hadoop生态圈-Flume的组件之自定义Sink 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客主要介绍sink相关的API使用两个小案例,想要了解更多关于API的小技 ...
Flume环境搭建_五种案例(转)
Flume环境搭建_五种案例 http://flume.apache.org/FlumeUserGuide.html A simple example Here, we give an example ...

随机推荐

Socket网络编程--FTP客户端(2)(Windows)
上一篇FTP客户端讲到如果制作一个简单的FTP客户端,功能实现了,但是后面我们发现了问题,就是FTP是使用明文进行操作的.对于普通情况来说就无所谓了.但有时候要安全的一点的话,就应该使用FTP的安全版 ...
Word实用教程——五分钟教你如何在任意页开始添加页码
最近在写一篇论文,但是在排版上遇到一点小问题,就是要加入页码,而且页码是从目录的下一页开始计数,于是我就在网上找如何在任意页添加页码.后来辗转终于搞定,真心觉得这一个小功能让微软做的如此的麻烦,真是活 ...
nodejs中的框架介绍
Sequelize 关系型数据库对象模型映射框架 mongoose 非关系型数据库文档模型映射框架
Linux设备驱动开发详解
Linux设备驱动开发详解 http://download.csdn.net/detail/wuyouzi067/9581380
Linux/CentOS关闭图形界面(X-window)和启用图形界面命令
1.在图像界面关闭x window:1.1 shell中运行 init 3 进入文本模式,同时会关闭相关的服务(Xserver 肯定关闭)1.2 Alt+Ctrl+F1~F6到字符界面,root登陆 ...
如何使用ILSpy 把发布版本反编译成源码
有时候,看法别人写的代码比较好,想看看他们的代码到底是如何写的,于是就找方法,看看能否把发布版本变成源码.后来终于发现一个词“反编译”,我终于知道怎么办了. 工具:ILSpy 百度下载一个,该工具 ...
Spark(Hive) SQL中UDF的使用（Python）【转】
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内 ...
使用Python实现Map Reduce程序
使用Python实现Map Reduce程序起因想处理一些较大的文件,单机运行效率太低,多线程也达不到要求,最终采用了集群的处理方式. 详细的讨论可以在v2ex上看一下. 步骤 MapReduce ...
GreenDAO - primary key on multiple columns
转:http://stackoverflow.com/questions/15250609/greendao-primary-key-on-multiple-columns Does GreenDAO ...
Python（七）之OS模块
文件系统功能:os模块 python编程时,经常和文件.目录打交道,这是就离不了os模块.os模块包含普遍的操作系统功能,与具体的平台无关.以下列举常用的命令: 目录: os.mkdir('/tmp/ ...

Flume exec 测试

Flume exec 测试的更多相关文章

随机推荐

热门专题