Flume 1.5日志收集和存款mongodb安装结构

Flume该演示是不是说。你可以自己搜索。

但现在的互联网主要是Flume 1.4前版本号的信息。Flume 1.5在轰动的大变化。假设你准备尝试，我在这里给大家介绍一下程序最小化结构，和使用MongoSink的数据被存储mongodb。完全独立的执行，没有master。没有collector（说白了collector也就是一个agent，仅仅是数据来源于多个其它agent），仅仅有一个agent。把这套东西理解了你就能够自由发挥了

Flume是必需要求java执行环境的哈，jdk安装就不解释了。推荐yum安装。

另外安装JDK好以后不用设置什么环境变量，flume事实上能够自己找到的，仅仅是会发出一个警告而已。无视之

首先去下载Flume 1.5安装包

http://flume.apache.org/download.html

仅仅须要下载apache-flume-1.5.0.1-bin.tar.gz就能够了，32位64位系统通吃

这里我们把安装包放到/home文件夹下，然后解压缩

tar zxvf apache-flume-1.5.0-bin.tar.gz

把解压得到的apache-flume-1.5.0-bin目录改名成flume，所以我们flume的路径是/home/flume

网上非常多说要设置flume home环境变量，事实上不用的

这里我们新增一个配置文件到/home/flume/conf/netcat.conf（当中的agent2/source2/sink2/channel2都是自定义的名称。随便改）

# 定义组件名称

agent2.sources = source2

agent2.sinks = sink2

agent2.channels = channel2

# 定义数据入口

agent2.sources.source2.type = netcat

agent2.sources.source2.bind = 192.168.6.198

agent2.sources.source2.port = 44444

agent2.sources.source2.channels = channel2

# 定义数据出口

agent2.sinks.sink2.type = org.riderzen.flume.sink.MongoSink

agent2.sinks.sink2.host = 192.168.6.222

agent2.sinks.sink2.port = 27017

agent2.sinks.sink2.model = single

agent2.sinks.sink2.collection = events

agent2.sinks.sink2.batch = 100

agent2.sinks.sink2.channel = channel2

# 使用内存管道

agent2.channels.channel2.type = memory

agent2.channels.channel2.capacity = 1000

agent2.channels.channel2.transactionCapacity = 100

以上配置文件相信大家一看就非常明了了。我简介一下：

数据源是source2。而source2的定义是接收本机192.168.6.198:44444port发过来的数据，然后存放到channel2缓冲管道里面去

channel2是什么呢？看最以下对channel2的定义，它是一个内存缓冲队列。容量是1000条数据，满100条就会被sink处理掉

那么sink的定义呢？这里我们用到了Leon Lee（李龙？可能是国内哪位大神。感谢你哈）编写的一个MongoSink，作用是把从channel2取出的数据存入MongoDB，而且累计100条数据才提交

MongoSink请到这里下载：https://github.com/leonlee/flume-ng-mongodb-sink

MongoSink我简单说一下，仅仅须要把他打成jar包丢到/home/flume/lib里面即可了，当然别忘了把mongodb驱动也丢进去。以后你要是开发其它扩展包都是丢到lib里面就好

好。那么我们就清楚了，flume的作用就是从source获取数据，存入channel缓冲队列。最后由sink放入永久存储

执行下面命令启动flume

/home/flume/bin/flume-ng agent --conf /home/flume/conf --conf-file /home/flume/conf/netcat.conf --name agent2 -Dflume.monitoring.type=http -Dflume.monitoring.port=34545

大致解释一下：

--name agent2 指定当前执行的这个agent的名称

--conf /home/flume/conf 这个參数最好指定绝对路径，说明你的配置文件存放文件夹，不单单指agent的配置。当中还有log4j的配置。不然无法记录日志

--conf-file /home/flume/conf/netcat.conf 这个是指当前要执行的agent所使用的配置文件

-Dflume.monitoring.type=http 指定开启HTTP监控，能够通过浏览器直接訪问本机HTTP地址查看flume执行状态

-Dflume.monitoring.port=34545 指定HTTP监控的端口

假设你须要在控制台显示一些调试信息的话请自行配置/home/flume/conf/log4j.properties

OK，等着成功吧

现眼下我们主要是攻克了日志数据不必直接写mongo库，仅仅要把IP和port告知其它项目团队，他们直接往这里发送数据即可了

后期考虑到mongodb可能有些局限性，我们能够很灵活的改写sink，把数据存款hdfs，然后，和高大的hadoop与拉亲密接触

Flume 1.5日志收集和存款mongodb安装结构的更多相关文章

【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
基于Flume的美团日志收集系统(二)改进和优化
在<基于Flume的美团日志收集系统(一)架构和设计>中,我们详述了基于Flume的美团日志收集系统的架构设计,以及为什么做这样的设计.在本节中,我们将会讲述在实际部署和使用过程中遇到的问 ...
基于Flume的美团日志收集系统(一)架构和设计
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流.美团的日志收集系统基于Flume设计和搭建而成. <基于Flume的美团日志收 ...
基于Flume的美团日志收集系统(一)架构和设计【转】
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流.美团的日志收集系统基于Flume设计和搭建而成. <基于Flume的美团日志收 ...
转:基于Flume的美团日志收集系统(一)架构和设计
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流.美团的日志收集系统基于Flume设计和搭建而成. <基于Flume的美团日志收 ...
基于Flume的美团日志收集系统架构和设计改进和优化
3种解决办法 https://tech.meituan.com/mt-log-system-arch.html 基于Flume的美团日志收集系统(一)架构和设计 - https://tech.meit ...
Flume -- 开源分布式日志收集系统
Flume是Cloudera提供的一个高可用的.高可靠的开源分布式海量日志收集系统,日志数据可以经过Flume流向需要存储终端目的地.这里的日志是一个统称,泛指文件.操作记录等许多数据. 一.Flum ...
Flume + HDFS + Hive日志收集系统
最近一段时间,负责公司的产品日志埋点与收集工作,搭建了基于Flume+HDFS+Hive日志搜集系统. 一.日志搜集系统架构: 简单画了一下日志搜集系统的架构图,可以看出,flume承担了agent与 ...
flume集群日志收集
一.Flume简介 Flume是一个分布式的.高可用的海量日志收集.聚合和传输日志收集系统,支持在日志系统中定制各类数据发送方(如:Kafka,HDFS等),便于收集数据.其核心为agent,agen ...

随机推荐

zabbix 添加主机接口
http://192.168.32.101:3000/api/zabbix/add_Host?env=test&host=zjtest9-app&ip=192.168.32.250&a ...
基于visual Studio2013解决C语言竞赛题之0517矩阵
题目
Jetty：配置概览-须要配置什么
上一节讲述了怎么配置Jetty,这节将告诉你使用Jetty你须要配置些什么. 配置Server Server实例是Jetty服务端的中心协调对象,它为全部其它Jetty服务端组件提供服务和生命周期管理 ...
Vmware Briged方式使虚拟机上网
1.禁用掉在网络连接VMware Network Adapter VMnet1和VMware Network Adapter VMnet8 (在bridged这种方式下不需要这两个连接,如下图) 2. ...
BZOJ 1578: [Usaco2009 Feb]Stock Market 股票市场( 背包dp )
我们假设每天买完第二天就卖掉( 不卖出也可以看作是卖出后再买入 ), 这样就是变成了一个完全背包问题了, 股票价格为体积, 第二天的股票价格 - 今天股票价格为价值.... 然后就一天一天dp... ...
理解js的prototype原型对象
我们创建的每一个函数都有一个prototype(原型)属性.这个属性是一个指针,指向一个对象,而这个对象的用途是包括能够由特定类型的全部实例共享的属性和方法.假设依照字面意思来理解,那么prototy ...
cocos2d-x2.0 win7第一次创建项目需要调用到的脚本（不断更新维护）//cocos2d-x 教程一
第一步: 最新的cocos2d-x.下载地址https://github.com/cocos2d/cocos2d-x github上最新的引擎,值得注意的是官网上发布的引擎是稳定版.选择哪种就看个人喜 ...
Random Teams
n participants of the competition were split into m teams in some manner so that each team has at le ...
boost 循环缓冲区
boost 循环缓冲区 #include <boost/circular_buffer.hpp> int _tmain(int argc, _TCHAR* argv[]) { boost: ...
Android 讲述Help提示框
Android 讲述Help提示框 XML/HTML代码 <stringname="help_dialog_text"> <i>Author:fonter. ...

Flume 1.5日志收集和存款mongodb安装结构

Flume 1.5日志收集和存款mongodb安装结构的更多相关文章

随机推荐

热门专题