[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

[admin@test01 apache-flume-1.9.0-bin]$ pwd

/opt/apache-flume-1.9.0-bin

2.将所需jar包复制到flume的lib目录下

flume-ng-sql-source-json-1.0.jar

mysql-connector-java-5.1.38.jar

二.压缩与解压

压缩

 tar zcvf flume.tar.tgz apache-flume-1.9.0-bin/

三.Kafka 创建Topic 消费Topic

#创建topic

/bin/kafka-topics --create --zookeeper 10.160.26.85:2181 --replication-factor 2 --partitions 15 --topic flume_mysql_test

#消费topic

/bin/kafka-console-consumer --bootstrap-server 10.160.26.81:9092 --topic flume_mysql_test

四.启动flume服务

[admin@test01 apache-flume-1.9.0-bin]$ bin/flume-ng agent --conf conf --conf-file conf/ecarx_dealer.conf --name mfkagent -Dflume.root.logger=INFO,console

五.flume配置文件

mfkagent.sources=mysqlSource

mfkagent.channels=memoryChannel

mfkagent.sinks=activeTopCitySink

#define source

# For each one of the sources, the type is defined

mfkagent.sources.mysqlSource.type = org.keedio.flume.source.SQLSource

mfkagent.sources.mysqlSource.hibernate.connection.url = jdbc:mysql:/id:3306/db_name

# Hibernate Database connection properties

mfkagent.sources.mysqlSource.hibernate.connection.user = db_test

mfkagent.sources.mysqlSource.hibernate.connection.password = password

mfkagent.sources.mysqlSource.hibernate.connection.autocommit = true

mfkagent.sources.mysqlSource.hibernate.dialect = org.hibernate.dialect.MySQL5Dialect

mfkagent.sources.mysqlSource.hibernate.connection.driver_class = com.mysql.jdbc.Driver

#mfkagent.sources.mysqlSource.table = navigation_active_city_top

# Columns to import to kafka (default * import entire row)

#mfkagent.sources.mysqlSource.columns.to.select = *

# Query delay, each configured milisecond the query will be sent

mfkagent.sources.mysqlSource.run.query.delay=100000

# Status file is used to save last readed row

mfkagent.sources.mysqlSource.status.file.path = /var/log/flume-ng

mfkagent.sources.mysqlSource.status.file.name = mysqlSource.status

# Custom query

mfkagent.sources.mysqlSource.start.from = 0

ORDER BY ranking ASC

#mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

# 加上$@$的原因是为了去除重复同步

mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

#mfkagent.sources.mysqlSource.order.by = id

mfkagent.sources.mysqlSource.batch.size = 1000

mfkagent.sources.mysqlSource.max.rows = 10000

mfkagent.sources.mysqlSource.delimiter.entry = |

mfkagent.sources.mysqlSource.hibernate.connection.provider_class = org.hibernate.connection.C3P0ConnectionProvider

mfkagent.sources.mysqlSource.hibernate.c3p0.min_size=1

mfkagent.sources.mysqlSource.hibernate.c3p0.max_size=10

#define channel

mfkagent.channels.memoryChannel.type=memory

mfkagent.channels.memoryChannel.capacity=100000

mfkagent.channels.memoryChannel.transactionCapacity=100000

mfkagent.channels.memoryChannel.keep-alive=3

#defeine sinks

mfkagent.sinks.activeTopCitySink.type = org.apache.flume.sink.kafka.KafkaSink

mfkagent.sinks.activeTopCitySink.kafka.topic = flume_mysql_test

mfkagent.sinks.activeTopCitySink.kafka.bootstrap.servers = test02.local:9092,test03.local:9092,test04.local:9092

mfkagent.sinks.activeTopCitySink.kafka.producer.acks = 1

mfkagent.sinks.activeTopCitySink.kafka.producer.linger.ms = 1

mfkagent.sinks.activeTopCitySink.kafka.flumeBatchSize = 100

# The channel can be defined as follows.

mfkagent.sources.mysqlSource.channels = memoryChannel

mfkagent.sinks.activeTopCitySink.channel = memoryChannel

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

Kettle 实现mysql数据库不同表之间数据同步——实验过程
下面是试验的主要步骤: 在上一篇文章中LZ已经介绍了,实验的环境和实验目的. 在本篇文章中主要介绍侧重于对Kettle ETL的相应使用方法, 在这里LZ需要说明一下,LZ成为了避免涉及索引和表连接等 ...
转载：MySQL和Redis 数据同步解决方案整理
from: http://blog.csdn.net/langzi7758521/article/details/52611910 最近在做一个Redis箱格信息数据同步到数据库Mysql的功能. 自 ...
Mysql主从复制，实现数据同步
大型网站为了软解大量的并发访问,除了在网站实现分布式负载均衡,远远不够.到了数据业务层.数据访问层,如果还是传统的数据结构,或者只是单单靠一台服务器扛,如此多的数据库连接操作,数据库必然会崩溃,数据丢 ...
利用Flume将MySQL表数据准实时抽取到HDFS
转自:http://blog.csdn.net/wzy0623/article/details/73650053 一.为什么要用到Flume 在以前搭建HAWQ数据仓库实验环境时,我使用Sqoop抽取 ...
Goldengate完成Mysql到Mysql的数据同步
文档参考地址:http://blog.csdn.net/u010587433/article/details/49305019 需求: 使用Goldengate完成Mysql到Mysql的数据同步,源 ...
几篇关于MySQL数据同步到Elasticsearch的文章---第三篇：logstash_output_kafka:Mysql同步Kafka深入详解
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484411&idx=1&sn=1f5a371 ...
怎么通过 Mysql 实现数据同步呢？
怎么使 mysql 数据同步先假设有主机 A 和 B ( linux 系统),主机 A 的 IP 分别是 1.2.3.4 (当然,也可以是动态的),主机 B 的 IP 是 5.6.7.8 .两个主机都 ...
通过Gearman实现MySQL到Redis的数据同步
对于变化频率非常快的数据来说,如果还选择传统的静态缓存方式(Memocached.File System等)展示数据,可能在缓存的存取上会有很大的开销,并不能很好的满足需要,而Redis这样基于内存的 ...
【转】mysql 触发器实现两个表的数据同步
mysql通过触发器实现两个表的同步目前,在本地测试成功. 假设本地的两个数据库a和b,a下有表table1(id, val) b下有表table2(id, val) 假设希望当table1中数据更 ...

随机推荐

Mysql高手系列 - 第19篇：mysql游标详解，此技能可用于救火
Mysql系列的目标是:通过这个系列从入门到全面掌握一个高级开发所需要的全部技能. 这是Mysql系列第19篇. 环境:mysql5.7.25,cmd命令中进行演示. 代码中被[]包含的表示可选,|符 ...
Scala 学习笔记之函数(2)
class OldStudent extends Student { def filterName(s: String, f: String => String) = { if (s != nu ...
MongoDB 学习笔记之入门安装和配置
下载MongoDB: 下载解压即可使用. 为了启动方便和统一管理, 在Mongo根目录下建立/data, /logs, /conf文件夹. 在conf文件夹下建立mongodb.conf 文件,基本配 ...
学Python的第一天
第一天学习笔记一.安装typroa 下载软件typroa用于日常学习笔记记录,该软件支持markdown语法步骤: 官网地址:https://typora.io/ 选择版本安装(以windows为 ...
Spring Cloud之Hystrix
在微服务架构中,存在那么多的服务单元,若一个单元出现故障(由于网络原因或者自身原因),就很容易因依赖关系而引发故障的蔓延,最终导致整个系统的瘫痪,这样的架构相较传统架构更加不稳定.为了解决这样的问题, ...
python urllib2实现http GET PUT DELETE POST的方法
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/11 下午8:33 # @Author : liubing # @File ...
Mybatis入门简版（一）
一.Mybatis介绍 MyBatis是一个优秀的持久层框架,它对jdbc的操作数据库的过程进行封装,使开发者只需要关注 SQL 本身,而不需要花费精力去处理例如注册驱动.创建connection.创 ...
Flask-wtforms类似django中的form组件
一.安装 pip3 install wtforms 二.简单使用 1.创建flask对象 from flask import Flask, render_template, request, redi ...
Python之装饰器(二)
以前你有没有这样一段经历:很久之前你写过一个函数,现在你突然有了个想法就是你想看看,以前那个函数在你数据集上的运行时间是多少,这时候你可以修改之前代码为它加上计时的功能,但是这样的话是不是还要大体读读 ...
Beetlex服务框架之Webapi访问限制和url重写
在新版本的BeetleX.FastHttpApi中集成了IP访问策略和URL重写两个功能,通过IP访问策略可以制定服务针对不同IP的访问限制控制:而URL重写则可以制定更好的URL访问方式.以下介绍这 ...

[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

2.将所需jar包复制到flume的lib目录下

二.压缩与解压

三.Kafka 创建Topic 消费Topic

四.启动flume服务

五.flume配置文件

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

随机推荐

热门专题