【大数据】kafka-02：Kafka Connect内容、原理及使用

〇、概述

1、常见资料

（1）confluent

https://docs.confluent.io/5.4.0/connect/kafka-connect-jdbc/sink-connector/sink_config_options.html

一、可用的sink/source配置

（一）source connector

1、根据自增id的source

（1）订单表
{
"name": "source_connect_Oracle_Test_T_Order_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "AUUID_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_0905",
"topic": "connect_topic_Test_T_Order_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_0905",
"task": 0
}
],
"type": "source"
}

（2）用户表

1、Oracle的source
{
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "ID",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_USER",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"topic": "ORACLE_TEST_TOPIC",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "ORACLE_TEST_ID_TIMESTAMP_INC",
"task": 0
}
],
"type": "source"
}
2、根据time自增的source
{
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"timestamp.column.name": "UPDDATTIM_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "timestamp incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"topic": "topic_Test_T_Order_timestamp_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"task": 0
}
],
"type": "source"
}

3、基于confluent的JDBC source

{

"name": "JDBC_ORACLE_SOURCE1",

"config": {

"connector.class": "io.confluent.connect.jdbc.JdbcSourceConnector",

"mode": "incrementing",

"incrementing.column.name": "ID",

"topic.prefix": "JDBC_ORACLE_SOURCE_",

"connection.password": "system",

"connection.user": "system",

"name": "JDBC_ORACLE_SOURCE1",

"connection.url": "jdbc:oracle:thin:@//192.168.0.100:1521/helowin",

"table.whitelist": "TEST.T_USER"

"tasks": [

{

"connector": "JDBC_ORACLE_SOURCE1",

"task": 0

}

"type": "source"

}

（二）sink

{

"name": "POSTGRESQL_SINK_TEST",

"config": {

"connector.class": "io.confluent.connect.jdbc.JdbcSinkConnector",

"table.name.format": "wxf_test.T_USER",

"connection.password": "qaz123",

"tasks.max": "1",

"topics": "JDBC_ORACLE_SOURCE_T_USER",

"delete.enabled": "false",

"auto.evolve": "true",

"connection.user": "postgres",

"name": "POSTGRESQL_SINK_TEST",

"auto.create": "true",

"connection.url": "jdbc:postgresql://170.0.0.1:5432/bigdata",

"insert.mode": "upsert",

"pk.mode": "record_value"

"tasks": [

{

"connector": "POSTGRESQL_SINK_TEST",

"task": 0

}

"type": "sink"

}

【大数据】kafka-02：Kafka Connect内容、原理及使用的更多相关文章

大数据技术之Kafka
Kafka概述 1.1 消息队列 (1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除) 点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息 ...
大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
入门大数据---Flume整合Kafka
一.背景先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合 ...
【原创】大数据基础之Kafka（1）简介、安装及使用
kafka2.0 http://kafka.apache.org 一简介 Kafka® is used for building real-time data pipelines and strea ...
大数据基础之Kafka（1）简介、安装及使用
kafka2.0 http://kafka.apache.org 一简介 Kafka® is used for building real-time data pipelines and strea ...
大数据 --> 分布式文件系统HDFS的工作原理
分布式文件系统HDFS的工作原理 Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.它能提供高吞吐量的数 ...
大数据开发实战：MapReduce内部原理实践
下面结合具体的例子详述MapReduce的工作原理和过程. 以统计一个大文件中各个单词的出现次数为例来讲述,假设本文用到输入文件有以下两个: 文件1: big data offline data on ...
大数据 -- zookeeper和kafka集群环境搭建
一运行环境从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
《OD大数据实战》Kafka入门实例
官网: 参考文档: Kafka入门经典教程 Kafka工作原理详解一.安装zookeeper 1. 下载zookeeper-3.4.5-cdh5.3.6.tar.gz 下载地址为: http://a ...
大数据安装之Kafka（用于实时处理的消息队列）
一.安装部署kafka 1.集群规划 hadoop102 hadoop103 hado ...

随机推荐

MySQL的EXPLAIN会修改数据测试
文章转载自:https://www.cnblogs.com/kerrycode/p/14138626.html 在博客"Explain命令可能会修改MySQL数据"了解到MySQL ...
Beats：如何安装Packetbeat
18个一线工作中常用的Shell脚本
1.检测两台服务器指定目录下的文件一致性 #!/bin/bash ###################################### 检测两台服务器指定目录下的文件一致性 ######### ...
Elastic: 创建一个 Elastic 邮件警报 - 7.7 发行版
文章转载自:https://blog.csdn.net/UbuntuTouch/article/details/106185321 总结: 1.elastic 免费版只有发送警报到一个索引或者到Ser ...
在Kuboard上安装 Ingress Controller
快速安装 # 只在 master 节点执行 kubectl apply -f https://kuboard.cn/install-script/v1.18.x/nginx-ingress.yaml ...
《Thinking In Java》作者：不要使用并发！
前言今天纯粹就是带你们来读读书的~ 最近除了工作,特地买回了自己很喜欢的作者新发售的一本书<On Java>,作者是我的老朋友布鲁斯·埃克尔,在Java领域很有名,你可能没听过他的名字, ...
HDU2844 Coins（多重背包）
多重背包就是每种物品有数量限制时求解最大价值. 如果一种物品数量和重量之积超过背包容量,可视为完全背包:其余情况通过二进制拆分,将几个数量的物品看成一个,转化为01背包求解. 按照这种思路代码是这样的 ...
MPI实现并行奇偶排序
奇偶排序 odd-even-sort, using MPI 代码在 https://github.com/thkkk/odd-even-sort 使用 MPI 实现奇偶排序算法, 并且 MPI 进程 ...
为了讲明白继承和super、this关键字，群主发了20块钱群红包
摘要:以群主发红包为例,带你深入了解继承和super.this关键字. 本文分享自华为云社区<群主发红包带你深入了解继承和super.this关键字>,作者:共饮一杯无 . 需求群主发随 ...
CSS clear both清除浮动
.clear{clear:both;} <div class="clear"></div>

【大数据】kafka-02：Kafka Connect内容、原理及使用

【大数据】kafka-02：Kafka Connect内容、原理及使用的更多相关文章

随机推荐

热门专题