kafka connector

Kafka Connect

是一种用于在 Kafka 和其他系统之间可扩展的、可靠的的流式传输数据的工具。它使得能偶快速定义将大量数据集合移入和移除 kafka 连接器变得简单。

kafka connect 可以从数据库或者应用程序服务器收到数据到 kafka topic ,使数据可以用于低延迟的流处理。导出作业可以将数据从 kakfa topic 传输到二次存储和查询系统，或者传递

到批处理系统以进行离线分析

Kafka connect 概念

Source: 负责导入数据到kafka
Sink 负责从kafka 导出数据
Connectors 通过管理任务来协调数据流的高级抽象
Tasks 数据写入 kafka 和从 Kafka 中读取具体实现
workers 运行 connectors 和tasks 的进程
Converters ： kafka connet 和其他存储系统直接发送或者接受数据之前转换数据
Transforms : 一种轻量级数据调整工具

工作模式

kafka connect 有 2 中工作模式

standalone: 在 standalone 模式中，所有的worker 都在一个独立的进程中完成
distributed : distributed 模式具有高扩展性，以及提供自动容错机制。你可以使用一个 group.id 在启动很多worker 进行，在有效的 worker 进程中他们会自动的去协调执行 connector 和task.
GET /connectors 返回所有正在运行的 connector 的信息
POST /connectors 新建一个 connectors,必须是 json 格式并且需要包含 name 和 config 字段，name 是 connector 的名字，config 是 json 格式，包含connector 的配置信息
GET /connectors/{name} 获取指定 connectir 的信息
GET /connectors/{name}/config 囧去指定connector 的配置信息
GET /connectors/{name}/status 获取状态，是否允许，是否报错等
GET /connectors/{name}/tasks 获取正在运行的 task
GET /connectors/{name}/tasks/status 获取tasks 状态
PUT /connectors/{name}/pause 暂停
PUT /connectors/{name}/resume 恢复被暂停的 connector
POST /connectors/{name}/restart 重启
POST /connectors/{name}/tasks/{taskid}/restart 重启taks
DELETE /connectors/{name} 删除connector ，停止所有task ，并删除配置

参考：https://my.oschina.net/hnrpf/blog/1555915

kafka connector的更多相关文章

Flink Kafka Connector 与 Exactly Once 剖析
Flink Kafka Connector 是 Flink 内置的 Kafka 连接器,它包含了从 Kafka Topic 读入数据的 Flink Kafka Consumer 以及向 Kafka T ...
debezium、kafka connector 解析 mysql binlog 到 kafak
目的: 需要搭建一个可以自动监听MySQL数据库的变化,将变化的数据捕获处理,此处只讲解如何自动捕获mysql 中数据的变化使用的技术 debezium :https://debezium.io/d ...
《Flink SQL任务自动生成与提交》后续：修改flink源码实现kafka connector BatchMode
目录问题思路 kafka参数问题支持batchmode的问题参数提交至kafkasource的问题 group by支持问题实现编译测试因为在一篇博文上看到介绍"汽车之家介绍 ...
kafka connector 使用总结以及自定义connector开发
Kafaka connect 是一种用于在Kafka和其他系统之间可扩展的.可靠的流式传输数据的工具.它使得能够快速定义将大量数据集合移入和移出Kafka的连接器变得简单.Kafka Connect可 ...
Kafka Connector无法启动的原因
如图:启动Connector的时候一直提示报错. 后面找了一下网上发现原因, 基本原因就是Kafka的lib包和插件包都添加到ClassPath里面了而这两地方都有Kafka-Client的jar包 ...
Kafka connector （kafka核心API）
前言 Kafka Connect是一个用于将数据流输入和输出Kafka的框架.Confluent平台附带了几个内置connector,可以使用这些connector进行关系数据库或HDFS等常用系统到 ...
Confluent之Kafka Connector初体验
概述背景 Apache Kafka 是最大.最成功的开源项目之一,可以说是无人不知无人不晓,在前面的文章<Apache Kafka分布式流处理平台及大厂面试宝典>我们也充分认识了Kafk ...
Kafka分布式集群搭建
环境说明 kafka自0.9之后增加了connector的特性.本文主要是搭建一个分布式的kafka connector和broker. 本文用了三台机器进行部署,使用centos 6.6. host ...
Kafka connect快速构建数据ETL通道
摘要: 作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处业余时间调研了一下Kafka connect的配置和使用,记录一些自己的理解和心得,欢迎 ...

随机推荐

各技能DBC参数
推荐你通过引擎的帮助文件查找标准魔法DB 下面是部分hero引擎的标准魔法DB 34,解毒术,2,26,16,0,0,0,0,0,2,42,50,44,100,46,200,40,, 35,老 ...
[MongoDB]MongoDB分页显示
MongoDB Limit与Skip方法配合进行分页MongoDB Limit() 方法如果你需要在MongoDB中读取指定数量的数据记录,可以使用MongoDB的Limit方法,limit()方法接 ...
MomentJS记录下开发中用到的日期
1.计算当前周一到周日的日期 var weekOfday = moment().format('E');//计算今天是这周第几天 var last_monday = moment().s ...
Abp.Core运行时提示XX没有实现，或者没有依赖注入的问题，或者调试时提示做出更改的问题
因为abp的web层对application层有项目引用,但是对domain层并不存在项目引用,而是bin目录下直接引用的dll文件,所以当domain层修改后不会自动将dll文件同步过去.所以有时候 ...
AcWing 240. 食物链
#include <iostream> using namespace std; ; int n, m; int p[N], d[N]; //p是baba,d是距离 int find(in ...
glog与gflags的windows编译
参考博客:https://kezunlin.me/post/bb64e398/
线上BUG定位神器(阿尔萨斯)-Arthas2019-0801
1.下载这个jar 2.运行这个jar 3.选取你需要定位的问题应用进程然后各种trace -j xx.xxx.xx.className methodName top -n 3 这个后面要补充去看, ...
[AST Babel Plugin] Transform code, add line:column number for console log
For example we have current code: function add(a, b) { console.log(a, b) return a + b } function sub ...
三大查找算法（Java实现）
三大查找算法 1.二分查找(Binary Search) public class BinarySearch { public static void main(String[] args) { in ...
uniGUI之文件下载(29)
1]SendFile 2]SendStream 3]自定义类型文件下载 1]SendFile UniSession.SendFile('新建文本文档.txt' //服务器端文件名 ,'anew.tx ...