Kafka初识

1、概述

　　　　1.1、Apache Kafka是一个分布式流处理平台；

2、Kafka适应于什么场景？

　　　　2.1、构造实时流数据管道，在系统或应用之间可靠地获取数据（相当于message queue）

　　　　2.2、构建实时流式应用程序，对这些流数据进行转换或者影响（流处理，Kafka topic与topic之间内部转换）

3、Kafka如何实现？

　　　　3.1、概念

　　　　　　　　3.1.1、Kafka作为一个集群，运行在一台或多台服务器上；

　　　　　　　　3.1.2、Kafka 通过topic 对存储的流数据进行分类；

　　　　　　　　3.1.3、每条记录中包含一个key，一个value，一个timestamp（时间戳）；

　　　　3.2、4个核心API

　　　　　　　　3.2.1、Producer API

　　　　　　　　　　　　　　允许一个应用程序发布一串流式的数据到一个或多个Kafka topic；

　　　　　　　　3.2.2、Consumer API

　　　　　　　　　　　　　　允许一个应用程序订阅一个或多个topic，并且对发布给他们的流式数据进行处理；

　　　　　　　　3.2.3、Stream API

　　　　　　　　　　　　　　允许一个应用程序作为流处理器；

　　　　　　　　　　　　　　消费一个或多个topic产生的输入流，然后生产一个输出流到一个或多个topic中去，在输入输出流中进行转换；

　　　　　　　　3.2.4、Connector API

　　　　　　　　　　　　　　允许构建并运行可重用的生产者、消费者，将Kafka topics 连接到已存在的应用程序或数据系统；　

Kafka初识的更多相关文章

Kafka 初识
1.Kafka 是什么? 用一句话概括一下:Apache Kafka 是一款开源的消息引擎系统. 倘若“消息引擎系统“这个词对你来说有点陌生的话,那么“消息队列“.“消息中间件”的提法想必你一定是有所 ...
《Kafka笔记》1、Kafka初识
目录一.初识Kafka 1 apache kafka简介 2 消息中间件kafka的使用场景 2.1 订阅与发布队列 2.2 流处理 3 kafka对数据的管理形式 4 kafka基础架构 5 Ka ...
【kafka学习之一】 kafka初识
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4一.kafka是什么? (1)kafka是一个高吞吐的分部式消息系统.( ...
Kafka【第一篇】Kafka集群搭建
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...
【转】kafka集群搭建
转:http://www.cnblogs.com/luotianshuai/p/5206662.html Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否 ...
centos7搭建kafka集群-第一篇
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...
kafka集群部署文档（转载）
原文链接:http://www.cnblogs.com/luotianshuai/p/5206662.html Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候 ...
zookeeper与Kafka集群搭建及python代码测试
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...
初识中间件Kafka
初识中间件Kafka Author:SimplelWu 什么是消息中间件? 非底层操作系统软件,非业务应用软件,不是直接给最终用户使用的,不能直接给客户带来价值的软件统称为中间件关注于数据的发送和接 ...

随机推荐

Python_011(生成器)
一.生成器 def func(): ") return 222 ret = func() print(ret) #结果 111 222 1)这里面函数体里是返回值return;如果将retu ...
vim 批量添加删除注释
vim中单行注释只是多行注释的一个特例,这里统一进行多行注释的讲解 (1)添加批量注释 ctrl+v 进入列编辑模式,向下或向上移动光标,把需要注释的行的开头标记起来,然后按大写的I(shift+i) ...
Charles抓取https
步骤一:将Charles的根证书(Charles Root Certificates)安装到Mac上. Help -> SSL Proxying -> Install Charles Ro ...
scrapy--meta参数传递问题
scrapy使用大坑---meta参数传递出现之重复问题问题描述: 爬虫目标: 实现哔哩哔哩网站的视频信息爬取,只要的信息结构爬去顺序为**关键词的搜索结果,拿到第一页上某个视频的标题,url,和时 ...
深入理解Redis的持久化机制和原理
Redis是一种面向“key-value”类型数据的分布式NoSQL数据库系统,具有高性能.持久存储.适应高并发应用场景等优势.它虽然起步较晚,但发展却十分迅速. 近日,Redis的作者在博客中写到, ...
Mac009--Axure RP安装
Mac--Axure RP安装一.下载Axure RP8.0 下载网址:https://www.axure.com/download (下载mac版本) Axure RP说明: Axure RP是 ...
JavaWeb防止用户的重复请求提交
这里实现这个重复提交的防止,是通过在一个FIlter过滤器中生成一个令牌token,保存在Session域中,然后在对这个token加密得到ciphertext(密文),将密文保存在request域中 ...
Python分布式爬虫必学框架Scrapy打造搜索引擎学习教程
Python分布式爬虫打造搜索引擎Scrapy精讲—用Django实现搜索的自动补全功能 elasticsearch(搜索引擎)提供了自动补全接口 1.创建搜索自动补全字段suggest自动补全需要用 ...
POJ-1611.TheSuspects.(并查集)
The Suspects Time Limit: 1000MS Memory Limit: 20000K Total Submissions: 55832 Accepted: 26501 De ...
[已解决]报错: Windows下Redis服务无法启动,错误 1067 进程意外终止解决方案
启动redis时出现的报错内容: 解决方法: 找到登录状态如果是网络服务,直接双击此服务,修改为本地系统服务即可启动!

Kafka初识

Kafka初识的更多相关文章

随机推荐

热门专题