1.2 用例

  以下是一些Kafka 常见的用例。关于功能方面的一些概念,可以看这篇博客:http://engineering.linkedin.com/distributed-systems/log-what-every-software-engineer-should-know-about-real-time-datas-unifying。

  消息

  Kafka 可以很好的替代传统的消息代理。消息代理的使用有很多原因。(将数据发布解耦,缓存未处理消息等等)。相比于大多数消息系统,Kafka 有更大的吞吐量,内置分区,备份容错,这些特点使它可以很好处理大量消息请求。

  在应用体验中,我们会经常遇到相对不高的吞吐量需求,但需要很低的端到端延迟并且需要依赖Kafka持久化的情况。

  在这个领域中,Kafka相当于传统的消息系统,比如ActiveMQ 或 RabbitMQ

  网站活动跟踪

  Kafka 最早是提供一套实时发布订阅被用来重绘用户活动跟踪线路。网站的活动(页面展示,搜索,用户其他可能的活动)根据活动类型被转发给对应主题。为包括实时处理、实时监控和为离线处理和报表装载Hadoop或离线数据仓库的用例提供有效的支持。

  活动跟踪是每个用户页面的活动信息聚集合成的。

  评审

  Kafka经常被用于运行监控数据。这涉及从分布式应用到生产数据的汇总统计过程中的运行数据的支持。

  日志聚集

  Kafka经常被用来作为日志聚集的替代解决方案。日志聚集通常收集服务器上的日志文件放到一个集中的位置(一种文件系统比如HDFS)处理。 Kafka提取日志文件中的明细并返回清洗过的日志概要或流形式的事件数据信息。这样就可以提高处理速度同时对多数据源和分布式消费的支持更容易。相比集中式日志系统,如Scribe 或 Flume,Kafka 提供了相对更好的性能,较低的端到端延迟以及通过多备份保证了更健壮的持久化。

  流处理

  很多用户喜欢分阶段处理数据从原始数据主题中被消费经过汇总,加工或其他转化方式进一步消费到新主题的过程。例如一个文章推荐的处理流程会从RSS订阅抓取文章内容并发布给一个文章主题;然后经过有助于格式化或去重的处理后加入到一个文章清理的主题;最后阶段推送给匹配的用户。通过这些可以组成一个来至于各个主题的实时数据流程图。 这类转换框架中比较常见的有Storm 和 Samza。

  事件持久化

  事件持久化是一种将状态变化按时间顺序序列化记录存储的应用设计方式。Kafka 对巨大数据存储的支持可以支撑起建立在事件持久化方式上的优秀应用后端。

  提交日志

  Kafka 可以作为分布式系统的外部日志提交服务。日志可以用来进行多节点间数据备份和重新同步以恢复失败节点的数据。这种场景下 Kafka 支持日志压缩。在这种场景下Kafka 和Apache BookKeeper项目类似。

Kafka 文档用例的更多相关文章

  1. Kafka 文档引言

    原文地址:https://kafka.apache.org/documentation.html#semantics 1.开始 1.1 引言 Kafka是一个分布式,分区队列,冗余备份的消息存储服务. ...

  2. MicroPython最全资料集锦丨TPYBoard全系列教程之文档+例程源码

    MicroPython成功将Python引入到嵌入式领域,近几年MicroPython的发展和普及也证明,Python无疑将在未来几年内快速抢占和蚕食C/C++的份额.包括现在比较火爆的机器人.无人机 ...

  3. 以黄门镇黄湾村某一扶贫文档为例——将Excel数据填入到已存在的Word模板

    傻瓜可以写出机器读得懂代码,但写出让人能读懂的代码的是优秀程序员 作用:通过Excel文件中的一列数据作为文件名创建Word文档,并将Excel中的一行数据填一表,实现自动化 Excel的VBA宏代码 ...

  4. 如何为Dash/Zeal生成c++ 文档: 以abseil文档为例

    目录 1. 软件安装 2 Sample源文件下载: 3. 生成步骤 3.1 使用doxygen生成html文件 3.2 使用docsetutil 生成 dash/Zeal 格式 1. 软件安装: 1. ...

  5. kafka文档(转)

    来自:http://www.inter12.org/archives/842 一 BROKER 的全局配置 最为核心的三个配置 broker.id.log.dir.zookeeper.connect ...

  6. pytest文档16-用例a失败,跳过测试用例b和c并标记失败xfail

    前言 当用例a失败的时候,如果用例b和用例c都是依赖于第一个用例的结果,那可以直接跳过用例b和c的测试,直接给他标记失败xfail 用到的场景,登录是第一个用例,登录之后的操作b是第二个用例,登录之后 ...

  7. pytest文档2-用例运行规则

    用例设计原则 文件名以test_*.py文件和*_test.py 以test_开头的函数 以Test开头的类 以test_开头的方法 所有的包pakege必须要有__init__.py文件 help帮 ...

  8. unittest,selenium——批量,多线程执行多文档用例

    之前做过批量执行多.py文件,为了省时也做过单py文件多线程,现在做多py文件用例多线程 # coding:utf-8import unittestimport osimport timeimport ...

  9. pytest文档2-用例执行

    用例设计原则 1.文件名以test_******.py文件和*******_test.py 2.以test_****开头的函数 3.以Test***开头的类 4.以test_*****开头的方法 5. ...

随机推荐

  1. 一起来玩echarts系列(一)------箱线图的分析与绘制

    一.箱线图 Box-plot 箱线图一般被用作显示数据分散情况.具体是计算一组数据的中位数.25%分位数.75%分位数.上边界.下边界,来将数据从大到小排列,直观展示数据整体的分布情况. 大部分正常数 ...

  2. 2.WindowsServer2012R2装完的一些友好化设置

    网站部署之~Windows Server | 本地部署 http://www.cnblogs.com/dunitian/p/4822808.html#iis 1.桌面图标(控制面板里面屏蔽了,得自己输 ...

  3. zookeeper源码分析之三客户端发送请求流程

    znode 可以被监控,包括这个目录节点中存储的数据的修改,子节点目录的变化等,一旦变化可以通知设置监控的客户端,这个功能是zookeeper对于应用最重要的特性,通过这个特性可以实现的功能包括配置的 ...

  4. 利用poi导出Excel

    import java.lang.reflect.Field;import java.lang.reflect.InvocationTargetException;import java.lang.r ...

  5. 使用git进行源代码管理

    git是一款非常流行的分布式版本控制系统,使用Local Repository追踪代码的修改,通过Push和Pull操作,将代码changes提交到Remote Repository,或从Remote ...

  6. Linux命令

    系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS ...

  7. Java中的进程与线程(总结篇)

    详细文档: Java中的进程与线程.rar 474KB 1/7/2017 6:21:15 PM 概述: 几乎任何的操作系统都支持运行多个任务,通常一个任务就是一个程序,而一个程序就是一个进程.当一个进 ...

  8. 我想立刻辞职,然后闭关学习编程语言,我给自己3个月时间学习C语言!这样行的通吗

    文章背景,回答提问:我想立刻辞职,然后闭关学习编程语言,我给自己3个月时间学习C语言!这样行的通吗? 我的建议是这样:1. 不要辞职.首先说,你对整个开发没有一个简单的了解,或一个系统的入门学习.换句 ...

  9. node(ActiveMq)

    简单尝试了node下的ActiveMQ 1.下载apache-activemq-5.9.0,执行bat文件: 2.登录http://localhost:8161/admin可查看其管理后台: 3.安装 ...

  10. Unit Of Work的设计

    在DDD开发过程中,一个良好的Uow设计必不可少,我心目中的Uow设计应该具备以下几点: 1.有着良好的抽象,有着恰如其分的命名: 2.能够应付不同的组件,比如你的系统中可能会存在EfUnitOfWo ...