Kafka （一）

使用Kafka最新版本0.9

Kafka 配置

1. 安装

首先需要安装Java，推荐安装Java8，不然会出现一些莫名其妙的错误

kafka_2.11-0.9.0.0.tgz

tar -xzf kafka_2.11-0.9.0.0.tgz

为了方便，更改一下目录名

mv kafka_2.11-0.9.0.0.tgz kafka

2.配置Kafka服务端属性

安装的是单节点，集群的配置非常简单，可以看看其他的资料

cd config

vim server.properties

有2个关键属性需要修改

advertised.host.name

advertised.port

这2个属性需要修改成IP地址或者机器名，如果Kafka是部署在云端中，可能云端的虚拟机中有别的虚拟IP，需要在这2个地址配置。

这个测试环境中，是部署在虚拟机中，通过路由相连，仍然需要配置这2个属性，将advertised.host.name设置为虚拟机的IP地址。

如果不配置advertised.host.name，只配置host.name，在另外一台机器上使用Java的Client连接时，会被解析成localhost。

3. 启动Kafka自带的Zookeeper

bin/zookeeper-server-start.sh config/zookeeper.properties

4. 启动Kafka

bin/kafka-server-start.sh config/server.properties

Kafka 简单测试

1. 创建Topic

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

2. 查看Topic

bin/kafka-topics.sh --list --zookeeper localhost:2181

3. 生产消息

新建一个Console

bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

输入字符串回车即可

4. 消费消息

新建一个Console

bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning

在生产消息的Console，继续输入字符并回车，这里会即时消费

Kafka Java客户端

1. Maven文件

<dependency>

            <groupId>org.apache.kafka</groupId>

            <artifactId>kafka-clients</artifactId>

            <version>0.9.0.0</version>

 </dependency>

2. Produce代码

        Properties props = new Properties();

        props.put("bootstrap.servers", "192.168.1.160:9092");

        props.put("acks", "all");

        props.put("retries", 0);

        props.put("batch.size", 16384);

        props.put("linger.ms", 1);

        props.put("buffer.memory", 33554432);

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        Producer<String, String> producer = new org.apache.kafka.clients.producer.KafkaProducer(props);

        for(int i = 0; i < 100; i++)

            producer.send(new ProducerRecord<String, String>("my-topic2", Integer.toString(i), Integer.toString(i)));

        producer.close();

bootstrap.servers即Kafka broker的地址

3. Consumer代码

 　　   Properties props = new Properties();

        props.put("bootstrap.servers", "192.168.1.160:9092");

        props.put("group.id", "test");

        props.put("enable.auto.commit", "true");

        props.put("auto.commit.interval.ms", "1000");

        props.put("session.timeout.ms", "30000");

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        org.apache.kafka.clients.consumer.KafkaConsumer<String, String> consumer = new org.apache.kafka.clients.consumer.KafkaConsumer<String, String>(props);

        //consumer.subscribe(Arrays.asList("foo", "bar"));

        consumer.subscribe(Arrays.asList("my-topic2"));

        while (true) {

            ConsumerRecords<String, String> records = consumer.poll(1000);

            for (ConsumerRecord<String, String> record : records)

                System.out.printf("offset = %d, key = %s, value = %s", record.offset(), record.key(), record.value());

        }

Consumer Group

Kafka的Consumer可以加入一个Group，如果一个Group中的Consumer数大于该Topic的Partition数，则某些Consumer不会Fetch到数据，如果Consumer数小于Partition数，则某些Consumer会比别的Consumer消费更多的消息。

如果一个Consumer没有加入任何Group，则这个Consumer会消费该Topic下所有Partition的消息

建议最好的方式是一个Consumer对应一个Partition

在Kafka中会储存每个Consumer消费消息的Offset，Consumer可以选择Auto Commit Offset或者Manual Commit

在进行设计时，如果对Consumer有一定一致性的要求，可以选择Manual Commit，例如Consumer宕机，重启或者新Consumer加入时，可以从该Partition的Offset记录位置开始消费，还有一种情况则是Consumer宕机，不重启并且没有新的Consumer加入，在0.9.0。0版本的Kafka中，会有一个Consumer的协调者来处理Consumer的Reblance，启动Reblance，那么在同一个Group中的其他Consumer也可以消费宕机的Consumer订阅的Partition的消息。但这样设计的前提是Consumer必须被设计成无状态的。

Kafka 传递的消息

Kafka传递的消息是<key,value>，让我想起了Map-Reduce，利用Kafka可以快速构建一个轻量级的MR并行分析

Kafka对Hadoop的支持也非常的好。

Kafka （一）的更多相关文章

Spark踩坑记——Spark Streaming+Kafka
[TOC] 前言在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了spark strea ...
消息队列 Kafka 的基本知识及 .NET Core 客户端
前言最新项目中要用到消息队列来做消息的传输,之所以选着 Kafka 是因为要配合其他 java 项目中,所以就对 Kafka 了解了一下,也算是做个笔记吧. 本篇不谈论 Kafka 和其他的一些消息 ...
kafka学习笔记：知识点整理
一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...
.net windows Kafka 安装与使用入门(入门笔记)
完整解决方案请参考: Setting Up and Running Apache Kafka on Windows OS 在环境搭建过程中遇到两个问题,在这里先列出来,以方便查询: 1. \Jav ...
kafka配置与使用实例
kafka作为消息队列,在与netty.多线程配合使用时,可以达到高效的消息队列
kafka源码分析之一server启动分析
0. 关键概念关键概念 Concepts Function Topic 用于划分Message的逻辑概念,一个Topic可以分布在多个Broker上. Partition 是Kafka中横向扩展和一 ...
Kafka副本管理—— 为何去掉replica.lag.max.messages参数
今天查看Kafka 0.10.0的官方文档,发现了这样一句话:Configuration parameter replica.lag.max.messages was removed. Partiti ...
Kafka：主要参数详解（转）
原文地址:http://kafka.apache.org/documentation.html ############################# System ############### ...
kafka
2016-11-13 20:48:43 简单说明什么是kafka? Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息 ...
Spark Streaming+Kafka
Spark Streaming+Kafka 前言在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端, ...

随机推荐

Kinect的学习笔记发展（一）Kinect引进和应用
Kinect的学习笔记发展(一)Kinect引进和应用 zouxy09@qq.com http://blog.csdn.net/zouxy09 一.Kinect简单介绍 Kinectfor Xbox ...
WPF 各种基础动画实现
C# using System; using System.Collections.Generic; using System.Linq; using System.Text; using Syste ...
最简单的历史Hibernate获得短暂的
其实Hibernate本身就是一个单独的帧,不管它不需要web server或application server支持. 然而,最Hibernate简介已经加入了非常多的非Hibernate事,例: ...
Foursquare 8.0 ：聪明人给互联网公司上的流量转化课
今年 5 月上线的 Swarm 虽然应用制作精良,但不免让人怀疑是 Foursquare一次失败的互联网公司服务越界和用户忠诚度试水.但非常快这群聪明人让我们发现事情并没有这么简单:他们给互联网公司们 ...
silverlight与wcf双向通讯例子
本文将建立一个silverlight与wcf双向通讯的简单实例,以下是详细步骤: 新建Silverlight应用程序,名称WCFtest.解决方案中添加WCF服务应用程序,名称WcfServiceTe ...
C# 隐藏 Windows Phone 侦错模式中萤幕右上角的数据条(模拟器、实机可用)，截图好方便。
原文:C# 隐藏 Windows Phone 侦错模式中萤幕右上角的数据条(模拟器.实机可用),截图好方便. 一般我们在开发Windows Phone App时,会使用模拟器或是实体的手机开发,在Vi ...
jdk和jre是什么?都有什么用?
大家肯定在安装JDK的时候会有选择是否安装单独的jre,一般都会一起安装,我也建议大家这样做.由于这样更能帮助大家弄清楚它们的差别: Jre 是java runtime environme ...
如何知道 win10 的激活到期时间和期限等
在“运行”里输入cmd,出来dos对话框后,输入下面的东西后,按Enterslmgr.vbs -dli (显示:操作系统版本.部分产品密钥.许可证状态)slmgr.vbs -dlv (显示:最为详尽的 ...
SimpleDateFormat使用特定的解释
public class SimpleDateFormat extends DateFormat SimpleDateFormat 是一个以国别敏感的方式格式化和分析数据的详细类. 它同意格式化 ...
CentOS6.5设备MRBS
//--------------------------------------软件必须安装-----------------------------------// # yum install –y ...

Kafka （一）

Kafka （一）的更多相关文章

随机推荐

热门专题