Kafka 分布式的，基于发布/订阅的消息系统

Kafka是一种分布式的，基于发布/订阅的消息系统。主要设计目标如下：

通过O(1)的磁盘数据结构提供消息的持久化，这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。
高吞吐量：即使是非常普通的硬件kafka也可以支持每秒数十万的消息。
Consumer客户端pull，随机读,利用sendfile系统调用进行zero-copy ,批量拉数据
消费状态保存在客户端
支持Kafka Server间的消息分区，及分布式消费，同时保证每个Partition内的消息顺序传输。
数据迁移、扩容对用户透明
支持Hadoop并行数据加载。
支持online(在线)和offline(离线)的场景。
持久化：通过将数据持久化到硬盘以及replication防止数据丢失。
scale out：无需停机即可扩展机器。
定期删除机制，支持设定partitions的segment file保留时间。

项目实例：https://github.com/windwant/kafka-demo

kafka.properties

value.serializer=org.apache.kafka.common.serialization.StringSerializer

key.serializer=org.apache.kafka.common.serialization.StringSerializer

request.required.acks=1

bootstrap.servers=localhost:9092

value.deserializer=org.apache.kafka.common.serialization.StringDeserializer

key.deserializer=org.apache.kafka.common.serialization.StringDeserializer

group.id=test-consumer-group

Producer:

package org.windwant.kafka;

import org.apache.commons.configuration.ConfigurationException;

import org.apache.commons.configuration.PropertiesConfiguration;

import org.apache.commons.configuration.reloading.FileChangedReloadingStrategy;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

import org.apache.kafka.clients.producer.RecordMetadata;

import java.io.IOException;

import java.util.Properties;

import java.util.concurrent.ExecutionException;

/**

 * Producer

 */

public class MyKafkaProducer {

    private Properties props;

    public static void main(String[] args) throws ConfigurationException {

        new MyKafkaProducer().start();

    }

    public MyKafkaProducer() throws ConfigurationException {

        props = new Properties();

        PropertiesConfiguration config = new PropertiesConfiguration("kafka.properties");

        config.setReloadingStrategy(new FileChangedReloadingStrategy());

        //×Ô¶¯±£´æ

        config.setAutoSave(true);

        props.put("value.serializer", config.getString("value.serializer"));

        props.put("key.serializer", config.getString("key.serializer"));

        props.put("request.required.acks", config.getString("request.required.acks"));

        props.put("bootstrap.servers", config.getString("bootstrap.servers"));

    }

    public void start(){

        try {

            Producer<String, String> producer = new KafkaProducer<>(props);

            for(int i = 0; i < 100; i++) {

                RecordMetadata result = producer.send(new ProducerRecord<>("mykafka",

                        "kafka key: " + Integer.toString(i),

                        "kafka value: " + Integer.toString(i))).get();

                System.out.println("producer send: " + result);

                Thread.sleep(1000);

            }

            producer.close();

        } catch (InterruptedException e) {

            e.printStackTrace();

        } catch (ExecutionException e) {

            e.printStackTrace();

        }

    }

}

Consumer:

package org.windwant.kafka;

import org.apache.commons.configuration.ConfigurationException;

import org.apache.commons.configuration.PropertiesConfiguration;

import org.apache.commons.configuration.reloading.FileChangedReloadingStrategy;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.util.Arrays;

import java.util.Properties;

/**

 * Consumer.

 */

public class MyKafkaConsumer {

    private Properties props;

    public static void main(String[] args) throws ConfigurationException {

        new MyKafkaConsumer().start();

    }

    public MyKafkaConsumer() throws ConfigurationException {

        props = new Properties();

        PropertiesConfiguration config = new PropertiesConfiguration("kafka.properties");

        config.setReloadingStrategy(new FileChangedReloadingStrategy());

        //自动保存

        config.setAutoSave(true);

        props.put("value.deserializer", config.getString("value.deserializer"));

        props.put("key.deserializer", config.getString("key.deserializer"));

        props.put("bootstrap.servers", config.getString("bootstrap.servers"));

        props.put("group.id", config.getString("group.id"));

    }

    public void  start(){

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);

        consumer.subscribe(Arrays.asList("mykafka"));

        while (true) {

            ConsumerRecords<String, String> records = consumer.poll(100);

            for (ConsumerRecord<String, String> record : records) {

                System.out.printf("offset = %d, key = %s, value = %s", record.offset(), record.key(), record.value());

                System.out.println();

            }

        }

    }

}

Kafka 分布式的，基于发布/订阅的消息系统的更多相关文章

kafka高吞吐量的分布式发布订阅的消息队列系统
一:kafka介绍kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍BrokerKafka集群 ...
分布式事务解决方案（二）消息系统避免分布式事务 & MQ事务消息 & Sagas 事务模型
参考文档: 如何用消息系统避免分布式事务:http://blog.jobbole.com/89140/ https://www.cnblogs.com/savorboard/p/distributed ...
Publisher/Subscriber(发布/订阅者)消息模式开发流程
该模式的作用是发布者和订阅者可以相互发送消息发布者和订阅者都充当生产者和消费者发布者 package publisher.to.subscriber; import java.awt.font ...
node-amqp 使用fanout发布订阅rabbitmq消息
publisher代码 const amqp = require('amqp'); let option = { host: 'server-ip', port: 5672, login: 'gues ...
【转载】Apache Kafka：下一代分布式消息系统
http://www.infoq.com/cn/articles/kafka-analysis-part-1 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩 ...
大数据之路【第十篇】：kafka消息系统
一.简介 1.简介简介• Kafka是Linkedin于2010年12月份开源的消息系统• 一种分布式的.基于发布/订阅的消息系统 2.特点 – 消息持久化:通过O(1)的磁盘数据结构提供数据的持 ...
高吞吐量的分布式发布订阅消息系统Kafka之Producer源码分析
引言 Kafka是一款很棒的消息系统,今天我们就来深入了解一下它的实现细节,首先关注Producer这一方. 要使用kafka首先要实例化一个KafkaProducer,需要有brokerIP.序列化 ...
分布式消息系统之Kafka集群部署
一.kafka简介 kafka是基于发布/订阅模式的一个分布式消息队列系统,用java语言研发,是ASF旗下的一个开源项目:类似的消息队列服务还有rabbitmq.activemq.zeromq:ka ...
发布订阅 - 基于A2DFramework的事件机制实现
SUMMARY 能做什么 DEMO 原理图应用场景能做什么 A2DFramework的事件机制是基于发布订阅模式改进得来的一套API,中间件部分实现了msmq.redis.Supersocket可 ...

随机推荐

Elasticsearch5.0.1索引压测结果
说明以下的所有指标均指的是某台机器的峰值机器配置 cpu:12 core,32G,ES 分配JVM内存18G3台虚拟机,master.data共用shard:5,replica:1 试验时间:20 ...
Spring中常用的连接池配置
首先,我们准备Jdbc属性文件 jdbc.properties,用于保存连接数据库的信息,利于我们在配置文件中的使用 jdbc.driver=com.mysql.jdbc.Driver jdbc.ur ...
Guava学习笔记：Guava cache
缓存,在我们日常开发中是必不可少的一种解决性能问题的方法.简单的说,cache 就是为了提升系统性能而开辟的一块内存空间. 缓存的主要作用是暂时在内存中保存业务系统的数据处理结果,并且等待下次访问使用 ...
<记录学习>（前三天)京东页面各种注意点
培训学校第1到3天先学习HTML现在流行的是HTML5,目前学习的是HTML5规范.(给有基础一定的人学习)前三天学习的是京东页面的编写,和以前写的不同,页面看上去和自己写的一样,但老师讲的还是有很多 ...
【转】UTF-8汉字正则表达式
原文链接:http://blog.csdn.net/wide288/article/details/30066639 $str = "编程";// if(!preg_match(& ...
Comparable与Comparator的区别
Java的Comparator和Comparable当需要排序的集合或数组不是单纯的数字型时,通常可以使用Comparator或Comparable,以简单的方式实现对象排序或自定义排序. 一.Com ...
Sending e-mail
E-mail functionality uses the Apache Commons Email library under the hood. You can use theplay.libs. ...
学习 Mobile App 网站制作的11个优秀案例
我喜欢收集美丽的,精心设计的移动应用程序网站.在我看来,为 App 提供一个美丽的网站显示了设计者和开发者对它的用户和产品的关心,除了开发应用程序,他们去加倍努力去促进应用和传播关于它的 App. 我 ...
使用gulp来构建一个前端项目
什么是gulp? gulp是一个前端项目构建工具,是自动化项目的构建利器,它不仅能对网站资源进行优化,而且在开发过程中很多重复的任务能够使用正确的工具自动完成.你可以使用gulp及其插件对你的项目代码 ...
JavaScript基础20——element对象
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...

Kafka 分布式的，基于发布/订阅的消息系统

Kafka 分布式的，基于发布/订阅的消息系统的更多相关文章

随机推荐

热门专题