kafka-spark streaming （一）

Kafka-spark streaming

1、安装包

kafka安装需要zookeeper、jdk。

官网下载最新的：

https://kafka.apache.org/downloads

http://mirrors.hust.edu.cn/apache/zookeeper/

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

本例用到的服务版本：kafka_2.11.0.11.tar.gz,jdk1.8

Zookeeper可以自己安装，也可以使用kafka自带的zk。本例使用自带的zookeeper。

2、安装kafka（standalone）

1）# tar xf kafka_2.11-0.11.0.0.tgz

2）# mv kafka_2.11-0.11.0.0 kafka

3）# cd kafka ;ls

bin config kafka-logs libs LICENSE logs NOTICE site-docs

3、修改配置文件

主要是修改server.properties、zookeeper.properties、producer.properties、consumer.properties

1） # vim server.properties

broker.id=0 #每个kafka的broker是唯一的

delete.topic.enable=true

listeners=PLAINTEXT://:9092

num.network.threads=3

num.io.threads=8

socket.send.buffer.bytes=102400

socket.receive.buffer.bytes=102400

socket.request.max.bytes=104857600

log.dirs=/data/kafka/kafka-logs

num.partitions=4 #4个分区，对应spark4个RDD

num.recovery.threads.per.data.dir=1

offsets.topic.replication.factor=1

transaction.state.log.replication.factor=1

transaction.state.log.min.isr=1

log.retention.hours=168

log.segment.bytes=1073741824

log.retention.check.interval.ms=300000

zookeeper.connect=localhost:2181

zookeeper.connection.timeout.ms=6000

group.initial.rebalance.delay.ms=0

2)vim zookeeper.properties

dataDir=/data/zookeeper

clientPort=2181

maxClientCnxns=0

3)vim producer.properties

bootstrap.servers=localhost:9092

compression.type=none

4)vim consumer.properties

zookeeper.connect=127.0.0.1:2181

zookeeper.connection.timeout.ms=6000

group.id=consumer

#如果zk是集群，则用，隔开。

#kafka是集群，则group.id相同

创建相应的目录。

4、启动服务

1）启动zk

# nohup ./zookeeper-server-start.sh ../config/zookeeper.properties 2>&1 &

2)启动kafka

# nohup ./kafka-server-start.sh ../config/server.properties 2>&1 &

3)创建一个topic

# ./kafka-topics.sh --create --topic kafka-test --replication-factor 1 --partitions 4 --zookeeper localhost:2181

修改partition的数量：

# ./kafka-topics.sh --alter --zookeeper localhost:2181 --topic kafka-test --partitions 20

4)查看创建的所有topic

# ./kafka-topics.sh --list --zookeeper localhost:2181

5）删除某个topic

# ./kafka-topics.sh --delete --zookeeper localhost:2181 --topic kafka-test

# 需要在server.properties里面设置delete.topic.enable=true。

6）模拟producer

# ./kafka-console-producer.sh --broker-list 127.0.0.1:9092 --topic userlog

7)模拟consumer

# ./kafka-console-consumer.sh --zookeeper localhost:2181 --topic userlog --from-beginning

#如果是分布式的，还需要设置listeners=PLAINTEXT://:9092，默认是127.0.0.1；需要修改为：listeners=PLAINTEXT://服务器ip:9092

在其他服务器上调用的时候，也是需要将地址改为服务器地址的，还有就是 bootstrap.servers=localhost:9092

，改为服务器的地址。

kafka-spark streaming （一）的更多相关文章

Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十一）NIFI1.7.1安装
一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120 master 192.168.0.121 slave1 192.168.0.122 sla ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十三）kafka+spark streaming打包好的程序提交时提示虚拟内存不足（Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical memory used; 2.2 GB of 2.1 G）
异常问题:Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical mem ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十二）VMW安装四台CentOS，并实现本机与它们能交互，虚拟机内部实现可以上网。
Centos7出现异常:Failed to start LSB: Bring up/down networking. 按照<Kafka:ZK+Kafka+Spark Streaming集群环境搭 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十一）定制一个arvo格式文件发送到kafka的topic，通过Structured Streaming读取kafka的数据
将arvo格式数据发送到kafka的topic 第一步:定制avro schema: { "type": "record", "name": ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（九）安装kafka_2.11-1.1.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（八）安装zookeeper-3.4.12
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（三）安装spark2.2.1
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二）安装hadoop2.9.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
demo2 Kafka+Spark Streaming+Redis实时计算整合实践 foreachRDD输出到redis
基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming.Spark SQL.MLlib.GraphX,这些内建库都提供了 ...

随机推荐

delphi 升级到xe7后的一些个人经验
http://blog.csdn.net/span12/article/details/42522091 你只要记住字符串使用变了.VCL 下面所有的 char 改 ansichar string ...
ASP.net MVC4/MVC5 错误处理及设置
很无聊的记录下.首先IIS 7以上的版本测试才成功首先 //全局ErrorHandler public static void RegisterGlobalFilters(GlobalFilterC ...
JIT与JVM的三种执行模式：解释模式、编译模式、混合模式
Java JIT(just in time)即时编译器是sun公司采用了hotspot虚拟机取代其开发的classic vm之后引入的一项技术,目的在于提高java程序的性能,改变人们“java比C/ ...
python+pcap+dpkt 抓包小实例
#!/usr/bin/env python # -*- coding: utf-8 -*- """ 网络数据包捕获与分析程序 """ imp ...
程序媛计划——python正则表达式
#定义正则表达式是对字符串操作的一种逻辑公式,通过它我们能筛选过滤出我们需要的内容,如判断一串数字是否是电话号码. #原理先把正则表达式的字符串转换成 Pattern 对象,接着用这个对象处理文本 ...
雨天的尾巴(bzoj3307)(线段树合并+树上差分)
\(N\)个点,形成一个树状结构.有\(M\)次发放,每次选择两个点\(x,y\) 对于\(x\)到\(y\)的路径上(含\(x,y\))每个点发一袋\(Z\)类型的物品.完成所有发放后,每个点存放 ...
Android 美学设计基础 <2>
我们接着上期的项目进行分享. 1.2.2 Elevation (仰角) 仰角只的是不同的素材块在Z轴上的选对位置仰角的测量方式这里只的是两个平面在z的距离,记住我们默认每个平面都是1dp的厚度 1 ...
C/C++ 语言 Hello world
#include <stdio.h> void main() { int x,i; ; scanf("%d",&x); if(x>y) printf(&q ...
sql语句应考虑哪些安全性？
(1)少使用root账户,应该为不同的动作分配不同的账户: (2)sql执行出错后,不能把数据库中显示的出错信息,直接展示给用户.防止泄露服务器和数据库相关信息: (3)防止sql注入,对特殊字符进行 ...
myeclipse注册码生成
import java.io.*; /** * <一句话功能简述> * <功能详细描述> * * @author 程松 * @date 2013-11-8上午8:50:34 * ...

kafka-spark streaming （一）

kafka-spark streaming （一）的更多相关文章

随机推荐

热门专题