sparkStreaming获取kafka数据（java版本）

环境

spark-2.2.0

kafka_2.11-0.10.0.1

jdk1.8

配置好jdk，创建项目并将kafka和spark的jar包添加到项目中，除此之外还需要添加spark-streaming-kafka-*****.jar，笔者这里用的是spark-streaming-kafka-0-10_2.11-2.2.0.jar，可在spark官网上自行下载

 import java.util.Arrays;

 import java.util.Collection;

 import java.util.HashMap;

 import java.util.Map;

 import org.apache.kafka.clients.consumer.ConsumerRecord;

 import org.apache.kafka.common.serialization.StringDeserializer;

 import org.apache.spark.SparkConf;

 import org.apache.spark.api.java.JavaPairRDD;

 import org.apache.spark.api.java.JavaRDD;

 import org.apache.spark.api.java.function.Function;

 import org.apache.spark.api.java.function.PairFunction;

 import org.apache.spark.api.java.function.VoidFunction;

 import org.apache.spark.rdd.RDD;

 import org.apache.spark.streaming.Durations;

 import org.apache.spark.streaming.api.java.JavaDStream;

 import org.apache.spark.streaming.api.java.JavaInputDStream;

 import org.apache.spark.streaming.api.java.JavaPairDStream;

 import org.apache.spark.streaming.api.java.JavaStreamingContext;

 import org.apache.spark.streaming.kafka010.ConsumerStrategies;

 import org.apache.spark.streaming.kafka010.KafkaUtils;

 import org.apache.spark.streaming.kafka010.LocationStrategies;

 import scala.Tuple2;

 public class SparkStreamingFromkafka {

     public static void main(String[] args) throws Exception {

         // TODO Auto-generated method stub

         SparkConf sparkConf  = new SparkConf().setMaster("local[*]").setAppName("SparkStreamingFromkafka");

         JavaStreamingContext streamingContext = new JavaStreamingContext(sparkConf , Durations.seconds(1));

         Map<String, Object> kafkaParams = new HashMap<>();

         kafkaParams.put("bootstrap.servers", "192.168.246.134:9092");//多个可用ip可用","隔开

         kafkaParams.put("key.deserializer", StringDeserializer.class);

         kafkaParams.put("value.deserializer", StringDeserializer.class);

         kafkaParams.put("group.id", "sparkStreaming");

         Collection<String> topics = Arrays.asList("video");//配置topic，可以是数组

         JavaInputDStream<ConsumerRecord<String, String>> javaInputDStream =KafkaUtils.createDirectStream(

                 streamingContext,

                 LocationStrategies.PreferConsistent(),

                 ConsumerStrategies.Subscribe(topics, kafkaParams));

         JavaPairDStream<String, String> javaPairDStream = javaInputDStream.mapToPair(new PairFunction<ConsumerRecord<String, String>, String, String>(){

             private static final long serialVersionUID = 1L;

             @Override

             public Tuple2<String, String> call(ConsumerRecord<String, String> consumerRecord) throws Exception {

                 return new Tuple2<>(consumerRecord.key(), consumerRecord.value());

             }

         });

         javaPairDStream.foreachRDD(new VoidFunction<JavaPairRDD<String,String>>() {

             @Override

             public void call(JavaPairRDD<String, String> javaPairRDD) throws Exception {

                 // TODO Auto-generated method stub

                 javaPairRDD.foreach(new VoidFunction<Tuple2<String,String>>() {

                     @Override

                     public void call(Tuple2<String, String> tuple2)

                             throws Exception {

                         // TODO Auto-generated method stub

                         System.out.println(tuple2._2);

                     }

                 });

             }

         });

         streamingContext.start();

         streamingContext.awaitTermination();

     }

 }

sparkStreaming获取kafka数据（java版本）的更多相关文章

SparkStreaming获取kafka数据的两种方式：Receiver与Direct
简介: Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式,可以简单理解成: Receiver方式是通过zookeeper来连接kafka队列, Dire ...
Scala创建SparkStreaming获取Kafka数据代码过程
正文首先打开spark官网,找一个自己用版本我选的是1.6.3的,然后进入SparkStreaming ,通过搜索这个位置找到Kafka, 点击过去会找到一段Scala的代码 import or ...
工具篇-Spark-Streaming获取kafka数据的两种方式（转载）
转载自:https://blog.csdn.net/weixin_41615494/article/details/7952173 一.基于Receiver的方式原理 Receiver从Kafka中 ...
Spark-Streaming获取kafka数据的两种方式：Receiver与Direct的方式
简单理解为:Receiver方式是通过zookeeper来连接kafka队列,Direct方式是直接连接到kafka的节点上获取数据 Receiver 使用Kafka的高层次Consumer API来 ...
spark-streaming获取kafka数据的两种方式
简单理解为:Receiver方式是通过zookeeper来连接kafka队列,Direct方式是直接连接到kafka的节点上获取数据一.Receiver方式: 使用kafka的高层次Consumer ...
SparkStreaming与Kafka，SparkStreaming接收Kafka数据的两种方式
SparkStreaming接收Kafka数据的两种方式 SparkStreaming接收数据原理一.SparkStreaming + Kafka Receiver模式二.SparkStreami ...
demo1 spark streaming 接收 kafka 数据java代码WordCount示例
1. 首先启动zookeeper windows上的安装见zk 02之 Windows安装和使用zookeeper 启动后见: 2. 启动kafka windows的安装kafka见Windows上搭 ...
spark-streaming读kafka数据到hive遇到的问题
在项目中使用spark-stream读取kafka数据源的数据,然后转成dataframe,再后通过sql方式来进行处理,然后放到hive表中, 遇到问题如下,hive-metastor在没有做高可用 ...
spark streaming 接收 kafka 数据java代码WordCount示例
http://www.cnblogs.com/gaopeng527/p/4959633.html

随机推荐

javascript 日期函数
获取当前日期的前一天的日期 var MyDate = new Date( ); //获取昨天的日期 var yesterday = myDate.getTime()-1000*60*60 ...
Win10系列：VC++ Direct3D图形绘制1
通过前面的介绍,相信读者已经了解了如何新建一个用于开发Direct3D应用程序的项目模版,以及这个项目模版中用于绘制立体图形的主要函数.在本小节中,将通过一个具体的示例来介绍如何使用Visual St ...
C++解析二
C++ 类访问修饰符数据封装是面向对象编程的一个重要特点,它防止函数直接访问类类型的内部成员.类成员的访问限制是通过在类主体内部对各个区域标记 public.private.protected 来指 ...
css 中的grid布局基础
CSS Grid Layout为CSS引入了一个二维网格系统.网格可用于布局主要页面区域或小型用户界面元素. 网格是一组交叉的水平和垂直线 - 一组定义列,其他行.元素可以放在网格上,以行或者列为标准 ...
iOS 10跳转到其他app
- (BOOL)jumpsToThirdAPP:(NSString *)urlStr{ if ([urlStr hasPrefix:@"mqq"] || [urlStr hasPr ...
４.4 C++虚析构函数
参考:http://www.weixueyuan.net/view/6373.html 总结: 构造函数是不能声明为虚函数的,析构函数可以被声明为虚函数. 将基类的析构函数声明为虚函数之后,派生类的析 ...
openstack网络DVR
一.DVR描述分布式路由二.相关的专业术语术语名称术语解释 SNAT 在路由器后(POSTROUTING)将内网的ip地址修改为外网网卡的ip地址,也就是绑定浮动IP和外部通信 DNAT 在路 ...
AssetBundle打包详解
Unity5.x AssetBundle打包详解在网上查看了很多资料,想详细搞清楚AssetBundle的原理.以实现符合项目需求的打包工具和加载逻辑 1. AssetBundle是什么? Asse ...
ChinaCock界面控件介绍-CCNavigateTitle
先看一下实际项目中的运行效果,如图,通过品牌的导航栏,显示不同品牌的商品列表. 完全基于ChinaCock控件包中CCNavigateTitle组件实现的,这是一个可视控件,从组件面板上拖放一个到Fo ...
Delphi revelations #1 – kbmMW Smart client on NextGen (Android) – Scope problems
Delphi 启示 #1 – kbmMW Smart client on NextGen (Android) – 作用域问题以更高级的方式使用kbmMW smart client,在Android设 ...

sparkStreaming获取kafka数据（java版本）

sparkStreaming获取kafka数据（java版本）的更多相关文章

随机推荐

热门专题