Flink入门 - CoGroup和Join

/*

*CoGroup

*/ 

final StreamExecutionEnvironment streamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment(); 

        DataStream<Tuple2<String, String>> dataStream1 = streamExecutionEnvironment.socketTextStream("127.0.0.1", 9000)

                .map(new MapFunction<String, Tuple2<String, String>>() {

                    @Override

                    public Tuple2<String, String> map(String s) throws Exception {

                        List<String> strs = Arrays.asList(s.split(" "));

                        return new Tuple2<>(strs.get(0), strs.get(1));

                    }

                }); 

        DataStream<Tuple2<String, String>> dataStream2 = streamExecutionEnvironment.socketTextStream("127.0.0.1", 9001)

                .map(new MapFunction<String, Tuple2<String, String>>() {

                    @Override

                    public Tuple2<String, String> map(String s) throws Exception {

                        List<String> strs = Arrays.asList(s.split(" "));

                        return new Tuple2<>(strs.get(0), strs.get(1));

                    }

                }); 

        dataStream1.coGroup(dataStream2)

                .where(new KeySelector<Tuple2<String, String>, String>() {

                    @Override

                    public String getKey(Tuple2<String, String> stringStringTuple2) throws Exception {

                        return stringStringTuple2.f0;

                    }

                })

                .equalTo(new KeySelector<Tuple2<String, String>, String>() {

                    @Override

                    public String getKey(Tuple2<String, String> stringStringTuple2) throws Exception {

                        return stringStringTuple2.f0;

                    }

                })

                .window(ProcessingTimeSessionWindows.withGap(Time.seconds(30)))

                .trigger(CountTrigger.of(1))

                .apply(new CoGroupFunction<Tuple2<String, String>, Tuple2<String, String>, String>() {

                    @Override

                    public void coGroup(Iterable<Tuple2<String, String>> first, Iterable<Tuple2<String, String>> second, Collector<String> out) throws Exception {

                        StringBuilder stringBuilder = new StringBuilder("Data Stream1: \n");

                        first.forEach(item -> stringBuilder.append(item.f0 + "<=>" + item.f1 + "\n")); 

                        stringBuilder.append("Data Stream2: \n");

                        second.forEach(item -> stringBuilder.append(item.f0 + "<=>" + item.f1 + "\n"));

                        out.collect(stringBuilder.toString());

                    }

                }).print(); 

        streamExecutionEnvironment.execute();

/**

* Join

* Join条件为两个流中的数据((String, String))的第一个元素相同

*/

final StreamExecutionEnvironment streamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment(); 

        DataStream<Tuple2<String, String>> dataStream1 = streamExecutionEnvironment.fromElements(new Tuple2<>("hello", "flink")); 

        DataStream<Tuple2<String, String>> dataStream2 = streamExecutionEnvironment.fromElements(new Tuple2<>("hello", "blink")); 

        dataStream1.join(dataStream2)

                .where(new KeySelector<Tuple2<String, String>, String>() {

                    @Override

                    public String getKey(Tuple2<String, String> stringStringTuple2) throws Exception {

                        return stringStringTuple2.f0;

                    }

                })

                .equalTo(new KeySelector<Tuple2<String, String>, String>() {

                    @Override

                    public String getKey(Tuple2<String, String> stringStringTuple2) throws Exception {

                        return stringStringTuple2.f0;

                    }

                })

                .window(ProcessingTimeSessionWindows.withGap(Time.seconds(30)))

                .trigger(CountTrigger.of(1))

                .apply(new JoinFunction<Tuple2<String, String>, Tuple2<String, String>, String>() {

                    @Override

                    public String join(Tuple2<String, String> first, Tuple2<String, String> second) throws Exception {

                        return first.f1 + "<=>" + second.f1;

                    }

                }).print();

        streamExecutionEnvironment.execute(); 

// 运行结果

2> flink<=>blink

Flink入门 - CoGroup和Join的更多相关文章

Flink学习笔记：Operators之CoGroup及Join操作
本文为<Flink大数据项目实战>学习笔记,想通过视频系统学习Flink这个最火爆的大数据计算框架的同学,推荐学习课程: Flink大数据项目实战:http://t.cn/EJtKhaz ...
Flink入门（五）——DataSet Api编程指南
Apache Flink Apache Flink 是一个兼顾高吞吐.低延迟.高性能的分布式处理框架.在实时计算崛起的今天,Flink正在飞速发展.由于性能的优势和兼顾批处理,流处理的特性,Flink ...
Flink入门（四）——编程模型
flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性.高吞吐.低延迟等优势,本文简述flink的编程模型. 数据集类型: 无穷数据集:无穷的持续集成的数据集合有界数据集:有 ...
Flink入门-第一篇：Flink基础概念以及竞品对比
Flink入门-第一篇:Flink基础概念以及竞品对比 Flink介绍截止2021年10月Flink最新的稳定版本已经发展到1.14.0 Flink起源于一个名为Stratosphere的研究项目主 ...
Flink入门（二）——Flink架构介绍
1.基本组件栈了解Spark的朋友会发现Flink的架构和Spark是非常类似的,在整个软件架构体系中,同样遵循着分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富 ...
Flink入门（三）——环境与部署
flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性.高吞吐.低延迟等优势,本文简述flink在windows和linux中安装步骤,和示例程序的运行,包括本地调试环境,集群 ...
不一样的Flink入门教程
前言微信搜[Java3y]关注这个朴实无华的男人,点赞关注是对我最大的支持! 文本已收录至我的GitHub:https://github.com/ZhongFuCheng3y/3y,有300多篇原创 ...
flink 入门
http://ifeve.com/flink-quick-start/ http://vinoyang.com/2016/05/02/flink-concepts/ http://wuchong.me ...
第02讲：Flink 入门程序 WordCount 和 SQL 实现
我们右键运行时相当于在本地启动了一个单机版本.生产中都是集群环境,并且是高可用的,生产上提交任务需要用到flink run 命令,指定必要的参数. 本课时我们主要介绍 Flink 的入门程序以及 SQ ...

随机推荐

蓝牙BLE：蓝牙(BLE)协议栈
蓝牙协议是通信协议的一种,一般而言,我们把某个协议的实现代码称为协议栈(protocol stack),BLE协议栈就是实现低功耗蓝牙协议的代码,理解和掌握BLE协议是实现BLE协议栈的前提.当前的蓝 ...
【JavaScript】frame跨域访问元素
什么是跨frame访问元素呢?比如main.html中有如下代码: <frameset cols="50%,*"> <frame src="frame1 ...
Openresty与Tengine
Tengine官方网站:http://tengine.taobao.org/index_cn.html OpenResty官方网站:http://openresty.org/ Openresty和Te ...
java agent 详细介绍 -javaagent参数
java agent 详细介绍简介 java agent是java命令的一个参数.参数 javaagent 可以用于指定一个 jar 包,并且对该 java 包有2个要求: 这个 jar 包的MAN ...
执行redis命令redis-trib.rb查看集群信息报错cannot load such file -- redis (LoadError)
问题描述: 在执行redis-trib.rb命令查看集群状态的时候,报错: [aiprd@hadoop1 ~]$ redis-trib.rb check Traceback (most recent ...
VUE-012-图表 v-charts 学习（一）饼图展示状态
软件质量平台中需要输出各种各样的图表数据,以 v-charts 中的饼图为例,记录图表使用实现过程. v-charts :https://github.com/ElemeFE/v-charts doc ...
Angular8开发拼多多WebApp_汇总贴
https://coding.imooc.com/class/336.html?mc_marking=b9f5e475d0cb8922d899d416f5b4433f&mc_channel=s ...
k8s记录-docker导入导出改标签
docker save <repository>:<tag> -o <repository>.tar docker save mysql:latest -o m ...
Docker容器中启动OPMS项目
1.上传opms项目包到Linux下面 2.解压赋权 3.执行文件即可 4.浏览器输入服务器ip地址加上8088端口号
Appium脚本(4) 使用uiautomator方法定位元素
from app.find_element.capability import driver from time import sleep # 使用uiautomator方法定位元素 accunt_i ...

Flink入门 - CoGroup和Join

Flink入门 - CoGroup和Join的更多相关文章

随机推荐

热门专题