网易游戏基于 Flink 的流式 ETL 建设

【网易游戏基于 Flink 的流式 ETL 建设】的更多相关文章

Plink v0.1.0 发布——基于Flink的流处理平台

Plink是一个基于Flink的流处理平台,旨在基于 [Apache Flink]封装构建上层平台. 提供常见的作业管理功能.如作业的创建,删除,编辑,更新,保存,启动,停止,重启,管理,多作业模板配置等. Flink SQL 编辑提交功能.如 SQL 的在线开发,智能提示,格式化,语法校验,保存,采样,运行,测试,集成 Kafka 等. 由于项目刚刚启动,未来还有很长的路要走,让我们拭目以待. 在 Windows 上部署 Plink Plink 进行独立单机部署,可以在 Windows 上进行…

基于grpc的流式方式实现双向通讯(python)

grpc介绍 grpc是谷歌开源的一套基于rpc实现的通讯框架(官网有更完整的定义).在搞懂grpc之前,首先要弄懂rpc是什么.下面是自己理解的rpc定义,若有不对,望指出: rpc官方称为远程过程调用 .我这里理解为远程函数调用,即一个本机程序调用另一个机器的程序中的某个函数.因不是同一机器调用,故需要远程访问操作. 与远程过程调用相反的则是"近程过程调用"(哈哈,自己乱起的).其实就是实现和调用都在同一个机器的程序中.比如,学过面向对象语言的(如java)可以解释为:一个类中实…

美团点评基于 Flink 的实时数仓建设实践

https://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651749037&idx=1&sn=4a448647b3dae50779bc9ec0e9c10275&chksm=bd12a3e08a652af6ed8b305b0523716e08a81cf99296425cdaf2bbee1e9d8a6aca06c81cdcc1&scene=21#wechat_redirect 总第291篇 2018年第83篇引言…

flink 流式处理中如何集成mybatis框架

flink 中自身虽然实现了大量的connectors,如下图所示,也实现了jdbc的connector,可以通过jdbc 去操作数据库,但是flink-jdbc包中对数据库的操作是以ROW来操作并且对数据库事务的控制比较死板,有时候操作关系型数据库我们会非常怀念在java web应用开发中的非常优秀的mybatis框架,那么其实flink中是可以自己集成mybatis进来的. 我们这里以flink 1.9版本为例来进行集成. 如下图为flink内部自带的flink-jdbc. 创建一个flin…

Nebula Graph 在网易游戏业务中的实践

本文首发于 Nebula Graph Community 公众号当游戏上知识图谱,网易游戏是如何应对大规模图数据的管理问题,Nebula Graph 又是如何帮助网易游戏落地游戏内复杂的图的业务呢?在本文,我们来一探究竟. 游戏中的图数据目前网易游戏大部分的产品都是在线游戏,作为国际领先的头部游戏厂商,网易所吸引的在线玩家数量也是众多的,那么大量的玩家登录我们的游戏势必产生大量各种操作性数据. 如上图中间显示的交易数据--玩家可以购买商城里的物品,或者直接购买其他玩家的物品:社交数据--加好…

Apache Hudi 0.9.0版本重磅发布！更强大的流式数据湖平台

1. 重点特性 1.1 Spark SQL支持 0.9.0 添加了对使用 Spark SQL 的 DDL/DML 的支持,朝着使所有角色(非工程师.分析师等)更容易访问和操作 Hudi 迈出了一大步. 用户现在可以使用 CREATE TABLE....USING HUDI 和 CREATE TABLE .. AS SELECT 语句直接在 Hive 等目录中创建和管理表. 然后用户可以使用 INSERT.UPDATE.MERGE INTO 和 DELETE 语句来操作数据. 此外,INSERT…

流式处理的新贵 Kafka Stream - Kafka设计解析（七）

原创文章,转载请务必将下面这段话置于文章开头处. 本文转发自技术世界,原文链接 http://www.jasongj.com/kafka/kafka_stream/ Kafka Stream背景 Kafka Stream是什么 Kafka Stream是Apache Kafka从0.10版本引入的一个新Feature.它是提供了对存储于Kafka内的数据进行流式处理和分析的功能. Kafka Stream的特点如下: Kafka Stream提供了一个非常简单而轻量的Library,它可以非常方…

Apple公司Darwin流式服务器源代码分析

当前,伴随着Internet的飞速发展,计算机网络已经进入到每一个普通人的家庭.在这个过程中,一个值得我们关注的现象是:Internet中存储和传输内容的构成已经发生了本质的改变,从传统的基于文本或少量图像的主页变为大容量.富信息量的流式媒体信息.一份早在1998年提交的研究报告就曾指出,流式媒体统治Internet的潮流是不可抗拒的,该报告估计到2003年,存储在网络服务器上的内容超过50%的将是流式媒体信息.但今天看来,这个估计还是有些保守了.所谓的流式媒体简单的讲就是指人们通过网络实时的收…

Spark Streaming流式处理

Spark Streaming介绍 Spark Streaming概述 Spark Streaming makes it easy to build scalable fault-tolerant streaming applications. 它可以非常容易的构建一个可扩展.具有容错机制的流式应用. 对接很多的外部数据源 Kafka.Flume.Twitter.ZeroMQ和简单的TCP套接字(socket)等等 Spark Streaming特性 1.易用性可以像编写离线批处理一样去编写流…

Spark之 Spark Streaming流式处理

SparkStreaming Spark Streaming类似于Apache Storm,用于流式数据的处理.Spark Streaming有高吞吐量和容错能力强等特点.Spark Streaming支持的数据源有很多,例如:Kafka.Flume.Twitter.ZeroMQ和简单的TCP套接字等等.数据输入后可以用Spark的高度抽象操作如:map.reduce.join.window等进行运算.而结果也能保存在很多地方,如HDFS,数据库等. 特性 1.易用性可以像编写离线批处理一样去…