Flink 在顺丰的应用实践

【Flink 在顺丰的应用实践】的更多相关文章

深度介绍Flink在字节跳动数据流的实践

本文是字节跳动数据平台开发套件团队在1月9日Flink Forward Asia 2021: Flink Forward 峰会上的演讲分享,将着重分享Flink在字节跳动数据流的实践. 字节跳动数据流的业务背景数据流处理的主要是埋点日志.埋点,也叫Event Tracking,是数据和业务之间的桥梁,是数据分析.推荐.运营的基石. 用户在使用App.小程序.Web等各种线上应用时产生的行为,主要通过埋点的形式进行采集上报,按不同的来源分为客户端埋点.Web端埋点.服务端埋点. 不同来源的埋点都…

字节跳动流式数据集成基于Flink Checkpoint两阶段提交的实践和优化

背景字节跳动开发套件数据集成团队(DTS ,Data Transmission Service)在字节跳动内基于 Flink 实现了流批一体的数据集成服务.其中一个典型场景是 Kafka/ByteMQ/RocketMQ -> HDFS/Hive .Kafka/ByteMQ/RocketMQ -> HDFS/Hive(下面均称之为 MQ dump,具体介绍可见字节跳动基于Flink的MQ-Hive实时数据集成 ) 在数仓建设第一层,对数据的准确性和实时性要求比较高. 目前字节跳动中国区 M…

Hudi on Flink在顺丰的实践应用

获取PDF版本请关注"实时流式计算" 后台回复 "flink1015"…

Flink 在人工智能领域的应用实践

人工智能是未来十年最重要的技术革命与驱动力,在各行各业产生着日益重要的作用,它与大数据的发展相辅相成,不仅推动人类社会迈入更智慧的世界,也为数据的应用带来无可估量的价值. 11 月 28 - 30 日,Flink Forward Asia 2019 人工智能专场将聚焦于 Flink 在机器学习上的新技术与新应用,内容包含: Flink 机器学习进度几何? 如何将 Flink 与 TensorFlow 等框架相结合? 有哪些 Flink 在机器学习上的生产实践应用? 为你呈现 Flink 机器学习…

美团点评基于 Flink 的实时数仓建设实践

https://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651749037&idx=1&sn=4a448647b3dae50779bc9ec0e9c10275&chksm=bd12a3e08a652af6ed8b305b0523716e08a81cf99296425cdaf2bbee1e9d8a6aca06c81cdcc1&scene=21#wechat_redirect 总第291篇 2018年第83篇引言…

flink ha zk集群迁移实践

flink为了保证线上作业的可用性,提供了ha机制,如果发现线上作业失败,则通过ha中存储的信息来实现作业的重新拉起. 我们在flink的线上环境使用了zk为flink的ha提供服务,但在初期,由于资源紧张,只是对zk进行了standalone的部署,但是在后期的使用中,发现单节点的集群很难提供很高的可用性, 所以就尝试将目前的standalone的zk服务扩展为cluster的zk服务,这其中,也踩了不少坑. 第一次尝试,将standalone的zk扩展为cluster 扩展为cluster很…

企业实践 | 如何更好地使用 Apache Flink 解决数据计算问题？

业务数据的指数级扩张,数据处理的速度可不能跟不上业务发展的步伐.基于 Flink 的数据平台构建.运用 Flink 解决业务场景中的具体问题等随着 Flink 被更广泛的应用于广告.金融风控.实时 BI.实时数仓.实时推荐等多种业务场景,在生产实践中已有丰富的案例与优秀的经验. Flink Forward Asia 倒计时 28 天,企业实践专题大会邀请了字节跳动.滴滴出行.快手.Bilibili.网易.爱奇艺.中国农业银行.奇虎360.贝壳找房.奇安信等不同行业一线技术专家分享 Apache…

基于 Flink 的实时数仓生产实践

数据仓库的建设是“数据智能”必不可少的一环,也是大规模数据应用中必然面临的挑战.在智能商业中,数据的结果代表了用户反馈.获取数据的及时性尤为重要.快速获取数据反馈能够帮助公司更快地做出决策,更好地进行产品迭代,实时数仓在这一过程中起到了不可替代的作用. 如何更好的建设实时数仓.有哪些优秀的生产实践经验可借鉴? 11月28-30日,Flink Forward Asia 邀请来自 Netflix.美团点评.小米.OPPO.菜鸟等数仓专家,聚焦 Flink 实时数仓在数据链路中扮演的角色与在智能商业中…

Apache Flink on K8s：四种运行模式，我该选择哪种？

1. 前言 Apache Flink 是一个分布式流处理引擎,它提供了丰富且易用的API来处理有状态的流处理应用,并且在支持容错的前提下,高效.大规模的运行此类应用.通过支持事件时间(event-time).计算状态(state)以及恰好一次(exactly-once)的容错保证,Flink迅速被很多公司采纳,成为了新一代的流计算处理引擎. 2020 年 2 月 11 日,社区发布了 Flink 1.10.0 版本, 该版本对性能和稳定性做了很大的提升,同时引入了 native Kubernet…

test_action

[TOP] 为什么百度校招数据挖掘工程师的笔试题目是跟数据挖掘关系不大? - 研究生生活交流 - 王道论坛,专注于计算机考研的点点滴滴! http://www.cskaoyan.com/thread-244995-1-3.html 笔试时间:2014-9-20 笔试职位:机器学习/数据挖掘工程师笔试城市:天津.深圳.南京等一. 简答题 1. new 和 malloc 的区别. 2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点. 3. 命中的概率是 0.25,若要至少命中一次…