本文首发于我的个人博客网站 等待下一个秋-Flink 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称.核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT.更新UPDATE.删除DELETE等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费. 1. 环境准备 mysql Hive flink 1.13.5 on yarn 说明:如果没有安装hadoop,那么可以不用yarn,直接用flink sta
0.概述 Hive对外提供了StorageHandler接口,提供了访问各种存储组件中的数据的能力.Hbase提供了HbaseStorageHandler,使得hive可以通过建立外部映射表访问hbase中的数据.但是,公司CDH集群的版本比较低,不支持新版hive原生的JdbcStorageHandler.因而要访问JDBC数据源中的数据,只能通过添加第三方类库实现. 1.Hive 访问Hbase use ods_sdb; create external table if not exists
hive 2.3.4 on spark 2.4.0 Hive on Spark provides Hive with the ability to utilize Apache Spark as its execution engine. set hive.execution.engine=spark; 1 version Hive on Spark is only tested with a specific version of Spark, so a given version of Hi