增量导入 一.说明 当在生产环境中,我们可能会定期从与业务相关的关系型数据库向Hadoop导入数据,导入数仓后进行后续离线分析.这种情况下我们不可能将所有数据重新再导入一遍,所以此时需要数据增量导入. 增量导入数据分为两种方式: 一是基于递增列的增量数据导入(Append方式). 二是基于时间列的数据增量导入(LastModified方式). 二.增量导入 方式一:Append方式 比如:有一个订单表,里面每个订单有一个唯一标识自增列ID,在关系型数据库中以主键形式存在,之前已经将id在1-3的