用hive来做数仓类操作,或者大数据的运算,是没有疑问的,至少在你没有更多选择之前. 当我们要hive来做类似于大批量数据的select时,也许问题就会发生了变化. 1. 通用解决方案之分页 首先,我们要基于一个事实,就是没有哪个数据库可以无限制的提供我们select任意数据量的数据.比如常用的 mysql, oracle, 一般你select 10w左右的数据量时已经非常厉害了.而我们的解决方法也比较简单,那就是分页获取,比如我一页取1w条,直到取完为止.同样,因为hive基于都支持sql92…