1.概述 在存储业务数据的时候,随着业务的增长,Hive 表存储在 HDFS 的上的数据会随时间的增加而增加,而以 Text 文本格式存储在 HDFS 上,所消耗的容量资源巨大.那么,我们需要有一种方式来减少容量的成本.而在 Hive 中,有一种 ORC 文件格式可以极大的减少存储的容量成本.今天,笔者就为大家分享如何实现流式数据追加到 Hive ORC 表中. 2.内容 2.1 ORC 这里,我们首先需要知道 Hive 的 ORC 是什么.在此之前,Hive 中存在一种 RC 文件,而 ORC…