一.定义 ORC File,它的全名是Optimized Row Columnar (ORC) file,其实就是对RCFile做了一些优化. 据官方文档介绍,这种文件格式可以提供一种高效的方法来存储Hive数据.它的设计目标是来克服Hive其他格式的缺陷. 运用ORC File可以提高Hive的读.写以及处理数据的性能.和RCFile格式相比,ORC File格式有以下优点: (1).每个task只输出单个文件,这样可以减少NameNode的负载: (2).支持各种复杂的数据类型,比如: da…