近期由于Hadoop集群机器硬盘资源紧张,有需求让把 Hadoop 集群上的历史数据进行下压缩,开始从网上查找的都是关于各种压缩机制的对比,很少有关于怎么压缩的教程(我没找到..),再此特记录下本次压缩的过程,方便以后查阅,利己利人. 本文涉及的所有 jar包.脚本.native lib 见文末的相关下载 ~ 我的压缩版本: Jdk 1.7及以上 Hadoop-2.2.0 版本 压缩前环境准备: 关于压缩算法对比,网上资料很多,这里我用的是 Bzip2 的压缩方式,比较中庸,由于是Hadoop自…