目录 1 - 为什么要合并小文件 2 - 合并本地的小文件,上传到 HDFS 3 - 合并 HDFS 的小文件,下载到本地 4 - 通过 Java API 实现文件合并和上传 版权声明 1 - 为什么要合并小文件 HDFS 擅长存储大文件: 我们知道,HDFS 中,每个文件都有各自的元数据信息,如果 HDFS 中有大量的小文件,就会导致元数据爆炸,集群管理的元数据的内存压力会非常大. 所以在项目中,把小文件合并成大文件,是一种很有用也很常见的优化方法. 2 - 合并本地的小文件,上传到 HDFS…