因为对控制文件的分片数目,进而控制文件的map个数非常感兴趣,因此有查找如下资料的需求.下面来看看我总结的吧:) 当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的block size,这导致HDFS上不同文件的block size是不同的.有时候我们需要知道HDFS上某个文件的block size,比如想知道该该文件作为job的输入会创建几个map等.Hadoop FS Shell提供了一个-stat选项可以达到目的.官方文档描述这个选项时遗漏了可选参数.-sta…