上一个word count的案例中,我们为了理解mapreduce的流程,写了上面的代码.现在我们要把一个实体类序列化.比如现在有这么一个文件,里面的数据格式是这样的: 第一列是时间戳,第二列是手机号码,第三列是设备的物理地址,第四列是访问网站的ip地址,第五列是网站域名,第六列是数据包,下一列是接包数,关键是最后三列,上行流量,下行流量,最后一列是状态码. 现在我们要统计每个手机号的上行流量总和,下行流量总和,以及上下行流量总和.在这里我们要用到第二列,倒数第二列,导数第三列数据,这个时候基本