幂次法则分布和高斯分布是两种广泛存在的数学分布.可以预测和统计相关数据. pig中用其处理数据倾斜,实现负载均衡. 个体的规模和其名次之间存在着幂次方的反比关系,R(x)=ax(-b次方) 其中,x为规模(如:人口.成绩.营业额-),R(x)为其名次(第1名的规模最大),a为系数,b为幂次.当二边均取对数(log)时,公式成为log(R(x)) = log(a) - b˙log(x).若以log(R(x))为X轴,log(x)为Y轴,其分布图呈直线,斜率为负.斜率之绝对值越小,代表规模差异越小.