小编最近入坑风控,在工作中需要对数据进行等频率切分,也就是将数据划分成几段,在每段中,数据的出现频率,出现次数是大致相同的,让数据集在每段上呈现出分布均匀的趋势. 小编先是想到df.describe cutlist = data[col].describe() 出来的结果是: 描述结果分别就是 计数,均值,标准差,最小,四分位数,最大值 我要的是十分位,那就要借助describe的参数percentiles 了,percentiles 中可以存放切分点的列表 cutlist = data[col