(2017-05-02 银河统计) k-means算法,也被称为k-平均或k-均值,是数据挖掘技术中一种广泛使用的聚类算法. 它是将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类间独立. 一.计算步骤 设有n个m维向量\((X_{k1},X_{k2},\dots,X_{km}), k=1,2,\dots,n\), 1.在n个样本中随机选k个样本为簇心或类: 2.选定某种