(1)k-mean聚类 k-mean聚类比较容易理解就是一个计算距离,找中心点,计算距离,找中心点反复迭代的过程, 给定样本集D={x1,x2,...,xm},k均值算法针对聚类所得簇划分C={C1,C2,...,Ck}最小化平方误差 μi表示簇Ci的均值向量,在一定程度上刻画了簇内样本围绕均值向量的紧密程度,E值越小则簇内样本相似度越高. 下边是k均值算法的具体实现的算法 k均值算法的缺点是:(1)对于离群点和孤立点敏感:(2)k值选择; (3)初始聚类中心的选择: (4)只能发现球状簇. k