聚类算法,不是分类算法. 分类算法是给一个数据,然后判断这个数据属于已分好的类中的具体哪一类. 聚类算法是给一大堆原始数据,然后通过算法将其中具有相似特征的数据聚为一类. 这里的k-means聚类,是事先给出原始数据所含的类数,然后将含有相似特征的数据聚为一个类中. 所有资料中还是Andrew Ng介绍的明白. 首先给出原始数据{x1,x2,...,xn},这些数据没有被标记的. 初始化k个随机数据u1,u2,...,uk.这些xn和uk都是向量. 根据下面两个公式迭代就能求出最终所有的u,这些