一:Kmeans算法基本思想: k-means算法是一种很常见的聚类算法,它的基本思想是:通过迭代寻找k个聚类的一种划分方案,使得用这k个聚类的均值来代表相应各类样本时所得的总体误差最小. k-means算法的基础是最小误差平方和准则.其代价函数是: 式中,μc(i)表示第i个聚类的均值.我们希望代价函数最小,直观的来说,各类内的样本越相似,其与该类均值间的误差平方越小,对所有类所得到的误差平方求和,即可验证分为k类时,各聚类是否是最优的.上式的代价函数无法用解析的方法最小化,只能有迭代的方法.