最近看了吴恩达老师的机器学习教程(可以在Coursera,或者网易云课堂上找到)中讲解的k-means聚类算法,k-means是一种应用非常广泛的无监督学习算法,使用比较简单,但其背后的思想是EM算法(看李航老师统计学习方法看了半天还是没太明白,后面找了一篇博客,博主对EM算法讲解非常通俗易懂).这里对k-means算法和应用做一个小笔记,脑袋记不住那么多hh.本文用的数据和代码见github. 一.k-means算法 在介绍k-means算法之前,先看一个课程中使用k-means对二维数据进行…