为了便于可视化,样本数据为随机生成的二维样本点. from matplotlib import pyplot as plt import numpy as np import random def kmeans(a, k): def randomChoose(a, k): # 从数组a中随机选取k个元素,返回一个list args = np.arange(len(a)) # 元素下标 for i in range(k): x = np.random.randint(i, len(a)) args
K均值算法 上一期介绍了机器学习中的监督式学习,并用了离散回归与神经网络模型算法来解决手写数字的识别问题.今天我们介绍一种机器学习中的非监督式学习算法--K均值算法. 所谓非监督式学习,是一种与监督式学习相对的算法归类,是指样本并没有一个与之对应的"标签".例如上一期中的识别手写数字照片的例子,样本是照片的像素数据,而标签则是照片代表的数字.非监督式学习因为没有这个标签,因此就没有对样本的一个准确的"答案".非监督式学习主要是用来解决样本的聚类问题. K