k 近邻算法是一种基本分类与回归方法.我现在只是想讨论分类问题中的k近邻法.k近邻算法的输入为实例的特征向量,对应于特征空间的点,输出的为实例的类别.k邻近法假设给定一个训练数据集,其中实例类别已定.分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测.下面主要叙述k近邻算法,k近邻算法的模型和三个基本要素(距离度量.k值的选择.分类决策规则) k近邻算法 k近邻算法简单.直观:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最近邻的k个实例,这k个实例
K均值算法 上一期介绍了机器学习中的监督式学习,并用了离散回归与神经网络模型算法来解决手写数字的识别问题.今天我们介绍一种机器学习中的非监督式学习算法--K均值算法. 所谓非监督式学习,是一种与监督式学习相对的算法归类,是指样本并没有一个与之对应的"标签".例如上一期中的识别手写数字照片的例子,样本是照片的像素数据,而标签则是照片代表的数字.非监督式学习因为没有这个标签,因此就没有对样本的一个准确的"答案".非监督式学习主要是用来解决样本的聚类问题. K