k-近邻算法实例

1. 简单例子

步骤

1.1 计算已知点和被求点的距离

1.2 按距离递增排序

1.3 求出距离最近的前k个点的类别最大值作为目标分类

from numpy import *

import operator

def createDateSet():

    group = array([[1.0,1.1], [1.0,1.0], [0,0], [0,0.1]])

    labels = ['A', 'A', 'B', 'B']

    return group, labels

def classify0(inX, dataSet, labels, k):

    dataSetSize = dataSet.shape[0]

    diffMat = tile(inX, (dataSetSize,1)) - dataSet

    sqDiffMat = diffMat ** 2

    sqDistances = sqDiffMat.sum(axis=1)

    distance = sqDistances ** 0.5

    sortDistIndices = distance.argsort()

    classCount = {}

    for i in range(k):

        voteIlable = labels[sortDistIndices[i]]

        classCount[voteIlable] = classCount.get(voteIlable, 0) + 1

    sortedClassCount = sorted(classCount.iteritems(),

                              key = operator.itemgetter(1), reverse=True)

    return sortedClassCount[0][0]

if __name__ == "__main__":

    group, labels = createDateSet()

    inX = [1.1, 0.2]

    k = 3

    aimClass = classify0(inX, group, labels, k)

    print aimClass

语法解析

a. shape()得到矩阵的各个维度的长度

b. tile，举例

>>> a

[1, 2]

>>> tile(a, 2)

array([1, 2, 1, 2])

>>> tile(a, (2,2))

array([[1, 2, 1, 2],

       [1, 2, 1, 2]])

>>> tile(a, (3, 2,2))

array([[[1, 2, 1, 2],

        [1, 2, 1, 2]],

       [[1, 2, 1, 2],

        [1, 2, 1, 2]],

       [[1, 2, 1, 2],

        [1, 2, 1, 2]]])

c. sortDistIndices = distance.argsort() 得到排序后的名次，越大名次越大

d. sortedClassCount = sorted(classCount.iteritems(), key = operator.itemgetter(1), reverse=True) 对字典的值进行逆序（降序）排序

k-近邻算法实例的更多相关文章

从K近邻算法谈到KD树、SIFT+BBF算法
转自 http://blog.csdn.net/v_july_v/article/details/8203674 ,感谢july的辛勤劳动前言前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章 ...
k近邻算法
k 近邻算法是一种基本分类与回归方法.我现在只是想讨论分类问题中的k近邻法.k近邻算法的输入为实例的特征向量,对应于特征空间的点,输出的为实例的类别.k邻近法假设给定一个训练数据集,其中实例类别已定. ...
机器学习——KNN算法（k近邻算法）
一 KNN算法 1. KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分 ...
<转>从K近邻算法、距离度量谈到KD树、SIFT+BBF算法
转自 http://blog.csdn.net/likika2012/article/details/39619687 前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章待写:1.KD树:2.神经 ...
分类算法----k近邻算法
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的 ...
1. K近邻算法（KNN）
1. K近邻算法(KNN) 2. KNN和KdTree算法实现 1. 前言 K近邻法(k-nearest neighbors,KNN)是一种很基本的机器学习方法了,在我们平常的生活中也会不自主的应用, ...
用Python从零开始实现K近邻算法
KNN算法的定义: KNN通过测量不同样本的特征值之间的距离进行分类.它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别.K通 ...
K近邻算法小结
什么是K近邻? K近邻一种非参数学习的算法,可以用在分类问题上,也可以用在回归问题上. 什么是非参数学习? 一般而言,机器学习算法都有相应的参数要学习,比如线性回归模型中的权重参数和偏置参数,SVM的 ...
[转]K近邻算法
什么是K近邻算法何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:K个最近的邻居,当K=1时,算法便成了最近邻算法,即 ...
算法入门系列2：k近邻算法
用官方的话来说,所谓K近邻算法(k-Nearest Neighbor,KNN),即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个 ...

随机推荐

vsftpd 安装
vsftpd 安装这里有最简洁的安装步骤理想流程 [root@itdragon ~]# useradd ftpuser [root@itdragon ~]# passwd ftpuser Chan ...
安装freemarker模板的ftl插件
安装freemarker模板的ftl插件同意协议等待运行完成重新启动eclipse 查看是否生效
常用接口简析2---IComparable和IComparer接口的简析
常用接口的解析(链接) 1.IEnumerable深入解析 2.IEnumerable.IEnumerator接口解析 3.IList.IList接口解析默认情况下,对象的Equals(object ...
springboot + redis缓存使用
[参照资料] 1.spring boot 官网文档 2.https://www.cnblogs.com/gdpuzxs/p/7222309.html [项目结构] [pom.xml配置] <?x ...
2723:不吉利日期-poj
2723:不吉利日期总时间限制: 1000ms 内存限制: 65536kB 描述在国外,每月的13号和每周的星期5都是不吉利的.特别是当13号那天恰好是星期5时,更不吉利.已知某年的一月一日是 ...
python自动发邮件库yagmail
#### 一般发邮件方法我以前在通过Python实现自动化邮件功能的时候是这样的: import smtplib from email.mime.text import MIMEText from ...
ATL实现ActiveX插件
文章属于原创,转载请联系本人.有参照两个博客(http://blog.csdn.net/jiangtongcn/article/details/13509633 http://blog.csdn.ne ...
51Nod 1108 距离之和最小 V2 1096 距离之和最小中位数性质
1108 距离之和最小 V2基准时间限制:1 秒空间限制:131072 KB 分值: 40 难度:4级算法题收藏关注三维空间上有N个点, 求一个点使它到这N个点的曼哈顿距离之和最小,输出这个最小 ...
16进制到byte转换
我们经常会看到这样的语法 (byte) 0xAD 0xAD实际是个16进制,转换成二进制为:10101101,转换成10进制是:173,它是个正数 10101101只是int的简写,int由4个byt ...
c语言的发展历程
C语言的发展颇为有趣.它的原型ALGOL 60语言. 1963年,剑桥大学将ALGOL 60语言发展成为CPL(Combined Programming Language)语言. 1967年,剑桥大学 ...

k-近邻算法实例

1. 简单例子

k-近邻算法实例的更多相关文章

随机推荐

热门专题