(转载请注明出处：http://blog.csdn.net/buptgshengod)

1.背景

今后博主会每周定时更新机器学习算法及其python的简单实现。今天学习的算法是KNN近邻算法。KNN算法是一个监督学习分类器类别的算法。

什么是监督学习，什么又是无监督学习呢。监督学习就是我们知道目标向量的情况下所使用的算法，无监督学习就是当我们不知道详细的目标变量的情况下所使用的。而监督学习又依据目标变量的类别（离散或连续）分为分类器算法和回归算法。

k-Nearest Neighbor。k是算法中的一个约束变量，整个算法的整体思想是比較简单的，就是将数据集的特征值看作是一个个向量。我们给程序一组特征值，如果有三组特征值，就能够看做是（x1，x2，x3）。系统原有的特征值就能够看做是一组组的（y1，y2，y3）向量。通过求两向量间的距离，我们找出前k个距离最短的y的特征值对。这些y值所相应的目标变量就是这个x特征值的分类。

公式：

2.python基础之numpy

numpy是python的一个数学计算库，主要是针对一些矩阵运算，这里我们会大量用到它。介绍一下本章代码中用到的一些功能。

arry：是numpy自带的数组表示，比方本例中的4行2列数字能够这样输入

group=array([[9,400],[200,5],[100,77],[40,300]])

shape:显示（行，列）例：shape(group)=(4,2)

zeros:列出一个同样格式的空矩阵，例：zeros（group）=（[[0,0],[0,0],[0,0],[0,0]]）

tile函数位于python模块 numpy.lib.shape_base中，他的功能是反复某个数组。比方tile(A,n)，功能是将数组A反复n次，构成一个新的数组

sum(axis=1)矩阵每一行向量相加

3.数据集

4.代码

代码分三个函数，各自是

创建数据集：

createDataset

from __future__ import division

from numpy import *

import operator

def createDataset():

        group=array([[9,400],[200,5],[100,77],[40,300]])

        labels=['1','2','3','1']

        return group,labels

数据归一化：

autoNorm

def autoNorm(dataSet):

    minVals = dataSet.min(0)

    maxVals = dataSet.max(0)

    ranges = maxVals - minVals

    normDataSet = zeros(shape(dataSet))

    m = dataSet.shape[0]

    normDataSet = dataSet - tile(minVals, (m,1))

    #print normDataSet

    normDataSet = normDataSet/tile(ranges, (m,1)) #element wise divide

   # print normDataSet

    return normDataSet, ranges, minVals

分类函数:

classify

def classify(inX, dataSet, labels, k):

    dataSetSize = dataSet.shape[0]

    diffMat = tile(inX, (dataSetSize,1)) - dataSet

    sqDiffMat = diffMat**2

    sqDistances = sqDiffMat.sum(axis=1)

    distances = sqDistances**0.5

    sortedDistIndicies = distances.argsort()

    classCount={}

    for i in range(k):

        voteIlabel = labels[sortedDistIndicies[i]]

        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1

    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)

    return sortedClassCount[0][0]

5.显示结果

6.代码下载

下载地址

【机器学习算法-python实现】KNN-k近邻算法的实现（附源代码）的更多相关文章

web安全之机器学习入门——3.1 KNN/k近邻
目录 sklearn.neighbors.NearestNeighbors 参数/方法基础用法用于监督学习检测异常操作(一) 检测异常操作(二) 检测rootkit 检测webshell skl ...
《机器学习实战》---第二章 k近邻算法 kNN
下面的代码是在python3中运行, # -*- coding: utf-8 -*- """ Created on Tue Jul 3 17:29:27 2018 @au ...
数据挖掘算法（一）--K近邻算法（KNN）
数据挖掘算法学习笔记汇总数据挖掘算法(一)–K近邻算法 (KNN) 数据挖掘算法(二)–决策树数据挖掘算法(三)–logistic回归算法简介 KNN算法的训练样本是多维特征空间向量,其中每个训 ...
机器学习算法及代码实现–K邻近算法
机器学习算法及代码实现–K邻近算法 1.K邻近算法将标注好类别的训练样本映射到X(选取的特征数)维的坐标系之中,同样将测试样本映射到X维的坐标系之中,选取距离该测试样本欧氏距离(两点间距离公式)最近 ...
第四十六篇入门机器学习——kNN - k近邻算法（k-Nearest Neighbors）
No.1. k-近邻算法的特点 No.2. 准备工作,导入类库,准备测试数据 No.3. 构建训练集 No.4. 简单查看一下训练数据集大概是什么样子,借助散点图 No.5. kNN算法的目的是,假如 ...
基本分类方法——KNN(K近邻)算法
在这篇文章 http://www.cnblogs.com/charlesblc/p/6193867.html 讲SVM的过程中,提到了KNN算法.有点熟悉,上网一查,居然就是K近邻算法,机器学习的入门 ...
用Python从零开始实现K近邻算法
KNN算法的定义: KNN通过测量不同样本的特征值之间的距离进行分类.它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别.K通 ...
KNN K~近邻算法笔记
K~近邻算法是最简单的机器学习算法.工作原理就是:将新数据的每一个特征与样本集中数据相应的特征进行比較.然后算法提取样本集中特征最相似的数据的分类标签.一般来说.仅仅提取样本数据集中前K个最相似的数据 ...
KNN (K近邻算法) - 识别手写数字
KNN项目实战——手写数字识别 1. 介绍 k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法.它的工作原理是:存在一个 ...

随机推荐

Hosting WCF Service
之前在博客几个实例DemoWCF服务寄宿到控制到应用程序中,这篇来总结一下,经常使用的几种宿主的方式. 1.Self-Hosting 一个WCF服务可以寄宿在控制台应用程序或者WinForms app ...
如何js编译的文件dll对于网页电话
1. 加入一个项目的解决方案:JSControl 2. 在这个项目中加入js文件(JScript1.js) 脚本的内容: function showAlert(){ alert('Today is a ...
添加服务引用和添加Web引用对比
原文:添加服务引用和添加Web引用对比在WindowsForm程序中添加服务引用和Web引用对比为了验证书上有关Visual Studio 2010添加服务引用和Web引用的区别,进行实验. 一. ...
给Activity设置Dialog属性，点击区域外消失；
1.在AndroidManifest.xml中给Activity设置样式: <activity android:name=".MyActivity" ...
程序猿常识--OJ系统和ACM测试考试大全
OJ它是Online Judge缩写系统,来在线检測程序源码的正确性. 著名的OJ有RQNOJ.URAL等. 国内著名的题库有北京大学题库.浙江大学题库等. 国外的题库包含乌拉尔大学.瓦拉杜利德大学题 ...
Duanxx的Altium Designer学习：PCB试想一下，在目前的水平
1 Shift+S 这个快捷键能高亮当前层,而且使其它层变成灰色.见下图: 2 隐藏指定层在图中右下角的地方,右键.会弹出一个选项条.选择Hide Layers.能够选择想要隐藏的 ...
相关Python分割操作
刚论坛python文本 http://bbs.byr.cn/#!article/Python/1693 攻克了一个关于python分片的问题. 问题: uesrList = ['1','2','3', ...
Android Activity之间通信
package com.example.myapp; import android.app.Activity; import android.content.DialogInterface; impo ...
swift类名称显示变量
<span style="background-color: rgb(255, 255, 255); color: rgb(51, 51, 51); font-family: Aria ...
java假设去请求一个网页的数据
我们能够通过在java程序中模拟浏览器一样,把数据抓下来,详细方法是在java程序中set header和cookie,以下是一个样例: public class NetConnection { pu ...

【机器学习算法-python实现】KNN-k近邻算法的实现（附源代码）