python实现简单分类knn算法

原理：计算当前点（无label，一般为测试集）和其他每个点（有label，一般为训练集）的距离并升序排序，选取k个最小距离的点，根据这k个点对应的类别进行投票，票数最多的类别的即为该点所对应的类别。
代码实现（数据集采用的是iris）：

 import numpy as np

 from sklearn.datasets import load_iris

 from sklearn.model_selection import train_test_split

 from sklearn import neighbors

 from sklearn.metrics import accuracy_score

 def get_iris():

     iris_data = load_iris()

     X_train, X_test, y_train, y_test = train_test_split(iris_data.data, iris_data.target, test_size=0.4, random_state=0)

     return X_train, X_test, y_train, y_test

 def knn_classify(self_point, dataset, labels, k):

     distance = [np.sqrt(sum((self_point - d)**2)) for d in dataset]

     train_data = zip(distance, labels)

     train_data = sorted(train_data, key=lambda x: x[0])[:k]

     self_label = {}

     for i in train_data:

         i = str(i[1])

         self_label[i] = self_label.setdefault(i, 0) + 1

     self_label = sorted(self_label, key=self_label.get, reverse=True)

     return self_label[0]

 X_train, X_test, y_train, y_test = get_iris()

 size = len(y_test)

 count = 0

 for t in range(len(X_test)):

     y_pre = knn_classify(X_test[t], X_train, y_train, 5)

     if y_pre == str(y_test[t]):

         count += 1

 print('custom的准确率： ', count / size)

 # 使用sklearn内置的KNN

 knn = neighbors.KNeighborsClassifier(n_neighbors=5)

 knn.fit(X_train, y_train)

 pre = knn.predict(X_test)

 print('sklearn的准确率: ', accuracy_score(y_test, pre))

对比结果：
custom的准确率： 0.95
sklearn的准确率: 0.95

python实现简单分类knn算法的更多相关文章

python 实现简单的KNN算法
from numpy import * import operator def createDataSet(): group = array([[3,104],[2,100],[1,81],[101, ...
机器学习经典算法具体解释及Python实现--K近邻(KNN)算法
(一)KNN依旧是一种监督学习算法 KNN(K Nearest Neighbors,K近邻 )算法是机器学习全部算法中理论最简单.最好理解的.KNN是一种基于实例的学习,通过计算新数据与训练数据特征值 ...
[Python]基于K-Nearest Neighbors[K-NN]算法的鸢尾花分类问题解决方案
看了原理,总觉得需要用具体问题实现一下机器学习算法的模型,才算学习深刻.而写此博文的目的是,网上关于K-NN解决此问题的博文很多,但大都是调用Python高级库实现,尤其不利于初级学习者本人对模型的理 ...
吴裕雄--天生自然python机器学习实战：K-NN算法约会网站好友喜好预测以及手写数字预测分类实验
实验设备与软件环境硬件环境:内存ddr3 4G及以上的x86架构主机一部系统环境:windows 软件环境:Anaconda2(64位),python3.5,jupyter 内核版本:window ...
Python简单实现KNN算法
__author__ = '糖衣豆豆' from numpy import * from os import listdir import operator #从列方向扩展 #tile(a,(size ...
python机器学习一：KNN算法实现
所谓的KNN算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个 ...
机器学习--最邻近规则分类KNN算法
理论学习: 3. 算法详述 3.1 步骤: 为了判断未知实例的类别,以所有已知类别的实例作为参照选择参数K 计算未知实例与所有已知实例的距离选 ...
最邻近规则分类KNN算法
例子: 求未知电影属于什么类型: 算法介绍: 步骤: 为了判断未知实例的类别,以所有已知类别的实例作为参照选择参数K 计算未知实例与所有已知实例的距离选择最近K个已 ...
Python 实现简单的感知机算法
感知机随机生成一些点和一条原始直线,然后用感知机算法来生成一条直线进行分类,比较差别导入包并设定画图尺寸 import numpy as np import matplotlib.pyplot a ...

随机推荐

C#中实现输入汉字获取其拼音（汉字转拼音）的2种方法
主要介绍了C#中实现输入汉字获取其拼音(汉字转拼音)的2种方法,本文分别给出了使用微软语言包.手动编码实现两种实现方式,需要的朋友可以参考下本文刚发布时,只写了一个实现方式,使用的是微软的语言包,但 ...
文件选择之OpenFileDialog控件
OpenFileDialog控件主要用于选择要打开的文件,在使用时可以在属性面变中设置属性,也可在代码中设置其属性 OpenFileDialog控件的属性 InitialDirectory 对话框的初 ...
Java中的阻塞队列-ConcurrentLinkedQueue
http://ifeve.com/concurrentlinkedqueue/ 1. 引言在并发编程中我们有时候需要使用线程安全的队列.如果我们要实现一个线程安全的队列有两种实现方式一种是使用 ...
[LeetCode]19. Remove Nth Node From End of List删除链表的倒数第N个节点
Given a linked list, remove the n-th node from the end of list and return its head. Example: Given l ...
CSS透明度设置（兼容性）
一句话搞定透明背景! .transparent_class { filter:alpha(opacity=50); -moz-opacity:0.5; -khtml-opacity: 0.5; opa ...
$.ajax显示进度条
Refactoring in Coding
Make changes on existing code for subsequent and constant changes of requirement. Reference:http://w ...
从刷票了解如何获得客户端IP
我的个人博客,源地址:http://www.woniubi.cn/get_client_ip/ 前两个星期帮一个朋友的亲戚的孩子刷票,谁让咱们是程序员呢.这当中也遇到过重装系统,除灰尘,淘宝购物,盗Q ...
SAP ECC6.0-中建信息版
平台: SUSE Enterprise Server 类型: 虚拟机镜像软件包: sap ecc 6.0 ehp7 sps10 commercial erp sap 服务优惠价: 按服务商许可协议 ...
关于Java虚拟机内存原型的基本知识
Java虚拟机内存原型的六个部分: 1.寄存器:我们在程序中无法控制 2.栈:存放基本类型的数据和对象的引用,但对象本身不存放在栈中,而是存放在堆中 3.堆:存放用new产生的数据 4.静态域:存放在 ...

python实现简单分类knn算法

python实现简单分类knn算法的更多相关文章

随机推荐

热门专题