用KNN实现iris的4分类问题&测试精度

import matplotlib.pyplot as plt

from scipy import sparse

import numpy as np

import matplotlib as mt

import pandas as pd

from IPython.display import display

from sklearn.datasets import load_iris

import sklearn as sk

from sklearn.model_selection import  train_test_split

from sklearn.neighbors import KNeighborsClassifier

iris=load_iris()

#print(iris)

X_train,X_test,y_train,y_test = train_test_split(iris['data'],iris['target'],random_state=0)

iris_dataframe = pd.DataFrame(X_train,columns=iris.feature_names)

knn = KNeighborsClassifier(n_neighbors=1)

knn.fit(X_train,y_train)

# KNeighborsClassifier(algorithm='auto',leaf_size=30,metric='minkowski',

#                      metric_params=None,n_jobs=1,n_neighbors=1,p=2,weights='uniform')

X_new = np.array([[5,2.9,1,0.2]])

print("X_new.shape:{}".format(X_new.shape))

prediction = knn.predict(X_new)

print("Prediction X_new:{}".format(prediction))

print("prediction X_new belong to {}".format(iris['target_names'][prediction]))

#评估模型

#计算精度方法1

print("test score1:{:.2f}".format(knn.score(X_test,y_test)))

#计算精度方法2

y_pred = knn.predict(X_test)

print("test score2:{:.2f}".format(np.mean(y_pred == y_test)))

输出：

Prediction X_new:[0]
prediction X_new belong to ['setosa']
test score1:0.97
test score2:0.97

测试精度

knn的邻居设置会影响测试精度，举例说明：

import matplotlib.pyplot as plt

import mglearn

from scipy import sparse

import numpy as np

import matplotlib as mt

import pandas as pd

from IPython.display import display

from sklearn.datasets import load_breast_cancer

import sklearn as sk

from sklearn.model_selection import  train_test_split

from sklearn.neighbors import KNeighborsClassifier

cancer = load_breast_cancer()

X_train,X_test,y_train,y_test =train_test_split(cancer.data,cancer.target,stratify=cancer.target,random_state=66)

training_accuracy=[]

test_accuracy=[]

neighbors_settings = range(1,11)

for n_neighbors in neighbors_settings:

    clf = KNeighborsClassifier(n_neighbors=n_neighbors)

    clf.fit(X_train,y_train)

    training_accuracy.append(clf.score(X_train,y_train))

    test_accuracy.append(clf.score(X_test,y_test))

plt.plot(neighbors_settings,training_accuracy,label="training accuracy")

plt.plot(neighbors_settings,test_accuracy,label="test accuracy")

plt.xlabel("n_neighbors")

plt.ylabel("accuracy")

plt.legend()

plt.show()

可以看出，6是最优。

KNN算法的优点是简单可解释性强，

缺点是：

样本大的时候性能不好
特征多（几百个+）的时候效果不好
稀疏数据集不适用

用KNN实现iris的4分类问题&测试精度的更多相关文章

kNN(K-Nearest Neighbor)最近的分类规则
KNN最近的规则,主要的应用领域是未知的鉴定,这一推断未知的哪一类,这样做是为了推断.基于欧几里得定理,已知推断未知什么样的特点和最亲密的事情特性: K最近的邻居(k-Nearest Neighbor ...
在opencv3中实现机器学习算法之：利用最近邻算法（knn)实现手写数字分类
手写数字digits分类,这可是深度学习算法的入门练习.而且还有专门的手写数字MINIST库.opencv提供了一张手写数字图片给我们,先来看看这是一张密密麻麻的手写数字图:图片大小为1000*20 ...
kNN处理iris数据集-使用交叉验证方法确定最优 k 值
基本流程: 1.计算测试实例到所有训练集实例的距离: 2.对所有的距离进行排序,找到k个最近的邻居: 3.对k个近邻对应的结果进行合并,再排序,返回出现次数最多的那个结果. 交叉验证: 对每一个k,使 ...
knn原理及借助电影分类实现knn算法
KNN最近邻算法原理 KNN英文全称K-nearst neighbor,中文名称为K近邻算法,它是由Cover和Hart在1968年提出来的 KNN算法原理: 1. 计算已知类别数据集中的点与当前点之 ...
85、使用TFLearn实现iris数据集的分类
''' Created on 2017年5月21日 @author: weizhen ''' #Tensorflow的另外一个高层封装TFLearn(集成在tf.contrib.learn里)对训练T ...
使用KNN对iris数据集进行分类——python
filename='g:\data\iris.csv' lines=fr.readlines()Mat=zeros((len(lines),4))irisLabels=[]index=0for lin ...
数学建模：2.监督学习--分类分析- KNN最邻近分类算法
1.分类分析分类(Classification)指的是从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类的分析方法. 分类问题的应用场景:分 ...
最邻近规则分类(K-Nearest Neighbor)KNN算法
自写代码: # Author Chenglong Qian from numpy import * #科学计算模块 import operator #运算符模块 def createDaraSet( ...
kNN(K-Nearest Neighbor)最邻近规则分类
KNN最邻近规则,主要应用领域是对未知事物的识别,即推断未知事物属于哪一类,推断思想是,基于欧几里得定理,推断未知事物的特征和哪一类已知事物的的特征最接近: K近期邻(k-Nearest Neighb ...

随机推荐

test20190725 夏令营测试11
50+80+90=220.(每题满分90) 砍树小A在一条水平的马路上种了n棵树,过了几年树都长得很高大了,每棵树都可以看作是一条长度为a[i]的竖线段.由于有的树过于高大,挡住了其他的树,使得另一 ...
.net框架 - Enum枚举
概要在C#或C++,java等一些计算机编程语言中,枚举类型是一种基本数据类型而不是构造数据类型. 在C语言等计算机编程语言中,它是一种构造数据类型. 它用于声明一组命名的常数,当一个变量有几种可能 ...
项目后端 - 虚拟环境搭建 | pycharm使用虚拟环境
虚拟环境的搭建优点 1.使不同应用开发环境相互独立 2.环境升级不影响其他应用,也不会影响全局的python环境 3.防止出现包管理混乱及包版本冲突 windows 安装 # 建议使用pip3安装到 ...
2019-2020-1 20199312《Linux内核原理与分析》第七周作业
进程的描述操作系统内核实现操作系统的三大管理功能进程管理(内核中最核心的功能) 内存管理文件系统在操作系统中,我们通过进程控制块PCB描述进程. 为了管理进程,内核必须对每个进程进行清晰的描述 ...
lambda 函数的用法
lambda函数又叫匿名函数, 匿名函数就是没有名字的函数,不使用def语句声明的函数.如果要声名,则需要使用lambda关键字进行声明. 一般用来定义简单的函数. 1.声明一个简单的加法匿名函数: ...
python - django (ORM使用步骤)
print('asd') """ # 1. 手动创建一个数据库 # 2. 在 Django 项目中设置连接数据库的相关配置(告诉Django 连接哪一个数据库) 在 DA ...
2019/8/20 Test
题目简述做法 \(BSOJ2237\) 求\(\displaystyle{k\in G:\sum_{i\in G\vee j\in G}\frac{C^k_{i,j}}{C_{i,j}}}\),其 ...
Oracle CAST() 函数数据类型的转换
CAST()函数可以进行数据类型的转换. CAST()函数的参数有两部分,源值和目标数据类型,中间用AS关键字分隔. 以下例子均通过本人测试. 一.转换列或值语法:cast( 列名/值 as 数据类 ...
P1902 刺杀大使
题目描述伊朗伊斯兰革命卫队(某恐怖组织)正在策划一起刺杀行动,他们的目标是沙特驻美大使朱拜尔.他们来到了沙特驻美使馆,准备完成此次刺杀,要进入使馆首先必须通过使馆前的防御迷阵. 迷阵由 n*m ...
Class T泛型和通配符泛型的区别
平时看java源代码的时候,如果碰到泛型的话,我想? T K V E这些是经常出现的,但是有时想不起来代表什么意思,今天整理下: ? 表示不确定的java类型. T 表示java类型. K V 分别代 ...

用KNN实现iris的4分类问题&测试精度

用KNN实现iris的4分类问题&测试精度的更多相关文章

随机推荐

热门专题