吴裕雄 python 机器学习——KNN分类KNeighborsClassifier模型

import numpy as np

import matplotlib.pyplot as plt

from sklearn import neighbors, datasets

from sklearn.model_selection import train_test_split

def load_classification_data():

    # 使用 scikit-learn 自带的手写识别数据集 Digit Dataset

    digits=datasets.load_digits()

    X_train=digits.data

    y_train=digits.target

    # 进行分层采样拆分，测试集大小占 1/4

    return train_test_split(X_train, y_train,test_size=0.25,random_state=0,stratify=y_train) 

#KNN分类KNeighborsClassifier模型

def test_KNeighborsClassifier(*data):

    X_train,X_test,y_train,y_test=data

    clf=neighbors.KNeighborsClassifier()

    clf.fit(X_train,y_train)

    print("Training Score:%f"%clf.score(X_train,y_train))

    print("Testing Score:%f"%clf.score(X_test,y_test))

# 获取分类模型的数据集

X_train,X_test,y_train,y_test=load_classification_data()

# 调用 test_KNeighborsClassifier

test_KNeighborsClassifier(X_train,X_test,y_train,y_test)

def test_KNeighborsClassifier_k_w(*data):

    '''

    测试 KNeighborsClassifier 中 n_neighbors 和 weights 参数的影响

    '''

    X_train,X_test,y_train,y_test=data

    Ks=np.linspace(1,y_train.size,num=100,endpoint=False,dtype='int')

    weights=['uniform','distance']

    fig=plt.figure()

    ax=fig.add_subplot(1,1,1)

    ### 绘制不同 weights 下， 预测得分随 n_neighbors 的曲线

    for weight in weights:

        training_scores=[]

        testing_scores=[]

        for K in Ks:

            clf=neighbors.KNeighborsClassifier(weights=weight,n_neighbors=K)

            clf.fit(X_train,y_train)

            testing_scores.append(clf.score(X_test,y_test))

            training_scores.append(clf.score(X_train,y_train))

        ax.plot(Ks,testing_scores,label="testing score:weight=%s"%weight)

        ax.plot(Ks,training_scores,label="training score:weight=%s"%weight)

    ax.legend(loc='best')

    ax.set_xlabel("K")

    ax.set_ylabel("score")

    ax.set_ylim(0,1.05)

    ax.set_title("KNeighborsClassifier")

    plt.show()

# 获取分类模型的数据集

X_train,X_test,y_train,y_test=load_classification_data()

# 调用 test_KNeighborsClassifier_k_w

test_KNeighborsClassifier_k_w(X_train,X_test,y_train,y_test)

def test_KNeighborsClassifier_k_p(*data):

    '''

    测试 KNeighborsClassifier 中 n_neighbors 和 p 参数的影响

    '''

    X_train,X_test,y_train,y_test=data

    Ks=np.linspace(1,y_train.size,endpoint=False,dtype='int')

    Ps=[1,2,10]

    fig=plt.figure()

    ax=fig.add_subplot(1,1,1)

    ### 绘制不同 p 下， 预测得分随 n_neighbors 的曲线

    for P in Ps:

        training_scores=[]

        testing_scores=[]

        for K in Ks:

            clf=neighbors.KNeighborsClassifier(p=P,n_neighbors=K)

            clf.fit(X_train,y_train)

            testing_scores.append(clf.score(X_test,y_test))

            training_scores.append(clf.score(X_train,y_train))

        ax.plot(Ks,testing_scores,label="testing score:p=%d"%P)

        ax.plot(Ks,training_scores,label="training score:p=%d"%P)

    ax.legend(loc='best')

    ax.set_xlabel("K")

    ax.set_ylabel("score")

    ax.set_ylim(0,1.05)

    ax.set_title("KNeighborsClassifier")

    plt.show()

# 获取分类模型的数据集

X_train,X_test,y_train,y_test=load_classification_data()

# 调用 test_KNeighborsClassifier_k_p

test_KNeighborsClassifier_k_p(X_train,X_test,y_train,y_test)

吴裕雄 python 机器学习——KNN分类KNeighborsClassifier模型的更多相关文章

吴裕雄 python 机器学习——KNN回归KNeighborsRegressor模型
import numpy as np import matplotlib.pyplot as plt from sklearn import neighbors, datasets from skle ...
吴裕雄 python 机器学习——半监督学习LabelSpreading模型
import numpy as np import matplotlib.pyplot as plt from sklearn import metrics from sklearn import d ...
吴裕雄 python 机器学习——层次聚类AgglomerativeClustering模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
吴裕雄 python 机器学习——密度聚类DBSCAN模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
吴裕雄 python 机器学习——支持向量机非线性回归SVR模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
吴裕雄 python 机器学习——支持向量机线性回归SVR模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
吴裕雄 python 机器学习-KNN（2）
import matplotlib import numpy as np import matplotlib.pyplot as plt from matplotlib.patches import ...
吴裕雄 python 机器学习-KNN算法（1）
import numpy as np import operator as op from os import listdir def classify0(inX, dataSet, labels, ...
吴裕雄 python 机器学习——支持向量机SVM非线性分类SVC模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...

随机推荐

Python入门11 —— 基本数据类型的操作
一:数字类型:int.float字类型 1.操作: 比较运算:int与float之间是可以比较大小数学运算:+-*/,int与float之间也可以进行数学运算 print(10 > 3.1) ...
MySQL启动失败故障思路
1.1 查看日志默认路径在数据路径下,以当前主机名加上.err命名如主机名为tz,数据路径为/mnt/mysql_data目录下日志文件为tz.err [root@tz mysql_data] ...
P问题，NP问题，NPC问题学习笔记
参考:https://www.luogu.org/blog/styx-ferryman/chu-sai-bei-kao-gan-huo-p-wen-ti-np-wen-ti-npc-wen-ti-sh ...
Oracle体系结构中基本概念，数据库
在Oracle体系结构中包含了基本概念即Oracle数据库与实例,如果你想要了解Oracle体系结构的话,你就必须要了解这两个基本的概念,以下是文章的具体介绍,望你浏览完以下的内容会有所收获. 数据库 ...
解决 IDEA 无法提示导入 java.util.Date 的问题
之前有一段时间在使用IDEA的时候,发现通过快捷键Alt + Enter导入并没有提示有java.util.Date的包,仅仅只有java.sql.Date的包.于是每次使用都需要通过手写import ...
zabbix4.2配置监控华为路由器：基于ENSP模拟器
一.基于ENSP模拟器的华为路由器这里是华为模拟器中的设备,并不是真机,所以要先保证华为模拟器中的网络设备可以和物理主机.虚拟机能通信,这是前提.如何保证通信请看之前的文章:https://www. ...
Microsonf visual c++ 14+ 离线内网安装
内网离线安装方法:先下载官方的visualcppbuildtools: <br href=http://go.microsoft.com/fwlink/?LinkId=691126 >& ...
CF432D Prefixes and Suffixes
CF432D Prefixes and Suffixes 题意给你一个长度为n的长字符串,"完美子串"既是它的前缀也是它的后缀,求"完美子串"的个数且统计这些 ...
MVC5+EF6 入门完整教程4 ：EF基本的CRUD
上篇文章主要讲了如何配置EF, 我们回顾下主要过程: 创建Data Model ---> 创建Database Context --->创建databaseInitializer---&g ...
2.10 webdriver中 js 使用
来源: 使用Webdriver执行JS小结 http://lijingshou.iteye.com/blog/2018929 selenium常用的js总结 http://www.cnblogs. ...

吴裕雄 python 机器学习——KNN分类KNeighborsClassifier模型

吴裕雄 python 机器学习——KNN分类KNeighborsClassifier模型的更多相关文章

随机推荐

热门专题