KNN分类

1. KNN简介

K近邻(K-Nearest Neighbor)简称KNN.它可以做分类算法，也可以做回归算法。个人经验：KNN在做分类问题时非常有效。

2. KNN算法思想

在样本空间中，我们认为两个实例在特征空间中的距离反映了它们之间的相似度，距离越近越相似。输入一个实例，看它距离些实例近，使用这些实例标签推断该实例标签(一般使用投票法做分类)。

3. KNN算法实现

# 导入包

import pandas as pd

from sklearn.neighbors import KNeighborsClassifier

from sklearn.model_selection import GridSearchCV

from sklearn.model_selection import train_test_split

from sklearn.metrics import accuracy_score, classification_report

import joblib

# 导入数据

fpath = r"..\文件\训练数据2.csv"

df = pd.read_csv(fpath)

print(df.head())

# 数据划分

x_train, x_test = train_test_split(df, train_size=0.7)

# 训练集

train_x = x_train.loc[:, "nAcid":"Zagreb"]

train_y = x_train["CYP3A4"]

# 测试集

text_x = x_test.loc[:, "nAcid":"Zagreb"]

test_y = x_test["CYP3A4"]

# 训练knn模型

knn = KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto')

knn.fit(train_x, train_y)

joblib.dump(knn, "knn2.pkl")

scores = knn.score(train_x, train_y)

print("knn训练得分：", scores)

# 测试模型

label_predic = knn.predict(text_x)

acc = accuracy_score(label_predic, test_y)

print("knn测试得分：", acc)

print(classification_report(test_y, label_predic))

# 网格调参

gsCv = GridSearchCV(knn,

                    param_grid={

                     'n_neighbors':list(range(1, 40, 1))

                     }, cv=10)

gsCv.fit(train_x, train_y)

print("参数训练结束")

print("参数训练结束")

print("最好的得分：", gsCv.best_score_, "最好的参数：", gsCv.best_params_)

KNN分类的更多相关文章

knn分类算法学习
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的 ...
KNN分类算法实现手写数字识别
需求: 利用一个手写数字“先验数据”集,使用knn算法来实现对手写数字的自动识别: 先验数据(训练数据)集: ♦数据维度比较大,样本数比较多. ♦ 数据集包括数字0-9的手写体. ♦每个数字大约有20 ...
KNN分类算法及python代码实现
KNN分类算法(先验数据中就有类别之分,未知的数据会被归类为之前类别中的某一类!) 1.KNN介绍 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法. 机器学习, ...
机器学习---K最近邻(k-Nearest Neighbour，KNN)分类算法
K最近邻(k-Nearest Neighbour,KNN)分类算法 1.K最近邻(k-Nearest Neighbour,KNN) K最近邻(k-Nearest Neighbour,KNN)分类算法, ...
（数据科学学习手札29）KNN分类的原理详解&Python与R实现
一.简介 KNN(k-nearst neighbors,KNN)作为机器学习算法中的一种非常基本的算法,也正是因为其原理简单,被广泛应用于电影/音乐推荐等方面,即有些时候我们很难去建立确切的模型来描述 ...
在Ignite中使用k-最近邻(k-NN)分类算法
在本系列前面的文章中,简单介绍了一下Ignite的线性回归算法,下面会尝试另一个机器学习算法,即k-最近邻(k-NN)分类.该算法基于对象k个最近邻中最常见的类来对对象进行分类,可用于确定类成员的关系 ...
JAVA实现KNN分类
转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/51064307 http://www.llwjy.com/blogdetail/f ...
Python机器学习算法 — KNN分类
KNN简介 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.KNN分类算法属于监督学习. 最简单最初级的分类器是将全部的训练 ...
sklearn学习第一篇：knn分类
K临近分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类. 一,kNN算法的逻辑 kNN算法的核 ...
KNN分类算法
K邻近算法.K最近邻算法.KNN算法(k-Nearest Neighbour algorithm):是数据挖掘分类技术中最简单的方法之一 KNN的工作原理所谓K最近邻,就是k个最近的邻居的意思,说的 ...

随机推荐

[bzoj1576]安全路径
先建立最短路径树(即跑dij每一个点向更新他的点连边),考虑一个点的答案路径一定要走过且仅走过一条非树边,枚举非树边(x,y),对于一个点k,如果它在x~lca上(y~lca的路径上同理),那么答案可 ...
抽象类和接口的区别详解、package和import
1.抽象类和接口以及抽象类和接口的区别. 1.1.抽象类的基础语法(见昨天笔记) 1.2.接口的基础语法 1.接口是一种"引用数据类型". 2.接口是完全抽象的. 3.接口怎么定义 ...
k8s-Pod污点与容忍
目录 Pod污点与容忍大白话先解释一下污点与容忍为什么要用污点和容忍? 官方解释 Taints参数标记污点容忍污点取消所有节点污点 Pod污点与容忍大白话先解释一下污点与容忍污点:被打上 ...
vip视频解析保存
无广告通用:https://vip.52jiexi.top/?url= 腾讯直解无广告解析:https://jx.lfeifei.cn/?url= 无广告解析:https://api.steak51 ...
myeclipse字体大小格式的设置
Hive处理Json数据
Json 格式的数据处理 Json 数据格式是我们比较常用的的一种数据格式,例如埋点数据.业务端的数据.前后端调用都采用的是这种数据格式,所以我们很有必要学习一下这种数据格式的处理方法准备数据 ca ...
详解Threejs中的光源对象
光源的分类 AmbientLight(环境光),PointLight(点光源),SpotLight(聚光源) 和 DirectionalLight(平行光)是基础光源 HemisphereLight( ...
[TJOI2007] 可爱的质数
题意求最小的\(x\)满足\(a^x \equiv b\mod p\) 想法这个是标准的板子题,\(BSGS\)算法可以用来解决\(a^x \equiv b\mod p\) 和 \(x^a \eq ...
Oracle JDK 下载、配置与验证
# 1. 解决官网下载JDK需要登录Oracle账号问题(JDK 8) JDK 1.8 官网下载地址: https://www.oracle.com/java/technologies/javase/ ...
[Linux] 非root安装Lefse软件及其数据分析
说明 Lefse软件是宏组学物种研究常用软件,一般大家用在线版本即可.但要搭建在Linux集群环境中有点烦,记录一下折腾过程. 安装这个软件是python2写的,因此假设我已经安装好了较高版本的py ...

KNN分类

1. KNN简介

2. KNN算法思想

3. KNN算法实现

KNN分类的更多相关文章

随机推荐

热门专题