更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

k近邻算法(鸢尾花分类)

一、导入模块

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.colors import ListedColormap

from matplotlib.font_manager import FontProperties

from sklearn import datasets

from sklearn.neighbors import KNeighborsClassifier

%matplotlib inline

font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

二、获取数据

iris_data = datasets.load_iris()

X = iris_data.data[:, [2, 3]]

y = iris_data.target

label_list = ['山鸢尾', '杂色鸢尾', '维吉尼亚鸢尾']

三、构建决策边界

def plot_decision_regions(X, y, classifier):

    # 构造颜色映射关系

    marker_list = ['o', 'x', 's']

    color_list = ['r', 'b', 'g']

    cmap = ListedColormap(color_list[:len(np.unique(y))])

    # 构造网格采样点并使用算法训练阵列中每个元素

    x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1  # 第0列的范围

    x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1  # 第1列的范围

    t1 = np.linspace(x1_min, x1_max, 666)  # 横轴采样多少个点

    t2 = np.linspace(x2_min, x2_max, 666)  # 纵轴采样多少个点

    x1, x2 = np.meshgrid(t1, t2)  # 生成网格采样点

    y_hat = classifier.predict(np.array([x1.ravel(), x2.ravel()]).T)  # 预测值

    y_hat = y_hat.reshape(x1.shape)  # 使之与输入的形状相同

    # 通过网格采样点画出等高线图

    plt.contourf(x1, x2, y_hat, alpha=0.2, cmap=cmap)

    plt.xlim(x1.min(), x1.max())

    plt.ylim(x2.min(), x2.max())

    for ind, clas in enumerate(np.unique(y)):

        plt.scatter(X[y == clas, 0], X[y == clas, 1], alpha=0.8, s=50,

                    c=color_list[ind], marker=marker_list[ind], label=label_list[clas])

四、训练模型

knn = KNeighborsClassifier(n_neighbors=10, p=2)  # p=2为欧几里得距离；p=1为曼哈顿距离

knn.fit(X, y)

KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',

           metric_params=None, n_jobs=None, n_neighbors=10, p=2,

           weights='uniform')

五、构图

plot_decision_regions(X, y, classifier=knn)

plt.xlabel('花瓣长度（cm）', fontproperties=font)

plt.ylabel('花瓣宽度（cm）', fontproperties=font)

plt.legend(prop=font)

plt.show()

02-19 k近邻算法(鸢尾花分类)的更多相关文章

【机器学习】K近邻算法——多分类问题
给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该类输入实例分为这个类. KNN是通过测量不同特征值之间的距离进行分类.它的的思路是:如 ...
第4章最基础的分类算法-k近邻算法
思想极度简单应用数学知识少效果好(缺点?) 可以解释机器学习算法使用过程中的很多细节问题更完整的刻画机器学习应用的流程 distances = [] for x_train in X_train ...
02-16 k近邻算法
目录 k近邻算法一.k近邻算法学习目标二.k近邻算法引入三.k近邻算法详解 3.1 k近邻算法三要素 3.1.1 k值的选择 3.1.2 最近邻算法 3.1.3 距离度量的方式 3.1.4 分类 ...
02机器学习实战之K近邻算法
第2章 k-近邻算法 KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法. 一句话总结:近朱者赤近墨者黑! k ...
基本分类方法——KNN(K近邻)算法
在这篇文章 http://www.cnblogs.com/charlesblc/p/6193867.html 讲SVM的过程中,提到了KNN算法.有点熟悉,上网一查,居然就是K近邻算法,机器学习的入门 ...
分类算法----k近邻算法
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的 ...
机器学习(四) 机器学习(四) 分类算法--K近邻算法 KNN (下)
六.网格搜索与 K 邻近算法中更多的超参数七.数据归一化 Feature Scaling 解决方案:将所有的数据映射到同一尺度八.scikit-learn 中的 Scaler preprocess ...
机器学习(四) 分类算法--K近邻算法 KNN (上)
一.K近邻算法基础 KNN------- K近邻算法--------K-Nearest Neighbors 思想极度简单应用数学知识少 (近乎为零) 效果好(缺点?) 可以解释机器学习算法使用过程中 ...
python 机器学习（二）分类算法-k近邻算法
一.什么是K近邻算法? 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别. 来源: KNN算法最早是由Cover和Hart提 ...

随机推荐

什么是Werkzeug
上一节介绍了什么是WSGI,这一节我们看看Werkzeug 按照官方的说法,Werkzeug(源自德语,工具的意思)是一个WSGI工具库,它开始于一个适用于WSGI的多样化的工具集,后来发展成了现在非 ...
POJ 3083 Children of the Candy Corn (DFS + BFS)
POJ-3083 题意: 给一个h*w的地图. '#'表示墙: '.'表示空地: 'S'表示起点: 'E'表示终点: 1)在地图中仅有一个'S'和一个'E',他们为位于地图的边墙,不在墙角: 2)地图 ...
Android-打包AAR步骤以及最为关键的注意事项！
### 简介最近因为项目的要求,需要把开发的模块打包成aar,供其他项目调用,在搞了一段时间后,发现这里还是有很多需要注意的地方,所以记录一下,帮助大家不要走弯路. **首先何为aar包?** ![ ...
Flink文章测试
Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 Flink文章测试 ...
对line-height的理解
<html> <head> <style> </style> </head> <body> <!--line-height ...
UI自动化测试养成记
<selenium自动化测试实战>PDF文档下载:https://pan.baidu.com/s/16dt8qPi-C4BOgKe6snAA0A 这几个月我都干了些什么? 当我打算写一本& ...
window下载安装maven
Maven官网下载地址:https://maven.apache.org/download.cgi,这里我们下载zip包即可解压到安装目录下新建环境变量MAVEN_HOME,复制Maven安装 ...
前后端分类状态下SpringSecurity的玩法
前后端分离状态下,后端SpringSecurity该如何变动呢? 如何变动取决于前后端分离状态下,前后端交互的特点,纯json交互,闲言少叙,上干货主配置类 @Configuration @Enab ...
python串口工具的使用！！！！一定要加timeout=！！！！
不指定timeout参数的话,就各种报错,如下: 而前面的串口,波特率则不需要指明.
charles 帮助菜单总结
本文参考:charles 帮助菜单总结 charles的window和help的菜单介绍其中window菜单的如下这里我一般用到的就是 Active connections:可以用它来看charl ...

02-19 k近邻算法(鸢尾花分类)

k近邻算法(鸢尾花分类)

一、导入模块

二、获取数据

三、构建决策边界

四、训练模型

五、构图

02-19 k近邻算法(鸢尾花分类)的更多相关文章

随机推荐

热门专题