【笔记】初探KNN算法（2）

KNN算法（2）

机器学习算法封装

scikit-learn中的机器学习算法封装

在python chame中将算法写好

  import  numpy as np

  from math import sqrt

  from collections import Counter

  def kNN_classify(k, X_train, y_train , x):

      assert 1 <= k <= X_train.shape[0],"k must be valid"

      assert X_train.shape[0] == y_train.shape[0], \

          "the size of X_train must equal to the size of y_train"

      assert X_train.shape[1] == x.shape[0], \

          "the feature number of x must be equal to X_train"

      distances = [sqrt(np.sum((x_train - x)**2)) for x_train in X_train]

      nearest = np.argsort(distances)

      topK_y = [y_train[i] for i in nearest[:k]]

      votes = Counter(topK_y)

      return votes.most_common(1)[0][0]

将所需要的数据提前准备好

使用魔法命令%run调用函数

  %run KNN.py

执行即可得到预测结果

k近邻算法是非常特殊的，可以被认为是没有模型的算法，为了和其他的算法统一，可以认为训练数据集就是魔性本身

使用scikit-learn中的kNN

需要调用KNeighborsClassifier类

创建实例，其中n_neighbors=6相当于k=6

然后进行fit操作

  kNN_classifier.fit(X_train,y_train)

其返回值就是自身，可以不用接参数

调用predict方法即可实现

不过需要注意的是，这个必须是一个矩阵，不能是一维数组

因此我们先reshape改变结构

最后就可以得到预测的类别

重新整理我们的kNN代码

在同一个文件夹下创建一个kNN1.py的文件

写入KNN算法

  import numpy as np

  from math import sqrt

  from collections import Counter

  class KNNClassifier:

      def __init__(self, k):

          """初始化KNN分类器"""

          assert k >= 1, "k must be valid"

          self.k = k

          self._X_train = None

          self._y_train = None

      def fit(self, X_train, y_train):

          """根据训练数据集X_train和y_train训练kNN分类器"""

          assert X_train.shape[0] == y_train.shape[0], \

              "this size of X_train must be equal to the size of y_train"

          assert self.k <= X_train.shape[0], \

              "the size of X_train must be at least k."

          self._X_train = X_train

          self._y_train = y_train

          return self

      def predict(self, X_predict):

          """给定预测数据集X_predict,返回表示X_predict的结果向量"""

          assert self._X_train is not None and self._y_train is not None, \

              "must fit before predict!"

          assert X_predict.shape[1] == self._X_train.shape[1], \

              "the feature number of X_predict must be equal to X_train"

          y_predict = [self._predict(x) for x in X_predict]

          return np.array(y_predict)

      def _predict(self, x):

          """给定单个待预测数据x，返回x的预测结果值"""

          assert x.shape[0] == self._X_train.shape[1], \

              "the feature number of x must be equal to X_train"

          distances = [sqrt(np.sum((x_train - x) ** 2))

                       for x_train in self._X_train]

          nearest = np.argsort(distances)

          topK_y = [self._y_train[i] for i in nearest[:self.k]]

          votes = Counter(topK_y)

          return votes.most_common(1)[0][0]

      def __repr__(self):

          return "KNN(k=%d)" % self.k

同上操作，即可得到

【笔记】初探KNN算法（2）的更多相关文章

【笔记】初探KNN算法（3）
KNN算法(3) 测试算法的目的就是为了帮助我们选择一个更好的模型训练数据集,测试数据集方面一般来说,我们训练得到的模型直接在真实的环境中使用这就导致了一些问题如果模型很差,未经改进就应用在现 ...
【笔记】初探KNN算法（1）
KNN算法(1) 全称是K Nearest Neighbors k近邻算法: 思想简单需要的数学知识很少效果不错可以解释机器学习算法使用过程中的很多细节问题更加完整的刻画机器学习应用的流程其 ...
机器学习实战（笔记）------------KNN算法
1.KNN算法 KNN算法即K-临近算法,采用测量不同特征值之间的距离的方法进行分类. 以二维情况举例: 假设一条样本含有两个特征.将这两种特征进行数值化,我们就可以假设这两种特种分别 ...
机器学习笔记(5) KNN算法
这篇其实应该作为机器学习的第一篇笔记的,但是在刚开始学习的时候,我还没有用博客记录笔记的打算.所以也就想到哪写到哪了. 你在网上搜索机器学习系列文章的话,大部分都是以KNN(k nearest nei ...
kNN算法笔记
kNN算法笔记标签(空格分隔): 机器学习 kNN是什么 kNN算法是k-NearestNeighbor算法,也就是k邻近算法.是监督学习的一种.所谓监督学习就是有训练数据,训练数据有label标好 ...
机器学习笔记--KNN算法2-实战部分
本文申明:本系列的所有实验数据都是来自[美]Peter Harrington 写的<Machine Learning in Action>这本书,侵删. 一案例导入:玛利亚小姐最近寂寞了, ...
机器学习笔记--KNN算法1
前言 Hello ,everyone. 我是小花.大四毕业,留在学校有点事情,就在这里和大家吹吹我们的狐朋狗友算法---KNN算法,为什么叫狐朋狗友算法呢,在这里我先卖个关子,且听我慢慢道来. 一 K ...
算法学习笔记：knn理论介绍
阅读对象:了解指示函数,了解训练集.测试集的概念. 1.简介 knn算法是监督学习中分类方法的一种.所谓监督学习与非监督学习,是指训练数据是否有标注类别,若有则为监督学习,若否则为非监督学习.所谓K近 ...
机器学习简要笔记（三）-KNN算法
#coding:utf-8 import numpy as np import operator def classify(intX,dataSet,labels,k): ''' KNN算法 ''' ...

随机推荐

Python上下文管理器你学会了吗？
什么是上下文管理器对于像文件操作.连接数据库等资源管理的操作,我们必须在使用完之后进行释放,不然就容易造成资源泄露.为了解决这个问题,Python的解决方式便是上下文管理器.上下文管理器能够帮助你 ...
如何Spring Cloud Zuul作为网关的分布式系统中整合Swagger文档在同一个页面上
本文不涉及技术,只是单纯的一个小技巧. 阅读本文前,你需要对spring-cloud-zuul.spring-cloud-eureka.以及swagger的配置和使用有所了解. 如果你的系统也是用zu ...
mybatis复杂映射
1. 类型名对应当实体类与表中字段完全一致时,mapper文件里返回类型用resultType,否则要用resultMap,并且建立resultMap映射 package com.rf.domain ...
[NOI2009] 诗人小G [题解]
诗人小G 题目大意给出 \(n\) 个长度不超过 \(30\) 的句子,要求你对其进行排版. 对于每一行,有一个规定的行标准长度 \(L\) ,每一行的不协调度等于该行的实际长度与行标准长度差的绝对 ...
「CF521D」 Shop
「CF521D」 Shop 传送门题目说是有三种操作,首先可以知道赋值操作是可以转化为加法操作的,即 \((1,b) \rightarrow (2,b-a_i)\) 然后加法对于一个数你肯定优先选择 ...
YAOI Round #1 题解
前言比赛网址:http://47.110.12.131:9016/contest/3 总体来说,这次比赛是有一定区分度的, \(\text{ACM}\) 赛制也挺有意思的. 题解 A. 云之彼端,约 ...
Linux磁盘配额与LVM
一.LVM概述逻辑卷管理 Logical Volume Manager二.LVM机制的基本概念三.LVM的管理命令 ① 主要命令 ② ==LVM逻辑卷操作流程== ③ 举例四.磁盘配额概述 ...
LeetCode 887. Super Egg Drop
题目链接:https://leetcode.com/problems/super-egg-drop/ 题意:给你K个鸡蛋以及一栋N层楼的建筑,已知存在某一个楼层F(0<=F<=N),在不高 ...
学习Git的基本业务逻辑
1,基本业务逻辑(假设针对index.html文件中内容): 1,在init版本库之前已写好开头部分:index 对index进行git init版本库: 进入到文件夹中,git init git a ...
python + pytest基本使用方法（运行测试&测试报告）
import pytest# 1.运行名称中包含某字符串的测试用例#名称中含add 的测试用例# 执行: pytest -k add test_assert.py# 2.减少测试的运行冗长# 执行: ...

【笔记】初探KNN算法（2）

KNN算法（2）

【笔记】初探KNN算法（2）的更多相关文章

随机推荐

热门专题