k-近邻算法（kNN）准备数据：归一化数值

 #准备数据：归一化数值

 def autoNorm(dataSet):      #autoNorm()函数可以自动将数字特征值转换为0到1的区间

     minVals = dataSet.min(0)

     maxVals = dataSet.max(0)    #ddataSet.max(0)中的参数0使得函数可以从列中选取最小值

     ranges = maxVals - minVals

     normDataSet = zeros(shape(dataSet))

     m = dataSet.shape[0]

     #newValue = (oldValue-min)/(max-min)，该公式可以将任意取值范围的特征值转换为0到1区间内的值

     #tile()函数将变量内容复制成输入矩阵同样大小的矩阵（具体特征值相除）

     #在numpy库中，矩阵除法需要使用函数linalg.solve(matA,matB)

     normDataSet = dataSet - tile(minVals, (m,1))

     normDataSet = normDataSet/tile(ranges, (m,1))

     return normDataSet, ranges, minVals

运行结果：

 >>>normMat, ranges, minVals = kNN.autoNorm(datingDataMat)

 >>>normMat

 array([[1., 1., 1.],

        [0., 0., 0.],

        [0., 0., 0.],

        ...,

        [0., 0., 0.],

        [0., 0., 0.],

        [0., 0., 0.]])

 >>>ranges

 array([4.092000e+04, 8.326976e+00, 9.539520e-01])

 >>>minVals

 array([0., 0., 0.])

出现的错误：

 >>>normMat, ranges, minVals = kNN.autoNorm(datingDataMat)

 Traceback (most recent call last):

   File "<input>", line 1, in <module>

 NameError: name 'kNN' is not defined

 >>>normMat, ranges, minVals = kNN.autoNorm(datingDataMat)

 Traceback (most recent call last):

   File "<input>", line 1, in <module>

 AttributeError: module 'kNN' has no attribute 'autoNorm'

解决办法：

　　个人解决办法：重启PyCharm，运行kNN.py，重新完整的输入运行命令，问题就解决了

 >>>from numpy import *

 >>>random.rand(4,4)

 >>>randMat = mat(random.rand(4,4))

 >>>randMat.I

 >>>invRandMat = randMat.I

 >>>myEye = randMat*invRandMat

 >>>myEye - eye(4)

 >>>group,labels = kNN.createDataSet()

 >>>group

 >>>labels

 >>>kNN.classify0([0,0], group, labels, 3)

 >>>datingDataMat,datingLabels = kNN.file2matrix('datingTestSet.txt')

 >>>datingDataMat

 >>>datingLabels[0:16]

 >>>import matplotlib

 >>>import matplotlib.pyplot as plt

 >>>fig = plt.figure()

 >>>ax = fig.add_subplot(111)

 >>>ax.scatter(datingDataMat[:,1], datingDataMat[:,2])

 >>>plt.show()

 >>>normMat, ranges, minVals = kNN.autoNorm(datingDataMat)

 >>>normMat

 array([[1., 1., 1.],

        [0., 0., 0.],

        [0., 0., 0.],

        ...,

        [0., 0., 0.],

        [0., 0., 0.],

        [0., 0., 0.]])

 >>>ranges

 array([4.092000e+04, 8.326976e+00, 9.539520e-01])

 >>>minVals

 array([0., 0., 0.])

k-近邻算法（kNN）准备数据：归一化数值的更多相关文章

k近邻算法(KNN)
k近邻算法(KNN) 定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别. from sklearn.model_selection ...
机器学习(四) 分类算法--K近邻算法 KNN (上)
一.K近邻算法基础 KNN------- K近邻算法--------K-Nearest Neighbors 思想极度简单应用数学知识少 (近乎为零) 效果好(缺点?) 可以解释机器学习算法使用过程中 ...
一看就懂的K近邻算法(KNN)，K-D树，并实现手写数字识别！
1. 什么是KNN 1.1 KNN的通俗解释何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:K个最近的邻居,当K=1 ...
机器学习(四) 机器学习(四) 分类算法--K近邻算法 KNN (下)
六.网格搜索与 K 邻近算法中更多的超参数七.数据归一化 Feature Scaling 解决方案:将所有的数据映射到同一尺度八.scikit-learn 中的 Scaler preprocess ...
k近邻算法(knn)的c语言实现
最近在看knn算法,顺便敲敲代码. knn属于数据挖掘的分类算法.基本思想是在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别.俗话叫,"随大流&q ...
《机器学习实战》---第二章 k近邻算法 kNN
下面的代码是在python3中运行, # -*- coding: utf-8 -*- """ Created on Tue Jul 3 17:29:27 2018 @au ...
最基础的分类算法-k近邻算法 kNN简介及Jupyter基础实现及Python实现
k-Nearest Neighbors简介对于该图来说,x轴对应的是肿瘤的大小,y轴对应的是时间,蓝色样本表示恶性肿瘤,红色样本表示良性肿瘤,我们先假设k=3,这个k先不考虑怎么得到,先假设这个k是 ...
07.k近邻算法kNN
1.将数据分为测试数据和预测数据 2.数据分为data和target,data是矩阵,target是向量 3.将每条data(向量)绘制在坐标系中,就得到了一系列的点 4.根据每条data的targe ...
机器学习实战python3 K近邻（KNN）算法实现
台大机器技法跟基石都看完了,但是没有编程一直,现在打算结合周志华的<机器学习>,撸一遍机器学习实战, 原书是python2 的,但是本人感觉python3更好用一些,所以打算用python ...
机器学习（1）——K近邻算法
KNN的函数写法 import numpy as np from math import sqrt from collections import Counter def KNN_classify(k ...

随机推荐

JavaScript浅析
目录 JacaScript概述 ECMAScript和JavaScript的关系 ECMAScript的历史: JavaScript的引入方式: 引入额外的JS文件: JavaScript的语言规范: ...
Jenkins持续集成_01_Mac安装配置
前言 Jenkins是一款开源 CI&CD 软件,用于自动化各种任务,包括构建.测试和部署软件.在自动化测试中,用来持续集成,跑定时任务进行定时自动化监测.更详细介绍可查看jenkins官网: ...
upc组队赛18 THE WORLD【时间模拟】
THE WORLD 题目链接题目描述 The World can indicate world travel, particularly on a large scale. You mau be l ...
记一次 Json 对象转换为 Java 对象的问题
1.描述最近在使用 Jackson 将 Json 串转换回 Java 对象的时候遇到了 ClassCastException 错误,特此记述. 2.问题复现问题出现的节点在于属性节点的 JavaT ...
ichunqiu在线挑战--我很简单，请不要欺负我 writeup
挑战链接: http://www.ichunqiu.com/tiaozhan/114 知识点: 后台目录扫描,SQL Injection,一句话木马, 提权,登陆密码破解这个挑战是为像我这种从来都没 ...
Java中的I/O
1.Java中的I/O分类 I/O分类: 输入流,输出流,或者字节流,字符流 I/O中的四个抽象基类: InputStream,OutputStream:两者属于字节流,前者输入,后者输出.一般后缀名 ...
xml&dom_sax&dom4j的常见操作
<? xml version =”1.0” encoding=”GB2312”?> <!-- 学生信息—><?xml-stylesheet type=”text/css” ...
CHEVP算法（Canny/Hough Estimation of Vanishing Points)
这个算法是汪悦在 Lane detection and tracking using B-spline中提出来的.他在这篇论文中主要用的是B-spline模型,这个模型的主要优点是鲁棒性好,可以针对不 ...
Git相关命令整理
git config --global user.name //配置姓名git config --global user.email //配置邮箱git config --list //查看配置 ...
vuex配置
import Vue from 'vue' import App from './App.vue' import router from './router' import store from '. ...

k-近邻算法（kNN）准备数据：归一化数值

k-近邻算法（kNN）准备数据：归一化数值的更多相关文章

随机推荐

热门专题