【机器学*】k*邻算法-03

心得体会：

　　需要思考如何将现实对象转化为特征向量，设置特征向量时记住鸭子定律1

　　鸭子定律1 如果走路像鸭子、说话像鸭子、长得像鸭子、啄食也像鸭子，那它肯定就是一只鸭子

　　事物的外在特征就是事物本质的表现

# 2-3手写识别系统

#32*32转1*1024数组

def img2vector(filename):

    returnVect=zeros((1,1024))

    fr=open(filename)

    for i in range(32):

        lineStr=fr.readline()

        for j in range(32):

            returnVect[0,32*i+j]=int(lineStr[j])

    return returnVect

# testVector=img2vector("E:/Python/《机器学*实战》代码/Ch02/trainingDigits/0_0.txt")

# print(testVector[0,0:31])

#从os模块读取测试代码

import os

def handwritingClassTest():

    hwLabels=[]#数据结果

    trainingFileList=os.listdir("E:/Python/《机器学*实战》代码/Ch02/trainingDigits")

    m=len(trainingFileList)

    trainingMat=zeros((m,1024))#数据集

    for i in range(m):

        fileNameStr=trainingFileList[i]

        fileStr=fileNameStr.split('.')[0]

        classNumStr=int(fileStr.split('_')[0])

        hwLabels.append(classNumStr)

        trainingMat[i,:]=img2vector("E:/Python/《机器学*实战》代码/Ch02/trainingDigits/%s"%fileNameStr)

    errorCount=0.0

    testFileList=os.listdir("E:/Python/《机器学*实战》代码/Ch02/testDigits")

    mTest=len(testFileList)

    for i in range(mTest):

        fileNameStr = testFileList[i]

        fileStr = fileNameStr.split('.')[0]

        classNumStr = int(fileStr.split('_')[0])

        vectorUnderTest = img2vector("E:/Python/《机器学*实战》代码/Ch02/testDigits/%s" % fileNameStr)

        classifierResult=classify0(vectorUnderTest,trainingMat,hwLabels,3)

        if(classifierResult!=classNumStr):

            errorCount+=1

    print("error rate:%s"%(errorCount/float(mTest)))

handwritingClassTest()

【机器学】k邻算法-03的更多相关文章

机器学*——K*邻算法（KNN）
1 前言 Kjin邻法(k-nearest neighbors,KNN)是一种基本的机器学*方法,采用类似"物以类聚,人以群分"的思想.比如,判断一个人的人品,只需观察他来往最密切 ...
【机器学*】k*邻算法-02
k邻*算法具体应用:2-2约会网站配对心得体会: 1.对所有特征值进行归一化处理:将特征值单位带来的距离影响消除,使所有特征同权重--然后对不同的特征进行加权2.对于相互独立的特征,可以通过建立(特 ...
【机器学*】k-*邻算法（kNN）学*笔记
[机器学*]k-*邻算法(kNN) 学*笔记标签(空格分隔): 机器学* kNN简介 kNN算法是做分类问题的.思想如下: KNN算法的思想总结一下:就是在训练集中数据和标签已知的情况下,输入测试数 ...
【机器学*】k*邻算法-01
k临*算法(解决分类问题): 已知数据集,以及该数据对应类型给出一个数据x,在已知数据集中选择最接*x的k条数据,根据这k条数据的类型判断x的类型具体实现: from numpy import * ...
【机器学*与R语言】2-懒惰学*K*邻（kNN）
目录 1.理解使用KNN进行分类 KNN特点 KNN步骤 1)计算距离 2)选择合适的K 3)数据准备 2.用KNN诊断乳腺癌 1)收集数据 2)探索和准备数据 3)训练模型 4)评估模型的性能 5) ...
K近邻算法：机器学习萌新必学算法
摘要:K近邻(k-NearestNeighbor,K-NN)算法是一个有监督的机器学习算法,也被称为K-NN算法,由Cover和Hart于1968年提出,可以用于解决分类问题和回归问题. 1. 为什么 ...
[机器学习系列] k-近邻算法（K–nearest neighbors）
C++ with Machine Learning -K–nearest neighbors 我本想写C++与人工智能,但是转念一想,人工智能范围太大了,我根本介绍不完也没能力介绍完,所以还是取了他的 ...
机器学习03：K近邻算法
本文来自同步博客. P.S. 不知道怎么显示数学公式以及排版文章.所以如果觉得文章下面格式乱的话请自行跳转到上述链接.后续我将不再对数学公式进行截图,毕竟行内公式截图的话排版会很乱.看原博客地址会有更 ...
一步步教你轻松学KNN模型算法
一步步教你轻松学KNN模型算法( 白宁超 2018年7月24日08:52:16 ) 导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用.本文通过一个模拟的实际案例进行讲解. ...

随机推荐

C#点击按钮添加标签
<asp:Button ID="button1" runat="server" Text="创建" onclick="But ...
FTP 文件传输服务
昨晚心血来潮,尝试用python写了一个ftp文件传输服务,可以接收指令,从远程ftp服务器同步指定目录数据,最后没用上,开源出来. https://github.com/jadepeng/ftp_t ...
转关于HttpClient，HttpURLConnection，OkHttp的用法
转自:https://www.cnblogs.com/zp-uestc/p/10371012.html 1 HttpClient入门实例 1.1发送get请求 1 2 3 4 5 6 7 8 9 10 ...
Druid数据库监控
一.简介 Druid是阿里开源的一个JDBC应用组件, 其包括三部分: DruidDriver: 代理Driver,能够提供基于Filter-Chain模式的插件体系. DruidDataSource ...
Linux 易错小结
修改文件夹(递归修改)权限 chmod -R 777 /html Linux查看进程的4种方法第一种: ps aux ps命令用于报告当前系统的进程状态.可以搭配kill指令随时中断.删除不必要的程 ...
SQL 父子表，显示表中每条记录所在层级
1.sqlserer 中有一张父子关系表,表结构如下: CREATE TABLE [dbo].[testparent]( [ID] [int] IDENTITY(1,1) NOT NULL, [nam ...
使用cookie记录用户上次访问网页的时间，并返回到页面
package com.hopetesting.cookie;import javax.servlet.ServletException;import javax.servlet.annotation ...
JavaEE复习二
Servlet应用开发接口: javax.servlet.Servlet: init()方法:调用在构造方法之后,在service方法之前: service()方法:调用此方法允许Servlet响应请 ...
【力扣】922. 按奇偶排序数组 II
给定一个非负整数数组 A, A 中一半整数是奇数,一半整数是偶数. 对数组进行排序,以便当 A[i] 为奇数时,i 也是奇数:当 A[i] 为偶数时, i 也是偶数. 你可以返回任何满足上述条件的数组 ...
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer 目录 [源码解析] PyTorch 分布式(14) - ...

【机器学*】k*邻算法-03

【机器学*】k*邻算法-03的更多相关文章

随机推荐

热门专题

【机器学】k邻算法-03

【机器学】k邻算法-03的更多相关文章