python机器学习识别手写数字

手写数字识别

关注公众号“轻松学编程”了解更多。

导包

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

#导入knn算法，决策树，逻辑斯蒂回归

from sklearn.neighbors import KNeighborsClassifier

from sklearn.tree import DecisionTreeClassifier

from sklearn.linear_model import LogisticRegression

from IPython.display import display

获取数据

#导入数字图片

#特征数据

X = []

#目标数据

y =[]

#一共有10个文件夹(数字0-9)，每个有500张图片

#图片命名格式为：0_1.bmp

for i in range(10):

    for j in range(1,501):

        #读取图片

        digit = plt.imread('./digits/%d/%d_%d.bmp'%(i,i,j))

        X.append(digit)

        y.append(i)

#把列表转成数组

X = np.array(X)

y = np.array(y)

#查看数组形状

X.shape

说明一共有5000张照片，像素为28*28。

#随机显示一张图片

index = np.random.randint(0,5000,size=1)[0]

digit = X[index]

#设置画布宽为1，高为1

plt.figure(figsize=(1,1))

#显示颜色为gray

plt.imshow(digit,cmap='gray')

print(y[index])

拆分数据

#拆分数据：训练数据和测试数据

from sklearn.model_selection import train_test_split

#测试数据占比为0.1

#一共有5000张照片，那么用来做测试的有500张

X_train,X_test,y_train,y_test = train_test_split(X,y,

												test_size=0.1)

X_train.shape

使用knn算法

#使用knn算法

#使用5个点做比较

knn = KNeighborsClassifier(n_neighbors=5)

#训练数据要为二维数组

#如果不做转换会报如下错误，说3维数组不能做运算

#Found array with dim 3. Estimator expected <= 2

#训练模型

knn.fit(X_train.reshape(4500,-1),y_train)

#对训练后的模型进行评分

knn.score(X_test.reshape(500,-1),y_test)

#预测

y_ = knn.predict(X_test.reshape(500,-1))

display(y_[:20],y_test[:20])

使用决策树

# 784个像素---->784个属性-----> 数字不一样

X.reshape(5000,-1).shape

#使用决策树,深度为50

tree = DecisionTreeClassifier(max_depth=50)

#训练模型

tree.fit(X_train.reshape(4500,-1),y_train)

#对训练后的模型进行评分

tree.score(X_test.reshape(500,-1),y_test)

#使用决策树,深度为150

tree = DecisionTreeClassifier(max_depth=150)

#训练模型

tree.fit(X_train.reshape(4500,-1),y_train)

tree.score(X_test.reshape(500,-1),y_test)

使用逻辑斯蒂回归

#使用逻辑斯蒂回归

logistic = LogisticRegression()

logistic.fit(X_train.reshape(4500,-1),y_train)

logistic.score(X_test.reshape(500,-1),y_test)

图像可视化

#可视化

#画布大小10行10列

#每行高为1，每列宽为1.5

plt.figure(figsize=(10*1,10*1.5))

for i in range(30):

    #绘制子图

    axes = plt.subplot(10,10,i+1)

    #测试数据为500张，绘制其中的30张

    axes.imshow(X_test[i],cmap='gray')

    #添加标题

    t = y_test[i]

    p = y_[i]

    axes.set_title('True:%d\nPred:%d'%(t,p))

    #不显示坐标刻度

    axes.axis('off')

后记

【后记】为了让大家能够轻松学编程，我创建了一个公众号【轻松学编程】，里面有让你快速学会编程的文章，当然也有一些干货提高你的编程水平，也有一些编程项目适合做一些课程设计等课题。

也可加我微信【1257309054】，拉你进群，大家一起交流学习。
如果文章对您有帮助，请我喝杯咖啡吧！

公众号

关注我，我们一起成长~~

python机器学习识别手写数字的更多相关文章

python机器学习使用PCA降维识别手写数字
PCA降维识别手写数字关注公众号"轻松学编程"了解更多. PCA 用于数据降维,减少运算时间,避免过拟合. PCA(n_components=150,whiten=True) n ...
使用神经网络来识别手写数字【译】（三）- 用Python代码实现
实现我们分类数字的网络好,让我们使用随机梯度下降和 MNIST训练数据来写一个程序来学习怎样识别手写数字. 我们用Python (2.7) 来实现.只有 74 行代码!我们需要的第一个东西是 MNI ...
python手写神经网络实现识别手写数字
写在开头:这个实验和matlab手写神经网络实现识别手写数字一样. 实验说明一直想自己写一个神经网络来实现手写数字的识别,而不是套用别人的框架.恰巧前几天,有幸从同学那拿到5000张已经贴好标签的手 ...
学习笔记TF024:TensorFlow实现Softmax Regression(回归)识别手写数字
TensorFlow实现Softmax Regression(回归)识别手写数字.MNIST(Mixed National Institute of Standards and Technology ...
TensorFlow实战之Softmax Regression识别手写数字
关于本文说明,本人原博客地址位于http://blog.csdn.net/qq_37608890,本文来自笔者于2018年02月21日 23:10:04所撰写内容(http://blog.c ...
一文全解：利用谷歌深度学习框架Tensorflow识别手写数字图片（初学者篇）
笔记整理者:王小草笔记整理时间2017年2月24日原文地址 http://blog.csdn.net/sinat_33761963/article/details/56837466?fps=1&a ...
3 TensorFlow入门之识别手写数字
------------------------------------ 写在开头:此文参照莫烦python教程(墙裂推荐!!!) ---------------------------------- ...
用BP人工神经网络识别手写数字
http://wenku.baidu.com/link?url=HQ-5tZCXBQ3uwPZQECHkMCtursKIpglboBHq416N-q2WZupkNNH3Gv4vtEHyPULezDb5 ...
KNN 算法-实战篇-如何识别手写数字
公号:码农充电站pro 主页:https://codeshellme.github.io 上篇文章介绍了KNN 算法的原理,今天来介绍如何使用KNN 算法识别手写数字? 1,手写数字数据集手写数字数 ...

随机推荐

Python-设置文件缓冲类型
案例: 将文件内容写入到硬件设备时候,使用系统调用,这类IO操作时间长,为了减小IO操作,通常会使用缓冲区(有足够多数据才能调用). 文件缓冲行为分为:全缓冲,行缓冲,无缓冲如何解决? open(' ...
初识HTTP 图解形象生动
使用软件: 通信猫请自行下载使用平台: win7 360浏览器当前PC连接的是无线网,所以第2步查看的是无线局域网适配器上的IP地址
IDEA文本编辑区的护眼绿豆沙色配置
第一步:打开IDEA -> File -> settings -> Editor -> Color Scheme -> General 第二步:找到右方Text -> ...
我把这个贼好用的Excel导出工具开源了！！
写在前面不管是传统软件企业还是互联网企业,不管是管理软件还是面向C端的互联网应用.都不可避免的会涉及到报表操作,而对于报表业务来说,一个很重要的功能就是将数据导出到Excel.如果我们在业务代码中, ...
035 01 Android 零基础入门 01 Java基础语法 04 Java流程控制之选择结构 02 多重if结构
035 01 Android 零基础入门 01 Java基础语法 04 Java流程控制之选择结构 02 多重if结构本文知识点:Java中的多重if结构选择结构回顾 if选择结构注意: 1.条 ...
Python+Appium自动化测试(9)-自动选择USB用于传输文件（不依赖appium对手机页面元素进行定位）
一,问题 app自动化测试使用Android真机连接电脑时,通常会遇到两种情况: 1.测试机连接电脑会弹窗提示USB选项,选择USB用于"传输文件",有些手机不支持设置默认USB选 ...
vue 组件的封装
封装的原因首先封装组件的需求肯定是多个地方要用到同一个东西,他们都有公共的地方,vue的封装简单来说就是将公共参数封装起来然后在需要的地方引入 //子组件封装 <template> ...
Redis GEO 功能使用场景
本文来源:https://www.dazhuanlan.com/2020/02/05/5e3a0a3110649/ 背景前段时间自己在做附近直播相关业务,其中有一个核心的点就是检索用户附近的主播,也 ...
matplotlib画图教程，设置坐标轴标签和间距
大家好,欢迎来到周四数据处理专题,我们今天继续matplotlib作图教程. 在上周的文章当中我们介绍了如何通过xlabel和ylabel设置坐标轴的名称,以及这两个函数的花式设置方法,可以设置出各种 ...
GIT之分支管理
分支管理一.分支推进主分支单线分支,随着代码的提交而形成的一条直线,HEAD 随着commit提交之后的节点移动而移动. 子分支当切换到子分支的时候,HEAD 则指向子分支的节点. 在子分支上 ...

python机器学习识别手写数字

手写数字识别

导包

获取数据

拆分数据

使用knn算法

使用决策树

使用逻辑斯蒂回归

图像可视化

后记

python机器学习识别手写数字的更多相关文章

随机推荐

热门专题