最近忙里偷闲学习了一点机器学习的知识,看到神经网络算法时我和阿Kun便想到要将它用Python代码实现。我们用了两种不同的方法来编写它。这里只放出我的代码。

MNIST数据集基于美国国家标准与技术研究院的两个数据集构建而成。
训练集中包含250个人的手写数字,其中50%是高中生,50%来自人口调查局。
每个训练集的数字图片像素为28x28。
MNIST数据集可通过 下载链接 下载,它包含以下内容:

  • 训练集图像:train-images-idx3-ubyte.gz,包含60000个样本
  • 训练集类标:train-labels-idx1-ubyte.gz,包含60000个类标
  • 测试集图像:t10k-images-idx3-ubyte.gz,包含10000个样本
  • 测试集类标:t10k-labels-idx1-ubyte.gz,包含10000个类标

关于神经网络算法的详解太过复杂,本人水平有限便不再描述,我这里只给出我们两人的代码。若想了解详情请移步谷歌或者百度。


StarMan

github项目地址:https://github.com/MyBules/Neural-Network

  1. import os
  2. import numpy as np
  3. import struct
  4. import matplotlib.pyplot as plt
  5. import sys
  6. from scipy.special import expit
  7.  
  8. def load_mnist(path, kind = 'train'):
  9. '''
  10. 读取数据
  11. :param path: 路径
  12. :param kind: 文件类型
  13. :return: images: 60000*784
  14. labels:手写数字对应的类标(整数0~9)
  15. '''
  16. labels_path = os.path.join(path, '%s-labels-idx1-ubyte' % kind)
  17. images_path = os.path.join(path, '%s-images-idx3-ubyte' % kind)
  18. with open(labels_path, 'rb') as lbpath:
  19. magic, n = struct.unpack('>II', lbpath.read(8))
  20. labels = np.fromfile(lbpath, dtype=np.uint8)
  21.  
  22. with open(images_path, 'rb') as imgpath:
  23. magic, num, rows, cols = struct.unpack(">IIII", imgpath.read(16))
  24. images = np.fromfile(imgpath, dtype= np.uint8).reshape(len(labels), 784) # 28*28=784
  25.  
  26. return images, labels
  27.  
  28. class NeuralNetMLP(object):
  29. def __init__(self, n_output, n_features, n_hidden=30, l1=0.0,
  30. l2=0.0, epochs=500, eta=0.001, alpha=0.0, decrease_const=0.0,
  31. shuffle=True, minibatches=1, random_state=None):
  32. '''
  33.  
  34. :param n_output: 输出单元
  35. :param n_features: 输入单元
  36. :param n_hidden: 隐层单元
  37. :param l1: L1正则化系数 lamda
  38. :param l2: L2正则化系数 lamda
  39. :param epochs: 遍历训练集的次数(迭代次数)
  40. :param eta: 学习速率
  41. :param alpha: 动量学习进度的参数,它在上一轮的基础上增加一个因子,用于加快权重更新的学习
  42. :param decrease_const: 用于降低自适应学习速率 n 的常数 d ,随着迭代次数的增加而随之递减以更好地确保收敛
  43. :param shuffle: 在每次迭代前打乱训练集的顺序,以防止算法陷入死循环
  44. :param minibatches: 在每次迭代中,将训练数据划分为 k 个小的批次,为加速学习的过程,梯度由每个批次分别计算,而不是在整个训练集数据上进行计算。
  45. :param random_state:
  46. '''
  47. np.random.seed(random_state)
  48. self.n_output = n_output
  49. self.n_features = n_features
  50. self.n_hidden = n_hidden
  51. self.w1, self.w2 = self._initialize_weights()
  52. self.l1 = l1
  53. self.l2 = l2
  54. self.epochs = epochs
  55. self.eta = eta
  56. self.alpha = alpha
  57. self.decrease_const = decrease_const
  58. self.shuffle = shuffle
  59. self.minibatches = minibatches
  60.  
  61. def _encode_labels(self, y, k):
  62. '''
  63.  
  64. :param y:
  65. :param k:
  66. :return:
  67. '''
  68. onehot = np.zeros((k, y.shape[0]))
  69. for idx, val, in enumerate(y):
  70. onehot[val, idx] = 1.0
  71. return onehot
  72.  
  73. def _initialize_weights(self):
  74. '''
  75. # 计算权重
  76. :return: w1, w2
  77. '''
  78. w1 = np.random.uniform(-1.0, 1.0, size=self.n_hidden*(self.n_features + 1))
  79. w1 = w1.reshape(self.n_hidden, self.n_features + 1)
  80. w2 = np.random.uniform(-1.0, 1.0, size=self.n_output*(self.n_hidden + 1))
  81. w2 = w2.reshape(self.n_output, self.n_hidden + 1)
  82. return w1, w2
  83.  
  84. def _sigmoid(self, z):
  85. '''
  86. expit 等价于 1.0/(1.0 + np.exp(-z))
  87. :param z:
  88. :return: 1.0/(1.0 + np.exp(-z))
  89. '''
  90. return expit(z)
  91.  
  92. def _sigmoid_gradient(self, z):
  93. sg = self._sigmoid(z)
  94. return sg * (1 - sg)
  95.  
  96. def _add_bias_unit(self, X, how='column'):
  97. if how == 'column':
  98. X_new = np.ones((X.shape[0], X.shape[1] + 1))
  99. X_new[:, 1:] = X
  100. elif how =='row':
  101. X_new = np.ones((X.shape[0]+1, X.shape[1]))
  102. X_new[1:,:] = X
  103. else:
  104. raise AttributeError("'how' must be 'column' or 'row'")
  105. return X_new
  106.  
  107. def _feedforward(self, X, w1, w2):
  108. a1 = self._add_bias_unit(X, how='column')
  109. z2 = w1.dot(a1.T)
  110. a2 = self._sigmoid(z2)
  111. a2 = self._add_bias_unit(a2, how='row')
  112. z3 = w2.dot(a2)
  113. a3 = self._sigmoid(z3)
  114. return a1, z2, a2, z3, a3
  115.  
  116. def _L2_reg(self, lambda_, w1, w2):
  117. return (lambda_/2.0) * (np.sum(w1[:, 1:] ** 2) + np.sum(w2[:, 1:] ** 2))
  118.  
  119. def _L1_reg(self, lambda_, w1, w2):
  120. return (lambda_/2.0) * (np.abs(w1[:,1:]).sum() + np.abs(w2[:, 1:]).sum())
  121.  
  122. def _get_cost(self, y_enc, output, w1, w2):
  123. term1 = -y_enc * (np.log(output))
  124. term2 = (1 - y_enc) * np.log(1 - output)
  125. cost = np.sum(term1 - term2)
  126. L1_term = self._L1_reg(self.l1, w1, w2)
  127. L2_term = self._L2_reg(self.l2, w1, w2)
  128. cost = cost + L1_term + L2_term
  129. return cost
  130.  
  131. def _get_gradient(self, a1, a2, a3, z2, y_enc, w2, w1):
  132. # 反向传播
  133. sigma3 = a3 - y_enc
  134. z2 = self._add_bias_unit(z2, how='row')
  135. sigma2 = w2.T.dot(sigma3) * self._sigmoid_gradient(z2)
  136. sigma2 = sigma2[1:, :]
  137. grad1 = sigma2.dot(a1)
  138. grad2 = sigma3.dot(a2.T)
  139. # 调整
  140. grad1[:, 1:] += (w1[:, 1:] * (self.l1 + self.l2))
  141. grad2[:, 1:] += (w2[:, 1:] * (self.l1 + self.l2))
  142.  
  143. return grad1, grad2
  144.  
  145. def predict(self, X):
  146. a1, z2, a2, z3, a3 = self._feedforward(X, self.w1, self.w2)
  147. y_pred = np.argmax(z3, axis=0)
  148. return y_pred
  149.  
  150. def fit(self, X, y, print_progress=False):
  151. self.cost_ = []
  152. X_data, y_data = X.copy(), y.copy()
  153. y_enc = self._encode_labels(y, self.n_output)
  154.  
  155. delta_w1_prev = np.zeros(self.w1.shape)
  156. delta_w2_prev = np.zeros(self.w2.shape)
  157.  
  158. for i in range(self.epochs):
  159. # 自适应学习率
  160. self.eta /= (1 + self.decrease_const*i)
  161.  
  162. if print_progress:
  163. sys.stderr.write('\rEpoch: %d/%d' % (i+1, self.epochs))
  164. sys.stderr.flush()
  165.  
  166. if self.shuffle:
  167. idx = np.random.permutation(y_data.shape[0])
  168. X_data, y_data = X_data[idx], y_data[idx]
  169.  
  170. mini = np.array_split(range(y_data.shape[0]), self.minibatches)
  171. for idx in mini:
  172. # 前馈
  173. a1, z2, a2, z3, a3 = self._feedforward(X[idx], self.w1, self.w2)
  174. cost = self._get_cost(y_enc=y_enc[:, idx], output=a3, w1=self.w1, w2=self.w2)
  175. self.cost_.append(cost)
  176.  
  177. # 通过反向传播计算梯度
  178. grad1, grad2 = self._get_gradient(a1=a1, a2=a2, a3=a3, z2=z2, y_enc=y_enc[:, idx],
  179. w1=self.w1, w2=self.w2)
  180.  
  181. # 更新权重
  182. delta_w1, delta_w2 = self.eta * grad1, self.eta * grad2
  183. self.w1 -= (delta_w1 + (self.alpha * delta_w1_prev))
  184. self.w2 -= (delta_w2 + (self.alpha * delta_w2_prev))
  185. delta_w1_prev, delta_w2_prev = delta_w1, delta_w2
  186.  
  187. return self
  188.  
  189. def costplt1(nn):
  190. '''代价函数图象'''
  191. plt.plot(range(len(nn.cost_)), nn.cost_)
  192. plt.ylim([0, 2000])
  193. plt.ylabel('Cost')
  194. plt.xlabel('Epochs * 50')
  195. plt.tight_layout()
  196. plt.show()
  197.  
  198. def costplt2(nn):
  199. '''代价函数图象'''
  200. batches = np.array_split(range(len(nn.cost_)), 1000)
  201. cost_ary = np.array(nn.cost_)
  202. cost_avgs = [np.mean(cost_ary[i]) for i in batches]
  203.  
  204. plt.plot(range(len(cost_avgs)), cost_avgs, color='red')
  205. plt.ylim([0, 10000])
  206. plt.ylabel('Cost')
  207. plt.xlabel('Epochs')
  208. plt.tight_layout()
  209. plt.show()
  210.  
  211. if __name__ == '__main__':
  212. path = 'mnist' # 路径
  213. # images, labels = load_mnist(path)
  214. # print(np.shape(images), labels)
  215. # 训练样本和测试样本
  216. X_train, y_train = load_mnist(path, kind='train') # X_train : 60000*784
  217. # print(np.shape(X_train),y_train)
  218. X_test, y_test = load_mnist(path, kind='t10k') # X_test : 10000*784
  219. # print(np.shape(X_test), y_test)
  220.  
  221. nn = NeuralNetMLP(n_output=10,
  222. n_features=X_train.shape[1],
  223. n_hidden=50,
  224. l2=0.1,
  225. l1=0.0,
  226. epochs=1000,
  227. eta=0.001,
  228. alpha=0.001,
  229. decrease_const=0.00001,
  230. shuffle=True,
  231. minibatches=50,
  232. random_state=1)
  233. nn.fit(X_train, y_train, print_progress=True)
  234. costplt1(nn)
  235. costplt2(nn)
  236. y_train_pred = nn.predict(X_train)
  237. acc = np.sum(y_train == y_train_pred, axis=0) / X_train.shape[0]
  238. print('训练准确率: %.2f%%' % (acc * 100))
  239.  
  240. y_test_pred = nn.predict(X_test)
  241. acc = np.sum(y_test == y_test_pred, axis=0) / X_test.shape[0]
  242. print('测试准确率: %.2f%%' % (acc * 100))
  243.  
  244. # 错误样本
  245. miscl_img = X_test[y_test != y_test_pred][:25]
  246. correct_lab = y_test[y_test != y_test_pred][:25]
  247. miscl_lab = y_test_pred[y_test != y_test_pred][:25]
  248. fig, ax = plt.subplots(nrows=5, ncols=5, sharex=True, sharey=True,)
  249. ax = ax.flatten()
  250. for i in range(25):
  251. img = miscl_img[i].reshape(28, 28)
  252. ax[i].imshow(img, cmap='Greys', interpolation='nearest')
  253. ax[i].set_title('%d) t: %d p: %d' % (i+1, correct_lab[i], miscl_lab[i]))
  254. ax[0].set_xticks([])
  255. ax[0].set_yticks([])
  256. plt.tight_layout()
  257. plt.show()
  258.  
  259. # 正确样本
  260. unmiscl_img = X_test[y_test == y_test_pred][:25]
  261. uncorrect_lab = y_test[y_test == y_test_pred][:25]
  262. unmiscl_lab = y_test_pred[y_test == y_test_pred][:25]
  263. fig, ax = plt.subplots(nrows=5, ncols=5, sharex=True, sharey=True, )
  264. ax = ax.flatten()
  265. for i in range(25):
  266. img = unmiscl_img[i].reshape(28, 28)
  267. ax[i].imshow(img, cmap='Greys', interpolation='nearest')
  268. ax[i].set_title('%d) t: %d p: %d' % (i + 1, uncorrect_lab[i], unmiscl_lab[i]))
  269. ax[0].set_xticks([])
  270. ax[0].set_yticks([])
  271. plt.tight_layout()
  272. plt.show()

测试结果:

代价函数图像:

测试错误样本:

测试正确样本:

Python实现神经网络算法识别手写数字集的更多相关文章

  1. 如何用卷积神经网络CNN识别手写数字集?

    前几天用CNN识别手写数字集,后来看到kaggle上有一个比赛是识别手写数字集的,已经进行了一年多了,目前有1179个有效提交,最高的是100%,我做了一下,用keras做的,一开始用最简单的MLP, ...

  2. Pytorch卷积神经网络识别手写数字集

    卷积神经网络目前被广泛地用在图片识别上, 已经有层出不穷的应用, 如果你对卷积神经网络充满好奇心,这里为你带来pytorch实现cnn一些入门的教程代码 #首先导入包 import torchfrom ...

  3. python手写神经网络实现识别手写数字

    写在开头:这个实验和matlab手写神经网络实现识别手写数字一样. 实验说明 一直想自己写一个神经网络来实现手写数字的识别,而不是套用别人的框架.恰巧前几天,有幸从同学那拿到5000张已经贴好标签的手 ...

  4. 李宏毅 Keras手写数字集识别(优化篇)

    在之前的一章中我们讲到的keras手写数字集的识别中,所使用的loss function为‘mse’,即均方差.那我们如何才能知道所得出的结果是不是overfitting?我们通过运行结果中的trai ...

  5. 【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集

    一.前述 本文讲述用Tensorflow框架实现SoftMax模型识别手写数字集,来实现多分类. 同时对模型的保存和恢复做下示例. 二.具体原理 代码一:实现代码 #!/usr/bin/python ...

  6. 使用神经网络来识别手写数字【译】(三)- 用Python代码实现

    实现我们分类数字的网络 好,让我们使用随机梯度下降和 MNIST训练数据来写一个程序来学习怎样识别手写数字. 我们用Python (2.7) 来实现.只有 74 行代码!我们需要的第一个东西是 MNI ...

  7. C#中调用Matlab人工神经网络算法实现手写数字识别

    手写数字识别实现 设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率 关键字:二值化  投影  矩阵  目标定位  Matlab 手写数字图像识别简介: 手写 ...

  8. 机器学习--kNN算法识别手写字母

    本文主要是用kNN算法对字母图片进行特征提取,分类识别.内容如下: kNN算法及相关Python模块介绍 对字母图片进行特征提取 kNN算法实现 kNN算法分析 一.kNN算法介绍 K近邻(kNN,k ...

  9. matlab手写神经网络实现识别手写数字

    实验说明 一直想自己写一个神经网络来实现手写数字的识别,而不是套用别人的框架.恰巧前几天,有幸从同学那拿到5000张已经贴好标签的手写数字图片,于是我就尝试用matlab写一个网络. 实验数据:500 ...

随机推荐

  1. EasyNetQ使用(七)【发布者确认 ,用Future Publish发布预定中事件 】

    AMQP发布消息默认情况下是非事务性的,不能确保你的消息真正送达代理.AMQP可以去指定事务性发布,但是RabbitMQ这样会非常慢,我们没有让EasyNetQ API去支持此功能.为了高效的确保投递 ...

  2. Docker Machine(十五)

    目录 一.Docker Machine 总览 1.Docker Engine VS Docker Machine 2.环境准备 二.安装 Docker Machine 1.Install Machin ...

  3. Spring 分布式事务详解

    在学习分布式事务的过程中会遇到以下关键名词: 相关名词: XA :XA规范的目的是允许多个资源(如数据库,应用服务器,消息队列,等等)在同一事务中访问,这样可以使ACID属性跨越应用程序而保持有效.X ...

  4. 在eNSP上配置VLAN的Trunk端口

    1.实验内容:在不同交换机下不同部门的员工能够互相通信,需要配置交换机之间的链路,跨交换机实现VLAN间通信 2.实验拓扑图 3.实验配置 按照实验编址表编辑配置所有PC机的IP地址 编址表如下图: ...

  5. super的实例及实现原理

    super实例 class A(): def go(self): print ("go A go!") def stop(self): print ("stop A st ...

  6. jqGrid取消所有选中

    // 获取所有选中行id var jqGridRowid=$("#jqGrid").jqGrid("getGridParam","selarrrow& ...

  7. 乐字节Java编程语言发展,面向对象和类

    大家好,上次我们讲过了乐字节Java编程之方法.调用.重载.递归,接下来我们将会进入到Java封装的内容.Java编程语言发展,面向对象和类. 一.编程语言的发展 机器语言——直接由计算机的指令组成, ...

  8. 一个简单的一个sql表遍历

    简单的一个sql表遍历 一般我们写储存过程或者其他sql语句的时候都会用到循环遍历数据,最常用的两种就是 1.游标 2.临时表+while 下面贴出示例代码 DECLARE @MinReLogID I ...

  9. WUSTOJ 1889: 编辑距离(Java)

    转自:

  10. WPF入门(4)——资源

    引用<深入浅出WPF>对资源的解读: 每个WPF的界面元素都具有一个名为Resources的属性,这个属性继承自FrameworkElement类,其类型为ResourceDictiona ...