深度学习---手写字体识别程序分析（python）

我想大部分程序员的第一个程序应该都是“hello world”，在深度学习领域，这个“hello world”程序就是手写字体识别程序。

这次我们详细的分析下手写字体识别程序，从而可以对深度学习建立一个基本的概念。

1.初始化权重和偏置矩阵，构建神经网络的架构

import numpy as np

class network():

　　def __init__(self, sizes):

　　　　self.num_layers = len(sizes)

　　　　self.sizes = sizes

　　　　self.biases = [ np.random.randn(y,1) for y in sizes[1:] ]

　　　　self.weights = [ np.random.randn(y,x) for x,y in zip(sizes(:-1), sizes(1:)) ]

在实例化一个神经网络时，去初始化权重和偏置的矩阵，例如

　　network0 = network([784, 30, 10])

可以初始化一个3层的神经网络，各层神经元的个数分别为 784， 30 ， 10

2. 如何去反向传播计算代价函数的梯度？

这个过程可以大概概括如下：

（1）正向传播，获得每个神经元的带权输出和激活因子（a）

（2）计算输出层的误差

（3）反向传播计算每一层的误差和梯度

用python实现的代码如下：

def backprop(self, x, y):

　　delta_w = [ np.zeros(w.shape) for w in self.weights]

delta_b = [ np.zeros(b.shape) for b in self.biases ]

#计算每个神经元的带权输入z及激活值

　　zs = []

activation = x

activations = [x]

　　for b,w in zip(self.biases, self.weights):

　　　　z = np.dot(w, activation) + b

　　　　zs.append(z)

　　　　activation = sigmod(z)

　　　　activations.append(activation)

#计算输出层误差(这里采用的是二次代价函数)

　　delta = (activations[-1] - y) * sigmod_prime(zs[-1])

　　delta_w[-1] = np.dot(delta, activations[-2].transpose())

　　delta_b[-1] = delta

　　#反向传播

　　for l in xrange(2, self.num_layers):

　　　　delta = np.dot(delta_w[-l+1].transpose(),delta)*sigmod_prime(zs[-l])

　　　　delta_w[-l] = np.dot(delta, activations[-l-1].transpose())

　　　　delta_b[-l] = delta

　　return delta_w, delta_b

3.如何梯度下降，更新权重和偏置？

通过反向传播获得了更新权重和偏置的增量，进一步进行更新，梯度下降。

def update_mini_batch(self, mini_batch, eta):

　　delta_w = [ np.zeros(w.shape) for w in self.weights ]

　　delta_b = [ np.zeros(b.shape) for b in self.biases ]

　　for x,y in mini_batch:

　　　　(这里针对一个小批量内所有样本，应用反向传播，积累权重和偏置的变化)

　　　　delta_w_p, delta_b_p = self.backprop(x,y)

　　　　delta_w = [ dt_w + dt_w_p for dt_w,dt_w_p in zip(delta_w, delta_w_p)]

　　　　delta_b = [ dt_b + dt_b_p for dt_b,dt_b_p in zip(delta_b, delta_b_p)]

　　self.weights = [ w-(eta/len(mini_batch)*nw) for w,nw in zip(self.weights, delta_w)]

　　self.biases = [ b-(eta/len(mini_batch)*nb) for b,nb in zip(self.biases, delta_b)]

def SGD(self, epochs, training_data, mini_batch_size,eta, test_data=None):

　　if test_data:

　　　　n_tests = len(tast_data)

　　n_training_data = len(training_data)

　　for i in xrange(0, epochs):

　　　　random.shuffle(training_data)

　　　　mini_batches = [ training_data[k:k+mini_batch_size]

　　　　　　　　　　　　for k in xrange(0, n_training_data, mini_batch_size)

　　　　　　　　　　　　]

　　　　for mini_batch in mini_batches:

　　　　　　self.update_mini_batch(mini_batch, eta)

深度学习---手写字体识别程序分析（python）的更多相关文章

深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识. tf基本知识香农熵交叉熵代价函数cross-entropy 卷积神经网络 s ...
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了这里直接上代码 # -*- ...
pytorch深度学习神经网络实现手写字体识别
利用平pytorch搭建简单的神经网络实现minist手写字体的识别,采用三层线性函数迭代运算,使得其具备一定的非线性转化与运算能力,其数学原理如下: 其具体实现代码如下所示:import torch ...
【OpenCV】opencv3.0中的SVM训练 mnist 手写字体识别
前言: SVM(支持向量机)一种训练分类器的学习方法 mnist 是一个手写字体图像数据库,训练样本有60000个,测试样本有10000个 LibSVM 一个常用的SVM框架 OpenCV3.0 中的 ...
机器学习之路： python 支持向量机 LinearSVC 手写字体识别
使用python3 学习sklearn中支持向量机api的使用可以来到我的git下载源代码:https://github.com/linyi0604/MachineLearning # 导入手写字体 ...
基于kNN的手写字体识别——《机器学习实战》笔记
看完一节<机器学习实战>,算是踏入ML的大门了吧!这里就详细讲一下一个demo:使用kNN算法实现手写字体的简单识别 kNN 先简单介绍一下kNN,就是所谓的K-近邻算法: [作用原理]: ...
第二节，mnist手写字体识别
1.获取mnist数据集,得到正确的数据格式 mnist = input_data.read_data_sets('MNIST_data',one_hot=True) 2.定义网络大小:图片的大小是2 ...
【深度学习系列】PaddlePaddle之手写数字识别
上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下.不过呢,这块内容太复杂了,所以就简单的介绍一下padd ...
【深度学习系列】手写数字识别卷积神经--卷积神经网络CNN原理详解(一)
上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

随机推荐

Java并发编程原理与实战十九：AQS 剖析
一.引言在JDK1.5之前,一般是靠synchronized关键字来实现线程对共享变量的互斥访问.synchronized是在字节码上加指令,依赖于底层操作系统的Mutex Lock实现.而从JDK1 ...
Git为某个域名设置代理
打开Git 配置文件 vi ~/.gitconfig 添加如下配置: [http "https://github.com/"] proxy = http://127.0.0.1:1 ...
[Node.js] querystring类
和参数相关的帮助类,原生自带,直接 require('querystring') 即可使用. 此类一共包括4个方法: querystring.stringify(obj, [sep], [eq]) q ...
iOS二维码扫描的实现(Swift)
随着二维码的普遍使用,二维码扫描也成为了很多app的一个基本功能,本篇主要来介绍一下如何实现一个简单的二维码扫描功能.本文使用了XCode自带的AVFoundation 库,利用Swfit语言实现. ...
如何写一个好bug
自己的总结,和大家分享~
平铺式窗口管理器 Musca 初体验
作者: 吴吉庆 Version: 1.0 release: 2009-11-04 update: 2009-11-04 为什么用平铺式窗口管理器? 什么是平铺式窗口管理器(tiling window ...
出了一个js的题。
class test { set xx(v){ console.log('i am set'); this.__ok = v; } get xx(){ console.log('i am get'); ...
最大团 HDU-1530
传送门: 洛谷 Vjudge (题目略有不同) 题目描述 • 给定一个图 tt = (V, E) • 求一个点集 S ,使得对于任意 x ≠ y ∈ S ,x 和 y 都有一条边 • |V | ...
《区块链100问》第85集：资产代币化之对标美元USDT
USDT是Tether公司推出的对标美元(USD)的代币Tether USD.1USDT=1美元,用户可以随时使用USDT与USD进行1:1兑换.Tether公司执行1:1准备金保证制度,即每个USD ...
当遇到not a dynamic executable时怎么做
当我使用ldd查找Drcom所缺少的32为库的时候提示not a dynamic executable 最后网上找到答案来自http://forum.ubuntu.org.cn/viewtopic. ...

深度学习---手写字体识别程序分析（python）

深度学习---手写字体识别程序分析（python）的更多相关文章

随机推荐

热门专题