上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下。不过呢,这块内容太复杂了,所以就简单的介绍一下paddlepaddle的第一个“hello word”程序----mnist手写数字识别。下一次再介绍用PaddlePaddle做分布式训练的方案。其实之前也写过一篇用CNN识别手写数字集的文章(链接戳这里~),是用keras实现的,这次用了paddlepaddle后,正好可以简单对比一下两个框架的优劣。
 
什么是PaddlePaddle?
  PaddlePaddle是百度推出的一个深度学习框架,可能大多数人平常用的比较多的一般是tensorflow,caffe,mxnet等,但其实PaddlePaddle也是一个非常不错的框架(据说以前叫Paddle,现在改名叫PaddlePaddle,不知道为啥总觉得有股莫名的萌点)
 
PaddlePaddle能做什么?
  传统的基本都能做,尤其对NLP的支持很好,譬如情感分析,word embedding,语言模型等,反正你想得到的,常见的都可以用它来试一试~
 
PaddlePaddle的安装
  不得不吐槽一下PaddlePaddle的安装,官网上说“PaddlePaddle目前唯一官方支持的运行的方式是Docker容器”,而docker其实在国内还并不是特别的流行,之前遇到的所有的框架,都有很多种安装方式,非常方便,所以这个唯一支持docker让人觉得非常诡异 = =!不过偶然试了一下,居然可以用pip install,不过为啥官网上没有写呢?所以,对于新手来说,最简单的安装方式就是:
  • CPU版本安装

pip install paddlepaddle

  • GPU版本安装

pip install paddlepaddle-gpu

 
 用PaddlePaddle实现手写数字识别
  训练步骤
  传统的方式这次就不展开讲了,为了对比我们还是用CNN来进行训练。PaddlePaddle训练一次模型完整的过程可以如下几个步骤:
导入数据---->定义网络结构---->训练模型---->保存模型---->测试结果  
  下面,我直接用代码来展示训练的过程(以后代码都会放在github里):
 
  1. #coding:utf-8
  2. import os
  3. from PIL import Image
  4. import numpy as np
  5. import paddle.v2 as paddle
  6.  
  7. # 设置是否用gpu,0为否,1为是
  8. with_gpu = os.getenv('WITH_GPU', '') != ''
  9.  
  10. # 定义网络结构
  11. def convolutional_neural_network_org(img):
  12. # 第一层卷积层
  13. conv_pool_1 = paddle.networks.simple_img_conv_pool(
  14. input=img,
  15. filter_size=5,
  16. num_filters=20,
  17. num_channel=1,
  18. pool_size=2,
  19. pool_stride=2,
  20. act=paddle.activation.Relu())
  21. # 第二层卷积层
  22. conv_pool_2 = paddle.networks.simple_img_conv_pool(
  23. input=conv_pool_1,
  24. filter_size=5,
  25. num_filters=50,
  26. num_channel=20,
  27. pool_size=2,
  28. pool_stride=2,
  29. act=paddle.activation.Relu())
  30. # 全连接层
  31. predict = paddle.layer.fc(
  32. input=conv_pool_2, size=10, act=paddle.activation.Softmax())
  33. return predict
  34.  
  35. def main():
  36. # 初始化定义跑模型的设备
  37. paddle.init(use_gpu=with_gpu, trainer_count=1)
  38.  
  39. # 读取数据
  40. images = paddle.layer.data(
  41. name='pixel', type=paddle.data_type.dense_vector(784))
  42. label = paddle.layer.data(
  43. name='label', type=paddle.data_type.integer_value(10))
  44.  
  45. # 调用之前定义的网络结构
  46. predict = convolutional_neural_network_org(images)
  47.  
  48. # 定义损失函数
  49. cost = paddle.layer.classification_cost(input=predict, label=label)
  50.  
  51. # 指定训练相关的参数
  52. parameters = paddle.parameters.create(cost)
  53.  
  54. # 定义训练方法
  55. optimizer = paddle.optimizer.Momentum(
  56. learning_rate=0.1 / 128.0,
  57. momentum=0.9,
  58. regularization=paddle.optimizer.L2Regularization(rate=0.0005 * 128))
  59.  
  60. # 训练模型
  61. trainer = paddle.trainer.SGD(
  62. cost=cost, parameters=parameters, update_equation=optimizer)
  63.  
  64. lists = []
  65.  
  66. # 定义event_handler,输出训练过程中的结果
  67. def event_handler(event):
  68. if isinstance(event, paddle.event.EndIteration):
  69. if event.batch_id % 100 == 0:
  70. print "Pass %d, Batch %d, Cost %f, %s" % (
  71. event.pass_id, event.batch_id, event.cost, event.metrics)
  72. if isinstance(event, paddle.event.EndPass):
  73. # 保存参数
  74. with open('params_pass_%d.tar' % event.pass_id, 'w') as f:
  75. parameters.to_tar(f)
  76.  
  77. result = trainer.test(reader=paddle.batch(
  78. paddle.dataset.mnist.test(), batch_size=128))
  79. print "Test with Pass %d, Cost %f, %s\n" % (
  80. event.pass_id, result.cost, result.metrics)
  81. lists.append((event.pass_id, result.cost,
  82. result.metrics['classification_error_evaluator']))
  83.  
  84. trainer.train(
  85. reader=paddle.batch(
  86. paddle.reader.shuffle(paddle.dataset.mnist.train(), buf_size=8192),
  87. batch_size=128),
  88. event_handler=event_handler,
  89. num_passes=10)
  90.  
  91. # 找到训练误差最小的一次结果
  92. best = sorted(lists, key=lambda list: float(list[1]))[0]
  93. print 'Best pass is %s, testing Avgcost is %s' % (best[0], best[1])
  94. print 'The classification accuracy is %.2f%%' % (100 - float(best[2]) * 100)
  95.  
  96. # 加载数据
  97. def load_image(file):
  98. im = Image.open(file).convert('L')
  99. im = im.resize((28, 28), Image.ANTIALIAS)
  100. im = np.array(im).astype(np.float32).flatten()
  101. im = im / 255.0
  102. return im
  103.  
  104. # 测试结果
  105. test_data = []
  106. cur_dir = os.path.dirname(os.path.realpath(__file__))
  107. test_data.append((load_image(cur_dir + '/image/infer_3.png'), ))
  108.  
  109. probs = paddle.infer(
  110. output_layer=predict, parameters=parameters, input=test_data)
  111. lab = np.argsort(-probs) # probs and lab are the results of one batch data
  112. print "Label of image/infer_3.png is: %d" % lab[0][0]
  113.  
  114. if __name__ == '__main__':
  115. main()

  上面的代码看起来很长,但结构还是很清楚的。下面我们用实际数据测试一下,看一下效果到底怎么样~

 

  BaseLine版本
 
  首先我用了官网给出的例子,直接用最基本的CNN网络结构训练了一下,代码如下: 
  1. def convolutional_neural_network_org(img):
  2. # 第一层卷积层
  3. conv_pool_1 = paddle.networks.simple_img_conv_pool(
  4. input=img,
  5. filter_size=5,
  6. num_filters=20,
  7. num_channel=1,
  8. pool_size=2,
  9. pool_stride=2,
  10. act=paddle.activation.Relu())
  11. # 第二层卷积层
  12. conv_pool_2 = paddle.networks.simple_img_conv_pool(
  13. input=conv_pool_1,
  14. filter_size=5,
  15. num_filters=50,
  16. num_channel=20,
  17. pool_size=2,
  18. pool_stride=2,
  19. act=paddle.activation.Relu())
  20. # 全连接层
  21. predict = paddle.layer.fc(
  22. input=conv_pool_2, size=10, act=paddle.activation.Softmax())
  23. return predict

  输出结果如下:

  1. I1023 13:45:46.519075 34144 Util.cpp:166] commandline: --use_gpu=True --trainer_count=1
  2. [INFO 2017-10-23 13:45:52,667 layers.py:2539] output for __conv_pool_0___conv: c = 20, h = 24, w = 24, size = 11520
  3. [INFO 2017-10-23 13:45:52,667 layers.py:2667] output for __conv_pool_0___pool: c = 20, h = 12, w = 12, size = 2880
  4. [INFO 2017-10-23 13:45:52,668 layers.py:2539] output for __conv_pool_1___conv: c = 50, h = 8, w = 8, size = 3200
  5. [INFO 2017-10-23 13:45:52,669 layers.py:2667] output for __conv_pool_1___pool: c = 50, h = 4, w = 4, size = 800
  6. I1023 13:45:52.675750 34144 GradientMachine.cpp:85] Initing parameters..
  7. I1023 13:45:52.686153 34144 GradientMachine.cpp:92] Init parameters done.
  8. Pass 0, Batch 0, Cost 3.048408, {'classification_error_evaluator': 0.890625}
  9. Pass 0, Batch 100, Cost 0.188828, {'classification_error_evaluator': 0.0546875}
  10. Pass 0, Batch 200, Cost 0.075183, {'classification_error_evaluator': 0.015625}
  11. Pass 0, Batch 300, Cost 0.070798, {'classification_error_evaluator': 0.015625}
  12. Pass 0, Batch 400, Cost 0.079673, {'classification_error_evaluator': 0.046875}
  13. Test with Pass 0, Cost 0.074587, {'classification_error_evaluator': 0.023800000548362732}
  14. ```
  15. ```
  16. ```
  17. Pass 4, Batch 0, Cost 0.032454, {'classification_error_evaluator': 0.015625}
  18. Pass 4, Batch 100, Cost 0.021028, {'classification_error_evaluator': 0.0078125}
  19. Pass 4, Batch 200, Cost 0.020458, {'classification_error_evaluator': 0.0}
  20. Pass 4, Batch 300, Cost 0.046728, {'classification_error_evaluator': 0.015625}
  21. Pass 4, Batch 400, Cost 0.030264, {'classification_error_evaluator': 0.015625}
  22. Test with Pass 4, Cost 0.035841, {'classification_error_evaluator': 0.01209999993443489}
  23.  
  24. Best pass is 4, testing Avgcost is 0.0358410408473
  25. The classification accuracy is 98.79%
  26. Label of image/infer_3.png is: 3
  27.  
  28. real 0m31.565s
  29. user 0m20.996s
  30. sys 0m15.891s

  可以看到,第一行输出选择的设备是否是gpu,这里我选择的是gpu,所以等于1,如果是cpu,就是0。接下来四行输出的是网络结构,然后开始输出训练结果,训练结束,我们把这几次迭代中误差最小的结果输出来,98.79%,效果还是很不错的,毕竟只迭代了5次。最后看一下输出时间,非常快,约31秒。然而这个结果我并不是特别满意,因为之前用keras做的时候调整的网络模型训练往后准确率能够达到99.72%,不过速度非常慢,迭代69次大概需要30分钟左右,所以我觉得这个网络结构还是可以改进一下的,所以我对这个网络结构改进了一下,请看改进版


  改进版 

  1. def convolutional_neural_network(img):
  2. # 第一层卷积层
  3. conv_pool_1 = paddle.networks.simple_img_conv_pool(
  4. input=img,
  5. filter_size=5,
  6. num_filters=20,
  7. num_channel=1,
  8. pool_size=2,
  9. pool_stride=2,
  10. act=paddle.activation.Relu())
  11. # 加一层dropout层
  12. drop_1 = paddle.layer.dropout(input=conv_pool_1, dropout_rate=0.2)
  13. # 第二层卷积层
  14. conv_pool_2 = paddle.networks.simple_img_conv_pool(
  15. input=drop_1,
  16. filter_size=5,
  17. num_filters=50,
  18. num_channel=20,
  19. pool_size=2,
  20. pool_stride=2,
  21. act=paddle.activation.Relu())
  22. # 加一层dropout层
  23. drop_2 = paddle.layer.dropout(input=conv_pool_2, dropout_rate=0.5)
  24. # 全连接层
  25. fc1 = paddle.layer.fc(input=drop_2, size=10, act=paddle.activation.Linear())
  26. bn = paddle.layer.batch_norm(input=fc1,act=paddle.activation.Relu(),
  27. layer_attr=paddle.attr.Extra(drop_rate=0.2))
  28. predict = paddle.layer.fc(input=bn, size=10, act=paddle.activation.Softmax())
  29. return predict

  在改进版里我们加了一些dropout层来避免过拟合。分别在第一层卷积层和第二层卷积层后加了dropout,阈值设为0.5。改变网络结构也非常简单,直接在定义的网络结构函数里对模型进行修改即可,这一点其实和keras的网络结构定义方式还是挺像的,易用性很高。下面来看看效果:

  1. I1023 14:01:51.653827 34244 Util.cpp:166] commandline: --use_gpu=True --trainer_count=1
  2. [INFO 2017-10-23 14:01:57,830 layers.py:2539] output for __conv_pool_0___conv: c = 20, h = 24, w = 24, size = 11520
  3. [INFO 2017-10-23 14:01:57,831 layers.py:2667] output for __conv_pool_0___pool: c = 20, h = 12, w = 12, size = 2880
  4. [INFO 2017-10-23 14:01:57,832 layers.py:2539] output for __conv_pool_1___conv: c = 50, h = 8, w = 8, size = 3200
  5. [INFO 2017-10-23 14:01:57,833 layers.py:2667] output for __conv_pool_1___pool: c = 50, h = 4, w = 4, size = 800
  6. I1023 14:01:57.842871 34244 GradientMachine.cpp:85] Initing parameters..
  7. I1023 14:01:57.854014 34244 GradientMachine.cpp:92] Init parameters done.
  8. Pass 0, Batch 0, Cost 2.536199, {'classification_error_evaluator': 0.875}
  9. Pass 0, Batch 100, Cost 1.668236, {'classification_error_evaluator': 0.515625}
  10. Pass 0, Batch 200, Cost 1.024846, {'classification_error_evaluator': 0.375}
  11. Pass 0, Batch 300, Cost 1.086315, {'classification_error_evaluator': 0.46875}
  12. Pass 0, Batch 400, Cost 0.767804, {'classification_error_evaluator': 0.25}
  13. Pass 0, Batch 500, Cost 0.545784, {'classification_error_evaluator': 0.1875}
  14. Pass 0, Batch 600, Cost 0.731662, {'classification_error_evaluator': 0.328125}
  15. ```
  16. ```
  17. ```
  18. Pass 49, Batch 0, Cost 0.415184, {'classification_error_evaluator': 0.09375}
  19. Pass 49, Batch 100, Cost 0.067616, {'classification_error_evaluator': 0.0}
  20. Pass 49, Batch 200, Cost 0.161415, {'classification_error_evaluator': 0.046875}
  21. Pass 49, Batch 300, Cost 0.202667, {'classification_error_evaluator': 0.046875}
  22. Pass 49, Batch 400, Cost 0.336043, {'classification_error_evaluator': 0.140625}
  23. Pass 49, Batch 500, Cost 0.290948, {'classification_error_evaluator': 0.125}
  24. Pass 49, Batch 600, Cost 0.223433, {'classification_error_evaluator': 0.109375}
  25. Pass 49, Batch 700, Cost 0.217345, {'classification_error_evaluator': 0.0625}
  26. Pass 49, Batch 800, Cost 0.163140, {'classification_error_evaluator': 0.046875}
  27. Pass 49, Batch 900, Cost 0.203645, {'classification_error_evaluator': 0.078125}
  28. Test with Pass 49, Cost 0.033639, {'classification_error_evaluator': 0.008100000210106373}
  29.  
  30. Best pass is 48, testing Avgcost is 0.0313018567383
  31. The classification accuracy is 99.28%
  32. Label of image/infer_3.png is: 3
  33.  
  34. real 5m3.151s
  35. user 4m0.052s
  36. sys 1m8.084s
  从上面的数据来看,这个效果还是很不错滴,对比之前用keras训练的效果来看,结果如下:
                    
 
 
  可以看到这个速度差异是很大的了,在准确率差不多的情况下,训练时间几乎比原来缩短了六倍,网络结构也相对简单,说明需要调整的参数也少了很多。
 
总结
  paddlepaddle用起来还是很方便的,不论是定义网络结构还是训练速度,都值得一提,然而我个人的体验中,认为最值得说的是这几点:
 
1.导入数据方便。这次训练的手写数字识别数据量比较小,但是如果想要添加数据,也非常方便,直接添加到相应目录下。
2.event_handler机制,可以自定义训练结果输出内容。之前用的keras,以及mxnet等都是已经封装好的函数,输出信息都是一样的,这里paddlepaddle把这个函数并没有完全封装,而是让我们用户自定义输出的内容,可以方便我们减少冗余的信息,增加一些模型训练的细节的输出,也可以用相应的函数画出模型收敛的图片,可视化收敛曲线。
3.速度快。上面的例子已经证明了paddlepaddle的速度,并且在提升速度的同时,模型准确度也与最优结果相差不多,这对于我们训练海量数据的模型是一个极大的优势啊!
 
然而,paddlepaddle也有几点让我用的有点难受,譬如文档太少了啊,报错了上网上搜没啥结果啊等等,不过我觉得这个应该不是大问题,以后用的人多了以后肯定相关资料也会更多。所以一直很疑惑,为啥paddlepaddle不火呢?安装诡异是一个吐槽点,但其实还是很优秀的一个开源软件,尤其是最值得说的分布式训练方式,多机多卡的设计是非常优秀的,本篇没有讲,下次讲讲如何用paddlepaddle做单机单卡,单机多卡,多机单卡和多机多卡的训练方式来训练模型,大家多多用起来呀~~可以多交流呀~
 
ps:由于paddlepaddle的文档实在太少了,官网的文章理论介绍的比较多,网上的博文大多数都是几个经典例子来回跑,所以我打算写个系列,跟实战相关的,不再只有深度学习的“hello world”程序,这次用“hello world”做个引子,下篇开始写点干货哈哈~
 
 
  
 
  
 

【深度学习系列】PaddlePaddle之手写数字识别的更多相关文章

  1. NN:利用深度学习之神经网络实现手写数字识别(数据集50000张图片)—Jason niu

    import mnist_loader import network training_data, validation_data, test_data = mnist_loader.load_dat ...

  2. TensorFlow 卷积神经网络手写数字识别数据集介绍

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 手写数字识别 接下来将会以 MNIST 数据集为例,使用卷积层和池 ...

  3. 实现手写数字识别(数据集50000张图片)比较3种算法神经网络、灰度平均值、SVM各自的准确率—Jason niu

    对手写数据集50000张图片实现阿拉伯数字0~9识别,并且对结果进行分析准确率, 手写数字数据集下载:http://yann.lecun.com/exdb/mnist/ 首先,利用图片本身的属性,图片 ...

  4. 【深度学习系列】手写数字识别卷积神经--卷积神经网络CNN原理详解(一)

    上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

  5. 【PaddlePaddle系列】手写数字识别

      最近百度为了推广自家编写对深度学习框架PaddlePaddle不断推出各种比赛.百度声称PaddlePaddle是一个“易学.易用”的开源深度学习框架,然而网上的资料少之又少.虽然百度很用心地提供 ...

  6. 深度学习之 mnist 手写数字识别

    深度学习之 mnist 手写数字识别 开始学习深度学习,先来一个手写数字的程序 import numpy as np import os import codecs import torch from ...

  7. 深度学习之PyTorch实战(3)——实战手写数字识别

    上一节,我们已经学会了基于PyTorch深度学习框架高效,快捷的搭建一个神经网络,并对模型进行训练和对参数进行优化的方法,接下来让我们牛刀小试,基于PyTorch框架使用神经网络来解决一个关于手写数字 ...

  8. 用MXnet实战深度学习之一:安装GPU版mxnet并跑一个MNIST手写数字识别

    用MXnet实战深度学习之一:安装GPU版mxnet并跑一个MNIST手写数字识别 http://phunter.farbox.com/post/mxnet-tutorial1 用MXnet实战深度学 ...

  9. 深度学习面试题12:LeNet(手写数字识别)

    目录 神经网络的卷积.池化.拉伸 LeNet网络结构 LeNet在MNIST数据集上应用 参考资料 LeNet是卷积神经网络的祖师爷LeCun在1998年提出,用于解决手写数字识别的视觉任务.自那时起 ...

随机推荐

  1. 201521123119《Java程序设计》第4周学习总结

    1. 本周学习总结 2.书面作业 1.注释的应用 使用类的注释与方法的注释为前面编写的类与方法进行注释,并在Eclipse中查看.(截图) 2.面向对象设计(大作业1,非常重要) 2.1 将在网上商城 ...

  2. 201521123049 《JAVA程序设计》 第3周学习总结

    1. 本周学习总结 1.学习了对象与类的定义: 2.掌握了构造函数与其重载: 3.学会了this关键字的利用: 4.明白了静态变量与非静态变量的区分. 下面是对本周学习的图片小结: 2. 书面作业 Q ...

  3. 201521123113 《Java程序设计》第2周学习总结

    1.本周学习总结 学习了各种java数据类型以及各种运算符的使用 string类之所以好用是因为这是人可以看得懂的类型,操作简便 Scanner扫描器与标准输出输入用法上的不同,Scanner较标准输 ...

  4. 201521123122 《java程序设计》第九周学习总结

    201521123122 <java程序设计>第九周实验总结 1. 本周学习总结 以你喜欢的方式(思维导图或其他)归纳总结集合相关内容. 2. 书面作业 常用异常 题目5-1 1.1 截图 ...

  5. 多线程:head first Thread.join()

    不使用Thread.join() 测试线程 先上代码: /** * Created by Zero on 2017/8/23. */ public class TestJoin implements ...

  6. Spring-Struts2-基本集成

    步骤: 1,导入struts2的相关jar包(检查是否有冲突的包,即同一个包有不同的几个版本存在) 2,导入struts2和spring的整合包 struts2-spring-plugin-2.3.4 ...

  7. 凸包GiftWrapping GrahamScan 算法实现

    开始 游戏内有需求做多边形碰撞功能,但是接入box2d相对游戏的需求来说太重度了.所以准备自己实现碰撞. 确定多边形,必然要用到凸包的算法.在github上也找到了一些lua实现,但是这里的算法没有考 ...

  8. jquery模板下载网站

    jquery模板下载网站 http://www.jqshare.com/

  9. JS设计模式(三) 数据访问对象模式

    引言 HTML5 提供了两种在客户端存储数据的新方法:localStorage.sessionStorage,他们是Web Storage API 提供的两种存储机制,区别在于前者属于永久性存储,而后 ...

  10. Merge Two Binary Trees

    Given two binary trees and imagine that when you put one of them to cover the other, some nodes of t ...