



由于主要是使用lenet模型训练自己的图片数据,我的图像数据共有10个类别,分别是0~9,相应地保存在名为0~9的文件夹,在/homg/您的用户名/下新建一文件夹char_images,用于保存图像数据,在/homg/您的用户名/char_images/下新建两个文件夹,名字分别为train和val,各自都包含了名为0~9的文件夹,例如文件夹0内存放的是字符”0”的图像,我的文件夹 如下:



  1. #coding:utf-8
  2. import cv2
  3. import os
  4. def IsSubString( SubStrList , Str):  #判断SubStrList的元素
  5. flag = True                  #是否在Str内
  6. for substr in SubStrList:
  7. if not ( substr in Str):
  8. flag = False
  9. return flag
  10. def GetFileList(FindPath,FlagStr=[]):  #搜索目录下的子文件路径
  11. FileList=[]
  12. FileNames=os.listdir(FindPath)
  13. if len(FileNames)>0:
  14. for fn in FileNames:
  15. if len(FlagStr)>0:
  16. if IsSubString(FlagStr,fn): #不明白这里判断是为了啥
  17. fullfilename=os.path.join(FindPath,fn)
  18. FileList.append(fullfilename)
  19. else:
  20. fullfilename=os.path.join(FindPath,fn)
  21. FileList.append(fullfilename)
  22. if len(FileList)>0:
  23. FileList.sort()
  24. return FileList
  25. train_txt = open('train.txt' , 'w') #制作标签数据
  26. classList =['0','1','2','3','4','5','6','7','8','9']
  27. for idx in range(len(classList)) :
  28. imgfile=GetFileList('train/'+ classList[idx])#将数据集放在与.py文件相同目录下
  29. for img in imgfile:
  30. srcImg = cv2.imread( img);
  31. resizedImg = cv2.resize(srcImg , (28,28))
  32. cv2.imwrite( img  ,resizedImg)
  33. strTemp=img+' '+classList[idx]+'\n'        #用空格代替转义字符 \t
  34. train_txt.writelines(strTemp)
  35. train_txt.close()
  36. test_txt = open('val.txt' , 'w') #制作标签数据
  37. for idx in range(len(classList)) :
  38. imgfile=GetFileList('val/'+ classList[idx])
  39. for img in imgfile:
  40. srcImg = cv2.imread( img);
  41. resizedImg = cv2.resize(srcImg , (28,28))
  42. cv2.imwrite( img  ,resizedImg)
  43. strTemp=img+' '+classList[idx]+'\n'        #用空格代替转义字符 \t
  44. test_txt.writelines(strTemp)
  45. test_txt.close()
  46. print("成功生成文件列表")





将caffe路径下 examples/imagenet/create_imagenet.sh 复制一份到Build_lmdb文件夹下

打开create_imagenet.sh ,修改内容如下:

  1. #!/usr/bin/env sh
  2. # Create the imagenet lmdb inputs
  3. # N.B. set the path to the imagenet train + val data dirs
  4. set -e
  5. EXAMPLE=My_File/Build_lmdb         #生成的lmdb格式数据保存地址
  6. DATA=My_File/Data_label                 #两个txt标签文件所在路径
  7. TOOLS=build/tools                            #caffe自带工具,不用管
  8. TRAIN_DATA_ROOT=/home/zjy/char_images/    #预先准备的训练图片路径,该路径和train.txt上写的路径合起来是图片完整路径
  9. VAL_DATA_ROOT=/home/zjy/char_images/         #预先准备的测试图片路径,...
  10. # Set RESIZE=true to resize the images to 256x256. Leave as false if images have
  11. # already been resized using another tool.
  12. RESIZE=false
  13. if $RESIZE; then
  16. else
  19. fi
  20. if [ ! -d "$TRAIN_DATA_ROOT" ]; then
  21. echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
  22. echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
  23. "where the ImageNet training data is stored."
  24. exit 1
  25. fi
  26. if [ ! -d "$VAL_DATA_ROOT" ]; then
  27. echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
  28. echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
  29. "where the ImageNet validation data is stored."
  30. exit 1
  31. fi
  32. echo "Creating train lmdb..."
  33. GLOG_logtostderr=1 $TOOLS/convert_imageset \
  34. --resize_height=$RESIZE_HEIGHT \
  35. --resize_width=$RESIZE_WIDTH \
  36. --shuffle \
  37. --gray \        #灰度图像加上这个
  39. $DATA/train.txt \
  40. $EXAMPLE/train_lmdb                   #生成的lmdb格式训练数据集所在的文件夹
  41. echo "Creating val lmdb..."
  42. GLOG_logtostderr=1 $TOOLS/convert_imageset \
  43. --resize_height=$RESIZE_HEIGHT \
  44. --resize_width=$RESIZE_WIDTH \
  45. --shuffle \
  46. --gray \        #灰度图像加上这个
  47. $VAL_DATA_ROOT \
  48. $DATA/val.txt \
  49. $EXAMPLE/val_lmdb              #生成的lmdb格式训练数据集所在的文件夹
  50. echo "Done."


将caffe/examples/mnist下的 train_lenet.sh 、lenet_solver.prototxt 、lenet_train_test.prototxt 这三个文件复制至 My_File,首先修改train_lenet.sh 如下,只改了solver.prototxt的路径

  1. #!/usr/bin/env sh
  2. set -e
  3. ./build/tools/caffe train --solver=My_File/lenet_solver.prototxt $@    #改路径


  1. # The train/test net protocol buffer definition
  2. net: "My_File/lenet_train_test.prototxt"            #改这里
  3. # test_iter specifies how many forward passes the test should carry out.
  4. # In the case of MNIST, we have test batch size 100 and 100 test iterations,
  5. # covering the full 10,000 testing images.
  6. test_iter: 100
  7. # Carry out testing every 500 training iterations.
  8. test_interval: 500
  9. # The base learning rate, momentum and the weight decay of the network.
  10. base_lr: 0.01
  11. momentum: 0.9
  12. weight_decay: 0.0005
  13. # The learning rate policy
  14. lr_policy: "inv"
  15. gamma: 0.0001
  16. power: 0.75
  17. # Display every 100 iterations
  18. display: 100
  19. # The maximum number of iterations
  20. max_iter: 10000
  21. # snapshot intermediate results
  22. snapshot: 5000
  23. snapshot_prefix: "My_File/"         #改这里
  24. # solver mode: CPU or GPU
  25. solver_mode: GPU

最后修改lenet_train_test.prototxt ,如下:

  1. name: "LeNet"
  2. layer {
  3. name: "mnist"
  4. type: "Data"
  5. top: "data"
  6. top: "label"
  7. include {
  8. phase: TRAIN
  9. }
  10. transform_param {
  11. scale: 0.00390625
  12. }
  13. data_param {
  14. source: "My_File/Build_lmdb/train_lmdb"       #改成自己的
  15. batch_size: 64
  16. backend: LMDB
  17. }
  18. }
  19. layer {
  20. name: "mnist"
  21. type: "Data"
  22. top: "data"
  23. top: "label"
  24. include {
  25. phase: TEST
  26. }
  27. transform_param {
  28. scale: 0.00390625
  29. }
  30. data_param {
  31. source: "My_File/Build_lmdb/val_lmdb"        #改成自己的
  32. batch_size: 100
  33. backend: LMDB
  34. }
  35. }
  36. layer {
  37. name: "conv1"
  38. type: "Convolution"
  39. bottom: "data"
  40. top: "conv1"
  41. param {
  42. lr_mult: 1
  43. }
  44. param {
  45. lr_mult: 2
  46. }
  47. convolution_param {
  48. num_output: 20
  49. kernel_size: 5
  50. stride: 1
  51. weight_filler {
  52. type: "xavier"
  53. }
  54. bias_filler {
  55. type: "constant"
  56. }
  57. }
  58. }
  59. layer {
  60. name: "pool1"
  61. type: "Pooling"
  62. bottom: "conv1"
  63. top: "pool1"
  64. pooling_param {
  65. pool: MAX
  66. kernel_size: 2
  67. stride: 2
  68. }
  69. }
  70. layer {
  71. name: "conv2"
  72. type: "Convolution"
  73. bottom: "pool1"
  74. top: "conv2"
  75. param {
  76. lr_mult: 1
  77. }
  78. param {
  79. lr_mult: 2
  80. }
  81. convolution_param {
  82. num_output: 50
  83. kernel_size: 5
  84. stride: 1
  85. weight_filler {
  86. type: "xavier"
  87. }
  88. bias_filler {
  89. type: "constant"
  90. }
  91. }
  92. }
  93. layer {
  94. name: "pool2"
  95. type: "Pooling"
  96. bottom: "conv2"
  97. top: "pool2"
  98. pooling_param {
  99. pool: MAX
  100. kernel_size: 2
  101. stride: 2
  102. }
  103. }
  104. layer {
  105. name: "ip1"
  106. type: "InnerProduct"
  107. bottom: "pool2"
  108. top: "ip1"
  109. param {
  110. lr_mult: 1
  111. }
  112. param {
  113. lr_mult: 2
  114. }
  115. inner_product_param {
  116. num_output: 500
  117. weight_filler {
  118. type: "xavier"
  119. }
  120. bias_filler {
  121. type: "constant"
  122. }
  123. }
  124. }
  125. layer {
  126. name: "relu1"
  127. type: "ReLU"
  128. bottom: "ip1"
  129. top: "ip1"
  130. }
  131. layer {
  132. name: "ip2"
  133. type: "InnerProduct"
  134. bottom: "ip1"
  135. top: "ip2"
  136. param {
  137. lr_mult: 1
  138. }
  139. param {
  140. lr_mult: 2
  141. }
  142. inner_product_param {
  143. num_output: 10
  144. weight_filler {
  145. type: "xavier"
  146. }
  147. bias_filler {
  148. type: "constant"
  149. }
  150. }
  151. }
  152. layer {
  153. name: "accuracy"
  154. type: "Accuracy"
  155. bottom: "ip2"
  156. bottom: "label"
  157. top: "accuracy"
  158. include {
  159. phase: TEST
  160. }
  161. }
  162. layer {
  163. name: "loss"
  164. type: "SoftmaxWithLoss"
  165. bottom: "ip2"
  166. bottom: "label"
  167. top: "loss"
  168. }

运行 My_File/train_lenet.sh ,得到最后的训练结果,在My_File下生成训练的caffemodel和solverstate。

build/tools/compute_image_mean My_File/Build_lmdb/train_lmdb My_File/Mean/mean.binaryproto
deploy.prototxt是在lenet_train_test.prototxt的基础上删除了开头的Train和Test部分以及结尾的Accuracy、SoftmaxWithLoss层,并在开始时增加了一个data层描述,结尾增加softmax层,可以参照博文http://blog.csdn.net/lanxuecc/article/details/52474476 使用python生成,也可以直接由train_val.prototxt上做修改,在My_File文件夹下新建一文件夹Deploy,将 lenet_train_test.prototxt复制至文件夹Deploy下,并重命名为deploy.prototxt ,修改里面的内容如下:

  1. name: "LeNet"
  2. layer {                   #删去原来的Train和Test部分,增加一个data层
  3. name: "data"
  4. type: "Input"
  5. top: "data"
  6. input_param { shape: { dim: 1 dim: 1 dim: 28 dim: 28 } }
  7. }
  8. layer {
  9. name: "conv1"
  10. type: "Convolution"
  11. bottom: "data"
  12. top: "conv1"
  13. param {
  14. lr_mult: 1
  15. }
  16. param {
  17. lr_mult: 2
  18. }
  19. convolution_param {
  20. num_output: 20
  21. kernel_size: 5
  22. stride: 1
  23. weight_filler {
  24. type: "xavier"
  25. }
  26. bias_filler {
  27. type: "constant"
  28. }
  29. }
  30. }
  31. layer {
  32. name: "pool1"
  33. type: "Pooling"
  34. bottom: "conv1"
  35. top: "pool1"
  36. pooling_param {
  37. pool: MAX
  38. kernel_size: 2
  39. stride: 2
  40. }
  41. }
  42. layer {
  43. name: "conv2"
  44. type: "Convolution"
  45. bottom: "pool1"
  46. top: "conv2"
  47. param {
  48. lr_mult: 1
  49. }
  50. param {
  51. lr_mult: 2
  52. }
  53. convolution_param {
  54. num_output: 50
  55. kernel_size: 5
  56. stride: 1
  57. weight_filler {
  58. type: "xavier"
  59. }
  60. bias_filler {
  61. type: "constant"
  62. }
  63. }
  64. }
  65. layer {
  66. name: "pool2"
  67. type: "Pooling"
  68. bottom: "conv2"
  69. top: "pool2"
  70. pooling_param {
  71. pool: MAX
  72. kernel_size: 2
  73. stride: 2
  74. }
  75. }
  76. layer {
  77. name: "ip1"
  78. type: "InnerProduct"
  79. bottom: "pool2"
  80. top: "ip1"
  81. param {
  82. lr_mult: 1
  83. }
  84. param {
  85. lr_mult: 2
  86. }
  87. inner_product_param {
  88. num_output: 500
  89. weight_filler {
  90. type: "xavier"
  91. }
  92. bias_filler {
  93. type: "constant"
  94. }
  95. }
  96. }
  97. layer {
  98. name: "relu1"
  99. type: "ReLU"
  100. bottom: "ip1"
  101. top: "ip1"
  102. }
  103. layer {
  104. name: "ip2"
  105. type: "InnerProduct"
  106. bottom: "ip1"
  107. top: "ip2"
  108. param {
  109. lr_mult: 1
  110. }
  111. param {
  112. lr_mult: 2
  113. }
  114. inner_product_param {
  115. num_output: 10
  116. weight_filler {
  117. type: "xavier"
  118. }
  119. bias_filler {
  120. type: "constant"
  121. }
  122. }
  123. }
  124. layer {                   #增加softmax层
  125. name: "prob"
  126. type: "Softmax"
  127. bottom: "ip2"
  128. top: "prob"
  129. }







