这段话放在前面:之前一种用的Pytorch,用着还挺爽,感觉挺方便的,但是在最近文献的时候,很多实验都是基于Google 的Keras的,所以抽空学了下Keras,学了之后才发现Keras相比Pytorch而言,基于keras来写神经网络的话太方便,因为Keras高度的封装性,所以基于Keras来搭建神经网络很简单,在Keras下,可以用两种两种方法来搭建网络模型,分别是Sequential()与Model(),对于网络结构简单,层次较少的模型使用sequential方法较好,只需不断地model.add即可,而后者更适用于网络模型复杂的情况,各有各的好处。

论GPU的重要性:在未使用GPU之前,一直用的CPU来训练,那速度,简直是龟速,一个VGG16花了10个小时,费时费力还闹心,然后今天将它加载在实验室的服务器上,只花了不到半个小时就好了。

下面给出代码:

 #!/usr/bin/env python 3.6
#_*_coding:utf-8 _*_
#@Time    :2019/11/9 15:19
#@Author  :hujinzhou 
#@FileName: My_frist_keras_moudel.py #@Software: PyCharm
from keras.datasets import mnist
from call_back import LossHistory
from keras.utils.np_utils import to_categorical
import numpy as np
import cv2
import pylab
from keras.optimizers import Adam,SGD
from matplotlib import pyplot as plt
from keras.utils.vis_utils import plot_model
from keras.layers import Dense, Activation, Flatten,Convolution2D,MaxPool2D,Dropout,BatchNormalization
from keras.models import Sequential, Model
from keras.layers.normalization import BatchNormalization
np.random.seed(10)
"""下载mnist数据集,x_train训练集的数据,y_train训练集的标签,测试集依次类推"""
(x_train,y_train),(x_test,y_test)=mnist.load_data()
print(x_train.shape)
print(len(x_train))
print(y_train[0])
"-----------------------------------------------------------------------------------------"
"""通过迭代的方法将训练集中的数据整形为32*32"""
x_train4D = [cv2.cvtColor(cv2.resize(i,(32,32)), cv2.COLOR_GRAY2BGR) for i in x_train]
x_train4D = np.concatenate([arr[np.newaxis] for arr in x_train4D]).astype('float32') x_test4D = [cv2.cvtColor(cv2.resize(i,(32,32)), cv2.COLOR_GRAY2BGR) for i in x_test]
x_test4D = np.concatenate([arr[np.newaxis] for arr in x_test4D]).astype('float32')
print(x_test4D.shape)
print(x_train4D.shape)
"------------------------------------------------------------------------------------"
plt.imshow(x_train4D[0],cmap='gray')
pylab.show()
#x_train4D = x_train4D.astype('float32')
#x_test4D = x_test4D.astype('float32')
"""归一化"""
x_test4D_normalize=x_test4D/255
x_train4D_normalize=x_train4D/255 """one_hot encoding"""
y_trainOnehot=to_categorical(y_train)
y_testOnehot=to_categorical(y_test) """建立模型"""
"--------------------------------------------------------------------------"
model=Sequential()
model.add(Convolution2D(filters=64,
kernel_size=(5,5),
padding='same',
input_shape=(32,32,3), kernel_initializer='he_normal',
name='cnn1' )
)#output32*32*64
model.add(BatchNormalization(axis=-1))
model.add(Activation('relu')) # model.add(Convolution2D(filters=64,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn2'
# )
# )#output32*32*64
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=(2,2),strides=(2, 2)))#output16*16*64 model.add(Convolution2D(filters=128,
kernel_size=(5,5),
padding='same', kernel_initializer='he_normal',
name='cnn3'
)
)#output16*16*128
model.add(BatchNormalization(axis=-1))
model.add(Activation('relu'))
# model.add(Convolution2D(filters=128,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn4'
# )
# )#output16*16*128
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=(2,2),strides=(2, 2)))#output8*8*128 model.add(Convolution2D(filters=256,
kernel_size=(5,5),
padding='same', kernel_initializer='he_normal',
name='cnn5'
)
)#output8*8*256
model.add(BatchNormalization(axis=-1))
model.add(Activation('relu'))
# model.add(Convolution2D(filters=256,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn6'
# )
# )#output8*8*256
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
# model.add(Convolution2D(filters=256,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn7'
# )
# )#output8*8*256
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=(2,2),strides=(2, 2)))#output4*4*256
model.add(Convolution2D(filters=512,
kernel_size=(5,5),
padding='same', kernel_initializer='he_normal',
name='cnn8'
)
)#output4*4*512
model.add(BatchNormalization(axis=-1))
model.add(Activation('relu'))
# model.add(Convolution2D(filters=512,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn9'
# )
# )#output4*4*512
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
# model.add(Convolution2D(filters=512,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn10'
# )
# )#output4*4*512
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=(2,2),strides=(2, 2)))#output2*2*512
model.add(Convolution2D(filters=512,
kernel_size=(5,5),
padding='same', kernel_initializer='he_normal',
name='cnn11'
)
)#output2*2*512
model.add(BatchNormalization(axis=-1))
model.add(Activation('relu'))
# model.add(Convolution2D(filters=512,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn12'
# )
# )#output2*2*512
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
# model.add(Convolution2D(filters=512,
# kernel_size=(5,5),
# padding='same',
#
# kernel_initializer='he_normal',
# name='cnn13'
# )
# )#output2*2*512
# model.add(BatchNormalization(axis=-1))
# model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=(2,2),strides=(2, 2)))#output1*1*512
model.add(Dropout(0.5))
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(10))
model.add(Activation('softmax'))
model.summary()
plot_model(model,to_file='model4.png',show_shapes=True,show_layer_names=True)
# for layer in model.layers:
# layer.trainable=False
"--------------------------------------------------------------------------------"
"""训练模型"""
adam=SGD(lr=0.1)
model.compile(optimizer=adam,loss='categorical_crossentropy',metrics=['accuracy'])
epoch=5
batchsize=100
# from keras.models import load_model
# model = load_model('./My_keras_model_weight')
history=model.fit(x=x_train4D_normalize,
y=y_trainOnehot,
epochs=epoch,
batch_size=batchsize,
validation_data=(x_test4D_normalize,y_testOnehot)) """保存模型"""
model.save('./My_keras_model2_weight') #model.load('./My_keras_model_weight')
"""画出损失曲线"""
training_loss=history.history["loss"]
train_acc=history.history["acc"]
test_loss=history.history["val_loss"]
test_acc=history.history["val_acc"] epoch_count=range(1,len(training_loss)+1)
plt.plot(epoch_count,training_loss,'r--')
plt.plot(epoch_count,test_loss,'b--')
plt.plot(epoch_count,train_acc,'r--')
plt.plot(epoch_count,test_acc,'b--')
plt.legend(["Training_loss","Test_loss","train_acc","test_acc"])
plt.xlabel("Epoch")
plt.ylabel("loss")
plt.show()

结果如下

最终的精度可以达到0.993左右

loss: 0.0261 - acc: 0.9932 - val_loss: 0.0246 - val_acc: 0.9933

基于Keras 的VGG16神经网络模型的Mnist数据集识别并使用GPU加速的更多相关文章

  1. 使用PyTorch构建神经网络模型进行手写识别

    使用PyTorch构建神经网络模型进行手写识别 PyTorch是一种基于Torch库的开源机器学习库,应用于计算机视觉和自然语言处理等应用,本章内容将从安装以及通过Torch构建基础的神经网络,计算梯 ...

  2. 一个简单的TensorFlow可视化MNIST数据集识别程序

    下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...

  3. 【Keras篇】---利用keras改写VGG16经典模型在手写数字识别体中的应用

    一.前述 VGG16是由16层神经网络构成的经典模型,包括多层卷积,多层全连接层,一般我们改写的时候卷积层基本不动,全连接层从后面几层依次向前改写,因为先改参数较小的. 二.具体 1.因为本文中代码需 ...

  4. Keras学习:第一个例子-训练MNIST数据集

    import numpy as npimport gzip import struct import keras as ks import logging from keras.layers impo ...

  5. 吴裕雄--天生自然 python数据分析:基于Keras使用CNN神经网络处理手写数据集

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.image as mp ...

  6. CNN算法解决MNIST数据集识别问题

    网络实现程序如下 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # 用于设置将记 ...

  7. Keras学习环境配置-GPU加速版(Ubuntu 16.04 + CUDA8.0 + cuDNN6.0 + Tensorflow)

    本文是个人对Keras深度学习框架配置的总结,不周之处请指出,谢谢! 1. 首先,我们需要安装Ubuntu操作系统(Windows下也行),这里使用Ubuntu16.04版本: 2. 安装好Ubunt ...

  8. 机器学习与Tensorflow(3)—— 机器学习及MNIST数据集分类优化

    一.二次代价函数 1. 形式: 其中,C为代价函数,X表示样本,Y表示实际值,a表示输出值,n为样本总数 2. 利用梯度下降法调整权值参数大小,推导过程如下图所示: 根据结果可得,权重w和偏置b的梯度 ...

  9. Keras结合Keras后端搭建个性化神经网络模型(不用原生Tensorflow)

    Keras是基于Tensorflow等底层张量处理库的高级API库.它帮我们实现了一系列经典的神经网络层(全连接层.卷积层.循环层等),以及简洁的迭代模型的接口,让我们能在模型层面写代码,从而不用仔细 ...

随机推荐

  1. Java集合--Map总结

    转载请注明出处:http://www.cnblogs.com/skywang12345/admin/EditPosts.aspx?postid=3311126 第1部分 Map概括 (01) Map ...

  2. python 中的 字符串 列表 元祖 字典

    str 1 格式化输出 %法 第一种 %s+tuple %d+tuple name = input('请输入你的姓名:') age = input('请输入你的年龄:') hobby = input( ...

  3. HDU 6619 Horse 斜率优化dp

    http://acm.hdu.edu.cn/showproblem.php?pid=6619 #include<bits/stdc++.h> #define fi first #defin ...

  4. BZOJ 4864: [BeiJing 2017 Wc]神秘物质 (块状链表/平衡树 )

    这就是一道数据结构裸题啊,最大极差就是区间最大值减最小值,最小极差就是相邻两个数差的最小值.然后平衡树splay/treap或者块状链表维护就行了. 第一次自己写块状链表,蛮好写,就是长..然后就BZ ...

  5. Springboot注解@ServletComponentScan和@ComponentScan(转)

    一.SpringBoot中使用Servlet在SpringBootApplication上使用@ServletComponentScan注解后,Servlet.Filter.Listener可以直接通 ...

  6. Test 1 T2 B 线段树合并

    模拟赛的T2,多敲了两行成功爆掉~ 写线段树合并的时候一定要注意一下不能随意新开节点. code: #include <bits/stdc++.h> #define N 100009 #d ...

  7. 18.4.1 考试解题报告 P71

    题目:https://files.cnblogs.com/files/lovewhy/problem.pdf 偷偷摘来dalao题面. P71竞赛时间:???? 年?? 月?? 日??:??-??:? ...

  8. access函数

    access函数是按照实际用户ID和实际组ID进行访问测试的.函数的定义如下: #include <unistd.h> int access(const char* pathname, i ...

  9. 通过zabbix来监控树莓派

    安装zabbix-agent(4.0版本) 配置zabbix-agent(使用主动模式) 使用zabbix-sender(主动推送自定义数据) 以下 执行命令和相关配置文件: wget https:/ ...

  10. windows游戏编程鼠标

    ①.常用鼠标消息: WM_MOUSEMOVE           鼠标移动位置 WM_LBUTTONDOWN       鼠标左键按下 WM_LBUTTONUP             鼠标左键弹起 ...