基于GoogLeNet的不同花分类微调训练案例

import tensorflow as tf

from tensorflow.contrib.slim import nets

slim = tf.contrib.slim

import numpy as np

/root/anaconda3/lib/python3.6/site-packages/h5py/__init__.py:36: FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`.

  from ._conv import register_converters as _register_converters

class GoogLeNet(object):   

    def __init__(self, lr, batch_size, iter_num):

        self.lr = lr   # 学习率

        self.batch_size = batch_size

        self.iter_num = iter_num   # 总共训练多少次

        tf.reset_default_graph()   # 重置图。有时候大家运行程序时候会提示某某tensor已经被构造。这是因为之前创建的图还在，然后重新运行一遍代码又创建了一个新图。可以在这里加一句tf.reset_default_graph()

        self.X = tf.placeholder(tf.float32, [None, 224, 224, 3])

        self.y = tf.placeholder(tf.float32, [None, 17])   # 17flowersu数据集有17个类

        self.dropRate = tf.placeholder(tf.float32)    

        with slim.arg_scope(nets.inception.inception_v1_arg_scope()):

            net, endpoints = nets.inception.inception_v1(self.X, num_classes=1001)

            # 在这里，我们直接使用预置的模型。

        net = endpoints['Mixed_5c']

        net = tf.reduce_mean(net, [1, 2], keep_dims=True, name='global_pool')

        net = tf.reshape(net , [-1, 1024])

        # 下面这些，大家应该非常熟悉了，和MNIST的一样的

        net = tf.nn.dropout(net, self.dropRate)

        logits = tf.layers.dense(net, 17, use_bias=True,

                                 kernel_initializer=tf.constant_initializer(0),

                                 bias_initializer=tf.constant_initializer(0))

        self.logits = logits

        self.loss = tf.losses.softmax_cross_entropy(onehot_labels=self.y, logits=logits)

        self.train_step = tf.train.GradientDescentOptimizer(self.lr).minimize(self.loss)

        # 用于模型训练

        self.correct_prediction = tf.equal(tf.argmax(self.y, axis=1), tf.argmax(logits, axis=1))

        self.accuracy = tf.reduce_mean(tf.cast(self.correct_prediction, tf.float32))

#         用于保存训练好的模型

        self.saver = tf.train.Saver()

        summary_loss = tf.summary.scalar('loss', self.loss)

        summary_accuracy = tf.summary.scalar('accuracy', self.accuracy)

        self.merged_summary_op = tf.summary.merge_all()

    def read_image_label_list(self, name_list):

        # 读取图像文件和标注列表

        img_list=[]

        label_list=[]

        with open(name_list) as fr:

            for line in fr.readlines():

                imgIndex = int(line.strip())

                imgLabel = int(imgIndex / 80)

                imgPath = 'data/jpg/image_%04d.jpg' % imgIndex

                img_list.append(imgPath)

                label_list.append(imgLabel)                

        return img_list, label_list      

    def read_file(self, name_list):

        image_list, label_list = self.read_image_label_list(name_list)

        imagepaths, labels = tf.train.slice_input_producer([image_list, label_list], shuffle=True)

        image = tf.read_file(imagepaths)

        image = tf.image.decode_jpeg(image, channels=3)

        image = tf.image.resize_images(image, [224, 224])

        image = tf.image.random_brightness(image, 15)

        image = tf.image.random_flip_left_right(image)

        image = (image * 1.0 / 127.5 - 1)

        label = tf.one_hot(labels, 17)

        X, Y = tf.train.batch([image, label], batch_size=self.batch_size, num_threads=2, capacity=self.batch_size*4)

        return X, Y

    def train(self):

        training_images, training_labels = self.read_file('trn1.txt')

        test_images, test_labels = self.read_file('val1.txt')

        with tf.Session() as sess:

            sess.run(tf.global_variables_initializer())

            coord = tf.train.Coordinator()

            threads = tf.train.start_queue_runners(sess=sess, coord=coord)

            variables_to_restore = slim.get_variables_to_restore()

            init_fn = slim.assign_from_checkpoint_fn(r'pre_trained/inception_v1.ckpt',

                                         variables_to_restore,

                                         ignore_missing_vars=True)

            init_fn(sess)

            summary_writer = tf.summary.FileWriter('log/train_base', sess.graph)

            summary_writer_test = tf.summary.FileWriter('log/test_base')

            for i in range(self.iter_num):

                tf.local_variables_initializer().run()

                images, labels = sess.run([training_images, training_labels])  

                feed_dict = {self.dropRate: 0.5,

                         self.X :images,

                         self.y :labels}

                loss, _ = sess.run([self.loss, self.train_step],

                                  feed_dict=feed_dict)   # 每调用一次sess.run，就像拧开水管一样，所有self.loss和self.train_step涉及到的运算都会被调用一次。

                if i%10 ==0:

                    images, labels = sess.run([training_images, training_labels])

                    train_accuracy, summary_str = sess.run([self.accuracy,self.merged_summary_op], feed_dict={self.X: images, self.y: labels, self.dropRate: 1.})  # 把训练集数据装填进去

                    summary_writer.add_summary(summary_str, i)

                    images, labels = sess.run([test_images, test_labels])

                    test_accuracy, summary_str = sess.run([self.accuracy,self.merged_summary_op], feed_dict={self.X: images, self.y: labels, self.dropRate: 1.})  # 把测试集数据装填进去

                    summary_writer_test.add_summary(summary_str, i)

                    print ('iter\t%i\tloss\t%f\ttrain_accuracy\t%f\ttest_accuracy\t%f' % (i,loss,train_accuracy, test_accuracy))

            self.saver.save(sess, 'model/flowerModel') # 保存模型

            summary_writer.flush()

            summary_writer_test.flush()

            coord.request_stop()

            coord.join(threads)

    def test(self):

        test_images, test_labels = self.read_file('tst1.txt')

        with tf.Session() as sess:

            self.saver.restore(sess, 'model/flowerModel')

            coord = tf.train.Coordinator()

            threads = tf.train.start_queue_runners(sess=sess, coord=coord)

            Accuracy = []

            for i in range(int(340/self.batch_size) + 1):

                images, labels = sess.run([test_images, test_labels])

                test_accuracy = sess.run(self.accuracy, feed_dict={self.X: images, self.y: labels, self.dropRate: 1.})  # 把测试集数据装填进去

                Accuracy.append(test_accuracy)

            print('==' * 15)

            print( 'Test Accuracy: ', np.mean(np.array(Accuracy))   )

            coord.request_stop()

            coord.join(threads)

model = GoogLeNet(0.1, 50, 100)

model.train()

model.test()

WARNING:tensorflow:From <ipython-input-2-7ce60d3cb483>:18: calling reduce_mean (from tensorflow.python.ops.math_ops) with keep_dims is deprecated and will be removed in a future version.

Instructions for updating:

keep_dims is deprecated, use keepdims instead

WARNING:tensorflow:Variable dense/kernel missing in checkpoint pre_trained/inception_v1.ckpt

WARNING:tensorflow:Variable dense/bias missing in checkpoint pre_trained/inception_v1.ckpt

INFO:tensorflow:Restoring parameters from pre_trained/inception_v1.ckpt

iter	0	loss	2.833214	train_accuracy	0.020000	test_accuracy	0.100000

iter	10	loss	1.716118	train_accuracy	0.580000	test_accuracy	0.760000

iter	20	loss	0.940882	train_accuracy	0.940000	test_accuracy	0.800000

iter	30	loss	0.329169	train_accuracy	0.960000	test_accuracy	0.860000

iter	40	loss	0.229579	train_accuracy	1.000000	test_accuracy	0.900000

iter	50	loss	0.096816	train_accuracy	1.000000	test_accuracy	0.940000

iter	60	loss	0.138667	train_accuracy	1.000000	test_accuracy	0.900000

iter	70	loss	0.133150	train_accuracy	1.000000	test_accuracy	0.940000

iter	80	loss	0.048020	train_accuracy	1.000000	test_accuracy	0.920000

iter	90	loss	0.057278	train_accuracy	1.000000	test_accuracy	0.880000

INFO:tensorflow:Restoring parameters from model/flowerModel

==============================

Test Accuracy:  0.94285715

基于GoogLeNet的不同花分类微调训练案例的更多相关文章

基于Spark Mllib的文本分类
基于Spark Mllib的文本分类文本分类是一个典型的机器学习问题,其主要目标是通过对已有语料库文本数据训练得到分类模型,进而对新文本进行类别标签的预测.这在很多领域都有现实的应用场景,如新闻网站 ...
matlab 基于 libsvm工具箱的svm分类遇到的问题与解决
最近在做基于无线感知的身份识别这个工作,在后期数据处理阶段,需要使用二分类的方法进行训练模型.本身使用matlab做,所以看了一下网上很多都是使用libsvm这个工具箱,就去下载了,既然用到了想着就把 ...
NLP之基于TextCNN的文本情感分类
TextCNN @ 目录 TextCNN 1.理论 1.1 基础概念最大汇聚(池化)层: 1.2 textCNN模型结构 2.实验 2.1 实验步骤 2.2 算法模型 1.理论 1.1 基础概念在 ...
Windows下mnist数据集caffemodel分类模型训练及测试
1. MNIST数据集介绍 MNIST是一个手写数字数据库,样本收集的是美国中学生手写样本,比较符合实际情况,大体上样本是这样的: MNIST数据库有以下特性: 包含了60000个训练样本集和1000 ...
【ALB技术笔记】基于多线程方式的串行通信接口数据接收案例
基于多线程方式的串行通信接口数据接收案例广东职业技术技术学院欧浩源 1.案例背景在本博客的<[CC2530入门教程-06]CC2530的ADC工作原理与应用>中实现了电压数据采集的 ...
【ALB学习笔记】基于事件触发方式的串行通信接口数据接收案例
基于事件触发方式的串行通信接口数据接收案例广东职业技术学院欧浩源一.案例背景之前写过一篇<基于多线程方式的串行通信接口数据接收案例>的博文,讨论了采用轮询方式接收串口数据的情况. ...
【ALB学习笔记】基于多线程方式的串行通信接口数据接收案例
基于多线程方式的串行通信接口数据接收案例广东职业技术技术学院欧浩源 1.案例背景在本博客的<[CC2530入门教程-06]CC2530的ADC工作原理与应用>中实现了电压数据采集的 ...
Httpd服务进阶知识-基于Apache Modele的LAMP架构之WordPress案例
Httpd服务进阶知识-基于Apache Modele的LAMP架构之WordPress案例作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.安装依赖包及数据库授权博主推荐阅读 ...
Httpd服务进阶知识-基于Apache Modele的LAMP架构之PhpMyAdmin案例
Httpd服务进阶知识-基于Apache Modele的LAMP架构之PhpMyAdmin案例作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.常见LAMP应用 PhpMyAdm ...

随机推荐

Maven的阿里云镜像
打开“Maven安装目录/conf/settings.xml”文件,找到<mirrors>节点,添加: <mirror> <id>nexus-aliyun</ ...
Mirror--不同SQL Server版本使用的默认镜像端点加密算法不同
在搭建镜像时遇到一个小问题,搭建镜像时报错,排查好半天,对证书/用户/登陆/连接授权等方面都做了逐一排查,未发现异常,最后生成镜像端点创建脚本时,才发现问题原因: 镜像主节点(10.50.4276)的 ...
使用JAVA API 解析ORC File
使用JAVA API 解析ORC File orc File 的解析过程中,使用FileInputFormat的getSplits(conf, 1)函数, 然后使用 RecordReaderreade ...
利用CPaintDC::IntersectClipRect将绘图限制在局部区域
问题背景:画带坐标的图,例如画里面那条曲线的时候,希望将绘图区域局限在坐标范围内,范围外的就自动屏蔽掉. 两个方案,一是用CPaintDC的SelectClipRgn函数,感觉略麻烦.另一个函数,就 ...
C#实时检测端口占用情况
在TCP/IP协议中,服务端需要去监听客户端的端口,开始监听,我们需要检测使用的端口是否被占用,获取系统当前使用的所有端口号,用此端口进行匹配即可. 代码如下 internal static Bool ...
linux03
linux day31.正则表达式 \* ------重复0无数次 \+ ------重复1 无数次 ^ -------开头 $ -------结尾 | ------或 & ----- 与 ( ...
日期时间类：Date，Calendar，计算类：Math
日期时间类计算机如何表示时间? 时间戳(timestamp):距离特定时间的时间间隔. 计算机时间戳是指距离历元(1970-01-01 00:00:00:000)的时间间隔(ms). 计算机中时间2 ...
「PKUSC2018」主斗地（暴搜）
这道斗地主比 $PKUWC$ 那道可做多了... 我们用 $NOIP$ 那道斗地主的思路:暴搜出三代和四代,贪心出散牌. 还有jry为什么要出xx网友而不出他的另一个老婆我们发现两个人的每回 ...
nginx在Linux下的安装
安装之前的环境装备: 1.ngiinx 是C 语言开发的,我们上传的文件还是源码,需要gcc环境编译源码 : yum install gcc-c++ 2.nginx的http模块使用pcre来解析正则 ...
spring cloud学习(四) 动态路由
Zuul的主要功能是路由和过滤器.路由功能是微服务的一部分,zuul实现了负载均衡. 1.1 新建模块zuul pom.xml <?xml version="1.0" enc ...

基于GoogLeNet的不同花分类微调训练案例

基于GoogLeNet的不同花分类微调训练案例的更多相关文章

随机推荐

热门专题