[Kaggle] dogs-vs-cats之模型训练

上一步建立好模型之后，现在就可以训练模型了。

主要代码如下：

import sys

#将当期路径加入系统path中

sys.path.append("E:\\CODE\\Anaconda\\tensorflow\\Kaggle\\My-TensorFlow-tutorials-master\\01 cats vs dogs\\")

import os

import numpy as np

import tensorflow as tf

import input_data

import model

#%%

N_CLASSES = 2 #类别数

IMG_W = 208  # resize the image, if the input image is too large, training will be very slow.

IMG_H = 208

BATCH_SIZE = 16

CAPACITY = 2000 #队列中元素个数

MAX_STEP = 10000 #最大迭代次数 with current parameters, it is suggested to use MAX_STEP>10k

learning_rate = 0.0001 # with current parameters, it is suggested to use learning rate<0.0001

#%%

def run_training():

    # you need to change the directories to yours.

    #train_dir = '/home/kevin/tensorflow/cats_vs_dogs/data/train/'#数据存放路径

    train_dir = 'E:\\data\\Dog_Cat\\train\\'

    #logs_train_dir = '/home/kevin/tensorflow/cats_vs_dogs/logs/train/'#存放训练参数，模型等

    logs_train_dir = "E:\\CODE\\Anaconda\\tensorflow\\Kaggle\\My-TensorFlow-tutorials-master\\01 cats vs dogs\\"

    train, train_label = input_data.get_files(train_dir)

    train_batch, train_label_batch = input_data.get_batch(train,

                                                          train_label,

                                                          IMG_W,

                                                          IMG_H,

                                                          BATCH_SIZE,

                                                          CAPACITY)

    train_logits = model.inference(train_batch, BATCH_SIZE, N_CLASSES)#获得模型的输出

    train_loss = model.losses(train_logits, train_label_batch)#获取loss

    train_op = model.trainning(train_loss, learning_rate)#训练模型

    train__acc = model.evaluation(train_logits, train_label_batch)#模型评估

    summary_op = tf.summary.merge_all()

    sess = tf.Session()

    train_writer = tf.summary.FileWriter(logs_train_dir, sess.graph)#把summary保存到路径中

    saver = tf.train.Saver()

    sess.run(tf.global_variables_initializer())

    coord = tf.train.Coordinator()

    threads = tf.train.start_queue_runners(sess=sess, coord=coord)

    try:

        for step in np.arange(MAX_STEP):

            if coord.should_stop():

                    break

            _, tra_loss, tra_acc = sess.run([train_op, train_loss, train__acc])

            if step % 50 == 0:

                print('Step %d, train loss = %.2f, train accuracy = %.2f%%' %(step, tra_loss, tra_acc*100.0))

                summary_str = sess.run(summary_op)

                train_writer.add_summary(summary_str, step)

            if step % 2000 == 0 or (step + 1) == MAX_STEP:

                checkpoint_path = os.path.join(logs_train_dir, 'model.ckpt')

                saver.save(sess, checkpoint_path, global_step=step)#保存模型及参数

    except tf.errors.OutOfRangeError:

        print('Done training -- epoch limit reached')

    finally:

        coord.request_stop()

    coord.join(threads)

    sess.close()

run_training()

一些函数说明如下：

1）tf.summary.merge_all

作用：Merges all summaries collected in the default graph.

2）tf.summary.FileWriter

作用：Writes Summary protocol buffers to event files.

3）tf.train.Saver

作用：保存和恢复变量。

举例：

saver.save(sess, 'my-model', global_step=0)

==> filename: 'my-model-0'

...

saver.save(sess, 'my-model', global_step=1000)

==> filename: 'my-model-1000'

4）add_summary

作用：Writes Summary protocol buffers to event files.

程序运行后，控制台输出如下：

训练期间，也可以使用tensorboard查看模型训练情况。

可以使用如下命令打开tensorboard。

tensorboard --logdir=log文件路径

log文件路径即为程序中设置的logs_train_dir。

启动tensorboard之后，打开浏览器，输入对应网址，即可查看训练情况。

整体解码如下图：

loss与step的关系如下（两条曲线的原因是训练了两次，一次迭代了10000步，另一次迭代了15000步）：

也可以选择查看模型：

说明：

代码来自：https://github.com/kevin28520/My-TensorFlow-tutorials，略有修改

函数作用主要参考tensorflow官网。https://www.tensorflow.org/versions/master/api_docs/

[Kaggle] dogs-vs-cats之模型训练的更多相关文章

A TensorBoard plugin for visualizing arbitrary tensors in a video as your network trains.Beholder是一个TensorBoard插件，用于在模型训练时查看视频帧。
Beholder is a TensorBoard plugin for viewing frames of a video while your model trains. It comes wit ...
AI佳作解读系列(一)——深度学习模型训练痛点及解决方法
1 模型训练基本步骤进入了AI领域,学习了手写字识别等几个demo后,就会发现深度学习模型训练是十分关键和有挑战性的.选定了网络结构后,深度学习训练过程基本大同小异,一般分为如下几个步骤定义算法公 ...
VGG19模型训练+读取
目录 VGG-19模型简单介绍 VGG-19模型文件介绍分析模型文件 mean值查看 Weight和Bias查看读取代码读取模型训练代码参考资料 VGG-19的介绍和训练这里不做说明,网上资 ...
机器学习使用sklearn进行模型训练、预测和评价
cross_val_score(model_name, x_samples, y_labels, cv=k) 作用:验证某个模型在某个训练集上的稳定性,输出k个预测精度. K折交叉验证(k-fold) ...
谷歌大规模机器学习：模型训练、特征工程和算法选择 (32PPT下载)
本文转自:http://mp.weixin.qq.com/s/Xe3g2OSkE3BpIC2wdt5J-A 谷歌大规模机器学习:模型训练.特征工程和算法选择 (32PPT下载) 2017-01-26 ...
facenet模型训练
做下记录,脚本如下: 对比 python3 src/compare.py ../models/-/ ../faces/pyimgs/dashenlin/ytwRkvSdG1000058.png ../ ...
人脸检测及识别python实现系列（3）——为模型训练准备人脸数据
人脸检测及识别python实现系列(3)——为模型训练准备人脸数据机器学习最本质的地方就是基于海量数据统计的学习,说白了,机器学习其实就是在模拟人类儿童的学习行为.举一个简单的例子,成年人并没有主动 ...
【机器学习PAI实践十】深度学习Caffe框架实现图像分类的模型训练
背景我们在之前的文章中介绍过如何通过PAI内置的TensorFlow框架实验基于Cifar10的图像分类,文章链接:https://yq.aliyun.com/articles/72841.使用Te ...
kaldi基于GMM的单音素模型训练部分
目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文件均匀分割 4. gmm-acc ...

随机推荐

前端的UI设计与交互之设计原则篇
1.亲密性 a)纵向间距示例这三种规格分别为:8px(小号间距).16px(中号间距).24px(大号间距). b)在这三种规格不适用的情况下,可以通过加减『基础间距』的倍数,或者增加元素来拉开信息层 ...
jquery empty()方法在IE下报错的解决办法
empty()在IE中没反应的办法: 用原生的js解决: try { $("#id" ).empty(); } catch (e) { $("#id")[0]. ...
团队作业4——第一次项目冲刺（Alpha版本） Day 1
小队@JMUZJB-集美震惊部一.Daily Scrum Meeting照片二.Burndown Chart 燃尽图三.项目进展 1.界面屏幕开发中,原型设计完毕. 2.服务器服务器由学校提 ...
乘法表(24.9.2017) (WARNING!!!!!!!!!!!)
#include "stdio.h" main() { int i,j,result; printf("\n"); ;i<;i++) { ;j<;j ...
electron-vue工程创建
没有vue创建经验请移步至 vue下载与安装使用vue创建electron-vue工程 vue init simulatedgreg/electron-vue my-project 安装elemen ...
python3.* socket例子
On Server: # -*- coding: utf-8 -*-#this is the server import socketif "__main__" == __name ...
浅谈数据结构vector
vector: 又名向量 1.C++中的一种数据结构. 2.是一个类. 3.相当于一个动态的数组,当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的. A.使用时, ...
数据故障的恢复-MSSQL ndf文件大小变为0 KB恢复过程
一.故障描述成都某客户,存储损坏,数据库崩溃.重组存储,恢复数据库文件,发现有四个ndf文件大小变为0 KB.数据库大小约80TB.数据库中有1223个文件,数据库每10天生成一个NDF文件,每个N ...
Css之导航栏下拉菜单
Css: /*下拉菜单学习-2017.12.17 20:17 added by ldb*/ ul{ list-style-type:none; margin:; padding:; overflow: ...
07_Python的控制判断循环语句1(if判断，for循环...)_Python编程之路
Python的数据类型在前几节我们都简单的一一介绍了,接下来我们就要讲到Python的控制判断循环语句在现实编程中,我们往往要利用计算机帮我们做大量重复计算的工作,在这样的情况下,需要机器能对某个条 ...

[Kaggle] dogs-vs-cats之模型训练

[Kaggle] dogs-vs-cats之模型训练的更多相关文章

随机推荐

热门专题