VGG网络结构
这个结构其实不难,但是它里面训练的一些东西我还没有搞清楚,打算把昨天写的代码传上来,方便日后来看,发现了一个很有意思的库叫TF-slim打算哪天看看有没有好用的东西
from datetime import datetime import math import time import tensorflow as tf import numpy as np """ create a function to construct a convLayer and put the parameters of this layer into the convlayer input_op:input tensor name:layer name kh:kernel height kw:kernal width n_out:number of filters,the output channels dh:stride of height dw:stride of width p:parameter list """ def conv_op(input_op,name,kh,kw,n_out,dh,dw,p): #用来获取通道数,-1代表tensor的最后一个维度即通道 n_in=input_op.get_shape()[-1].value with tf.name_scope(name) as scope: kernel=tf.get_variable(scope+"w", shape=[kh,kw,n_in,n_out], initializer=tf.contrib.layers.xavier_initializer_conv2d) #用来定义卷积操作,其中第三个参数是strides步长,第四个参数是填充方式 conv=tf.nn.conv2d(input_op,kernel,(1,dh,dw,1),padding='SAME') bias_init_values=tf.constant(0.0,shape=[n_out],dtype=tf.float32) biases=tf.Variable(bias_init_values,trainable=True,name='b') z=tf.nn.bias_add(conv,biases) activation=tf.nn.relu(z,name=scope) #将创建卷积时用到的参数添加到参数列表p中 p+=[kernel,biases] #将激活后的结果返回,使用激活函数是为了让模型具有非线性的表达,其实这个结果是要传递到下一层去 return activation #创建池化层的构造函数 def max_pool_op(input_op,name,kw,kh,dw,dh): return tf.nn.max_pool(input_op, ksize=[1,kh,kw,1], strides=[1,dh,dw,1], padding='SAME', name=name) #创建建立全连接层的函数 def fc_op(input_op,name,n_out,p): n_in=input_op.get_shape()[-1].value with tf.name_scope(name) as scope: kernel=tf.get_variable(scope+"w", shape=[n_in,n_out], dtype=tf.float32, initializer=tf.contrib.layers.xavier_initializer()) biases_val=tf.constant(0.1,shape=[n_out],dtype=tf.float32) biases=tf.Variable(biases_val,name='b') activation=tf.nn.relu_layer(input_op,kernel,biases,name='scope') p+=[kernel,biases] return activation #下面开始构造VGG的网络结构 """ 正常的VGG有五层的卷积结构 第一个是两个卷积层,一层最大池化 第二个是两个卷积层一个最大池化 第三个是三个卷积层一个最大池化 第四个是三个卷积层一个最大池化 第五个是三个卷积层一个最大池化 之后是三层全连接层,最后一个全链接层的输出进入softmax进行分类预测 input_op是输入的tensor,keep_prob是神经元的保留率 """ def vgg_structure(input_op,keep_prob): #参数保留 p=[] conv1_1=conv_op(input_op,name="conv1_1",kh=3,kw=3,n_out=64,dh=1,dw=1,p=p) conv1_2=conv_op(conv1_1,name="conv1_2",kh=3,kw=3,n_out=64,dh=1,dw=1,p=p) pool1=max_pool_op(conv1_2,name="pool1",kw=2,kh=2,dw=2,dh=2) #第二段的卷积 conv2_1=conv_op(pool1,name="conv2_1",kh=3,kw=3,n_out=128,dh=1,dw=1,p=p) conv2_2=conv_op(conv2_1,name="conv2_2",kh=2,kw=2,n_out=128,dh=1,dw=1,p=p) pool2=max_pool_op(conv2_2,name="pool2",kw=2,kh=2,dw=2,dh=2) #第三段卷积 conv3_1=conv_op(pool2,name="conv3_1",kh=3,kw=3,n_out=256,dh=1,dw=1,p=p) conv3_2=conv_op(conv3_1,name="conv3_2",kh=3,kw=3,n_out=256,dh=1,dw=1,p=p) conv3_3 = conv_op(conv3_2, name="conv3_3", kh=3, kw=3, n_out=256, dh=1, dw=1, p=p) pool3=max_pool_op(conv3_3,name="pool3",kw=2,kh=2,dw=2,dh=2) #第四段卷积 conv4_1=conv_op(pool3,name="conv4_1",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p) conv4_2 = conv_op(conv4_1, name="conv4_2", kh=3, kw=3, n_out=512, dh=1, dw=1, p=p) conv4_3 = conv_op(conv4_2, name="conv4_3", kh=3, kw=3, n_out=512, dh=1, dw=1, p=p) pool4=max_pool_op(conv4_3,name="pool4",kw=2,kh=2,dw=2,dh=2) #第五段卷积 conv5_1=conv_op(pool4,name="conv5_1",kh=3,kw=3,n_out=512,dh=1,dw=1,p=p) conv5_2=conv_op(conv5_1, name="conv5_2", kh=3, kw=3, n_out=512, dh=1, dw=1, p=p) conv5_3=conv_op(conv5_2, name="conv5_3", kh=3, kw=3, n_out=512, dh=1, dw=1, p=p) pool5=max_pool_op(conv5_3,name="pool5",kw=2,kh=2,dw=2,dh=2) #将最后一个池化层的输出扁平化,最后输出的是7*7*512的matrix shp=pool5.get_shape() total_demension=shp[1].value*shp[2].value*shp[3].value #因为不知道一次输入的batch_size是多少,不知道转化成多少行,只知道列数 resh1=tf.reshape(pool5,[-1,total_demension],name="resh1") #现在将最后一个池化层的输出拿出来当作第一个全连接层的输入,全连接层后面加一个drop_out,在训练时节点保留率是0.5,测试时为1 fc6=fc_op(resh1,name="fc6",n_out=4096,p=p) fc6_drop=tf.nn.dropout(fc6,keep_prob,name="fc6_deop") #定义第二个全连接层 fc7=fc_op(fc6_drop,name="fc7",n_out=4096,p=p) fc7_drop=tf.nn.dropout(fc7,keep_prob,name="fc7_drop") #定义第三个全连接层 fc8=fc_op(fc7_drop,name="fc8",n_out=1000,p=p) #全连接层的输出是软对数,直接放入softmax中进行分类 softmax=tf.nn.softmax(fc8) #返回列方向上softmax预测概率的最大值的下标,就是模型的预测结果 predictions=tf.argmax(softmax,1) return softmax,fc8,predictions #这样我们的vgg初步的模型就定义结束了
然后之后想试试如何划分训练集测试集和验证集,这个是一直不太会的东西,嗯就酱
VGG网络结构的更多相关文章
- 【转】VGG网络结构及参数
VGG网络 VGG16输入224*224*3的图片,经过的卷积核大小为3x3x3,stride=1,padding=1,pooling为采用2x2的max pooling方式: 1.输入224x2 ...
- 【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg
上周我们讲了经典CNN网络AlexNet对图像分类的效果,2014年,在AlexNet出来的两年后,牛津大学提出了Vgg网络,并在ILSVRC 2014中的classification项目的比赛中取得 ...
- 卷积神经网络之VGG
2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员一起研发出了新的深度卷积神经网络:VGGNet,并取得了ILSVRC2014比 ...
- VGG网络
VGG论文给出了一个非常振奋人心的结论:卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用.记得在AlexNet论文中,也做了最后指出了网络深度的对最终的分类结果有很大的作用. ...
- cnn 经典网络结构 解析
cnn发展史 这是imageNet比赛的历史成绩 可以看到准确率越来越高,网络越来越深. 加深网络比加宽网络有效的多,这已是公认的结论. cnn结构演化图 AlexNet 诞生于2012年,因为当时用 ...
- 关于VGG网络的介绍
本博客参考作者链接:https://zhuanlan.zhihu.com/p/41423739 前言: VGG是Oxford的Visual Geometry Group的组提出的(大家应该能看出VGG ...
- Faster R-CNN:详解目标检测的实现过程
本文详细解释了 Faster R-CNN 的网络架构和工作流,一步步带领读者理解目标检测的工作原理,作者本人也提供了 Luminoth 实现,供大家参考. Luminoth 实现:https:// ...
- CTPN项目部分代码学习
上次拜读了CTPN论文,趁热打铁,今天就从网上找到CTPN 的tensorflow代码实现一下,这里放出大佬的github项目地址:https://github.com/eragonruan/text ...
- 实现text-detection-ctpn一路的坎坎坷坷
小编在学习文字检测,因为作者提供的caffe实现没有训练代码(不过训练代码可以参考faster-rcnn的训练代码),所以我打算先使用tensorflow实现,主要是复现前辈的代码,主要是对文字检测模 ...
随机推荐
- css浮动与清除浮动
css浮动 首先,我们要知道,css中块级元素在页面中是独占一行的,自上而下排列,也就是我们所说的流,通常称为标准流. 以div为例,div是块级元素,如下: 可以清楚地看到,div是独占一行的,di ...
- python-Word模板填充-docxtpl
docxtpl 按指定的word模板填充内容 安装 pip install docxtpl 示例 from docxtpl import DocxTemplate data_dic = { 't1': ...
- golang协程踩坑记录
1.主线程等待多个协程执行完毕后,再执行下面的程序.golang提供了一个很好用的工具. sync.WaitGroup下面是个简单的例子. 执行结果: 2.主线程主动去结束已经启动了的多个协程.执行结 ...
- tomcat中显示本地图片①(未解决)
<本模块文仅作为学习过程中的自我总结,有需要可参看,欢迎指导与提出建议,很多地方可能断章取义,理解不到位,虚心求学.谢谢!> 资料查阅原因:2018/7/10(做项目中显示详情页面,从数据 ...
- Mac 下eclipse安装Lombok插件
在官网下载最新版本的 JAR 包. 将 lombok.jar 放在eclipse安装目录下,和 eclipse.ini 文件平级的. 注意,mac操作系统下eclipse的安装路径下有两个eclips ...
- 剑指offer-01
好久没看java, 今天把 runoob 上的java基础简单过了一遍. 来吧,怎么整这个题目呢? 首先遇到的问题是java如何输入一个数组,而且这个数组并不知道长度是多少 用Scanner类 Sca ...
- LeetCode--030--串联所有单词的字串(java)
给定一个字符串 s 和一些长度相同的单词 words.找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置. 注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要 ...
- 怎么样获取小米手机4的ROOT超级权限
小米手机4有何方法开通了Root超级权限?各位都清楚,Android手机有Root超级权限,一旦手机开通了root相关权限,能够实现更强大的功能,打比方各位部门的营销部门的妹纸,使用个别营销工具都需要 ...
- Eclipse安装TestNG
1.在Eclipse中点击Help菜单,选择Install New Software选项,在弹出页面中输入安装地址即可安装. http://beust.com/eclipse 2. 3. 4. 等待T ...
- 记录下curl的使用方法
curl是一个可以在命令行中直接发起请求的工具,基础用法如下: curl localhost:6767/1.html //返回url对应的页面内容 curl localhost:6767/1.html ...