【项目实战】CNN手写识别复杂模型的构造

感谢视频教程：https://www.bilibili.com/video/BV1Y7411d7Ys?p=11

这里开一篇新博客不仅仅是因为教程视频单独出了1p，也是因为这是一种代码编写的套路，特在此做下记录。

这里我们的模型构造采用如下图示

分为一个1x1池化层,然后一个1x1卷积层输出为16通道，一个先1x1卷积再5x5卷积输出为24通道，最后一个1x1卷积和两个3x3卷积后输出为24通道，这四个卷积层最后合并在一起输出。至于为什么会有1x1卷积核，是因为这样转换通道数的时候可以大大的简化计算步骤，减少代码运行时间

具体的代码设计如下

在昨天的代码基础上，首先由于模型较为复杂，所以我们单独写出一个函数，减少代码的冗余

class InceptionA(nn.Module):

    def __init__(self, in_channels):         # 每一部分都分开编写

        super(InceptionA, self).__init__()

        self.branch1x1 = nn.Conv2d(in_channels, 16, kernel_size=1)

        self.branch5x5_1 = nn.Conv2d(in_channels, 16, kernel_size=1)

        self.branch5x5_2 = nn.Conv2d(16, 24, kernel_size=5, padding=2) # 因为希望输出的图像大小不变，所以用padding补零

        self.branch3x3_1 = nn.Conv2d(in_channels, 16 ,kernel_size=1)

        self.branch3x3_2 = nn.Conv2d(16, 24, kernel_size=3, padding=1)

        self.branch3x3_3 = nn.Conv2d(24, 24, kernel_size=3, padding=1)

        self.branch_pool = nn.Conv2d(in_channels, 24, kernel_size=1)

    def forward(self, x):

        branck1x1 = self.branch1x1(x)

        branck5x5 = self.branch5x5_1(x)

        branck5x5 = self.branch5x5_2(branck5x5)

        branck3x3 = self.branch3x3_1(x)

        branck3x3 = self.branch3x3_2(branck3x3)

        branck3x3 = self.branch3x3_3(branck3x3)

        branch_pool = F.avg_pool2d(x, kernel_size=3, stride=1, padding=1)

        branch_pool = self.branch_pool(branch_pool)

        outputs = [branck1x1, branck5x5, branck3x3, branch_pool]

        return torch.cat(outputs, dim=1)  #这里把维度降为1

然后我们再构建模型即可

class Net(torch.nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)

        self.conv2 = torch.nn.Conv2d(88, 20, kernel_size=5)  # 88=24x3+16

        self.incep1 = InceptionA(in_channels=10)

        self.incep2 = InceptionA(in_channels=20)

        self.mp = nn.MaxPool2d(2)   # 这里的2是也是由模型计算出来的

        self.fc = nn.Linear(1408, 10)  # 真正的工作中这里的1408并不需要我们自己去算

    def forward(self, x):

        in_size = x.size(0)

        x = F.relu(self.mp(self.conv1(x)))

        x = self.incep1(x)

        x = F.relu(self.mp(self.conv2(x)))

        x = self.incep2(x)

        x = x.view(in_size, -1)

        x = self.fc(x)

        return x

``

【项目实战】CNN手写识别复杂模型的构造的更多相关文章

【项目实战】CNN手写识别
由于只需要修改之前基于ANN模型代码的模型设计部分所以篇幅较短,简单的加点注释给自己查看即可视频链接:https://www.bilibili.com/video/BV1Y7411d7Ys?p=10 ...
AI应用开发实战 - 手写识别应用入门
AI应用开发实战 - 手写识别应用入门手写体识别的应用已经非常流行了,如输入法,图片中的文字识别等.但对于大多数开发人员来说,如何实现这样的一个应用,还是会感觉无从下手.本文从简单的MNIST训练出 ...
（五） Keras Adam优化器以及CNN应用于手写识别
视频学习来源 https://www.bilibili.com/video/av40787141?from=search&seid=17003307842787199553 笔记 Adam,常 ...
TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络多层卷积网络的基本理论构建一个多层卷积网络权值初始化卷积和池化第一层卷积第二层卷积密集层连接 ...
android 开源 OCR 项目及手写识别
http://blog.csdn.net/archfree/article/details/6023676 1)一个为Android平台,将识别由手机的相机拍摄的图像文本应用程序. http://co ...
机器学习实战kNN之手写识别
kNN算法算是机器学习入门级绝佳的素材.书上是这样诠释的:“存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都有标签,即我们知道样本集中每一条数据与所属分类的对应关系.输入没有标签的新数据 ...
(手写识别) Zinnia库及其实现方法研究
Zinnia库及其实现方法研究 (转) zinnia是一个开源的手写识别库.采用C++实现.具有手写识别,学习以及文字模型数据制作转换等功能. 项目地址 [http://zinnia.sourcefo ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

随机推荐

java中的内存划分和一个数组的内存图
内存概述内存是计算机中的重要原件,临时存储区域,作用是运行程序.我们编写的程序是存放在硬盘中的,在硬盘中的程序是不会运行的,必须放进内存中才能运行,运行完毕后会清空内存 Java虚拟机要运行程序 ...
buu第二页
33.被劫持的神秘礼物打开后直接搜索HTTP,发现了以POST方式提交的数据,追踪HTTP流,根据题目提示,把name和word拼在一起再根据题目提示,用MD5解密这样就得到了flag 34.刷 ...
vlan配置
VLAN(Virtual Local Area Network)即虚拟局域网,是将一个物理的局域网在逻辑上划分成多个广播域的技术. 通过在交换机上配置VLAN,可以实现在同一个VLAN内的用户可以进行 ...
什么新东西值得学「GitHub 热点速览 v.22.29」
上周 18k+ 的项目 bun 这周又获得 7k+ star,是时候了解下它背后的编程语言 zig 了,它并不是一门新的语言,伴随着 bun 的风靡,zig 本周也上了 GitHub 热榜.同样,可以 ...
【docker专栏7】容器自启动与守护进程停止后容器保活
本文为大家介绍容器自启动以及docker 守护进程挂掉或者docker升级的情况下,如何保证容器服务的正常运行.主要包含三个部分一.守护进程开机自启在我们安装docker的时候,介绍过启动dock ...
TCP/IP协议三次握手、四次断开
1.tcp报文格式 1行代表一个字节: 第一行:代表源端口和目的端口,分别占16位: 第二行:32位序列号:表示客户端向服务端发送的报文的序号是多少,这个序号是计算机随机生成的一个代表该报文的唯一标示 ...
java关键字的概念与特征和标识符的概念和规则
什么是关键字比如说邮箱地址 abc@qq.com 123abc@qq.com 这样的只要没有人占用都是和发布的那么这样呢 hahah@enen@itcast.cn呢 @是电子邮箱当中有特殊含义的 ...
Linux ssh协议
基础知识 ssh:secure shell protocol,安全的远程登录作用:是建立在应用层基础上的安全协议,实现数据传输过程中数据的加密,代替telent协议使用tcp协议,端口号为22 s ...
ZJOI2022选做
\(ZJOI2022\) 众数发现并不存在\(poly(log(n))\)的做法,那么尝试\(n\sqrt n\) 套路的按照出现次数分组,分为大于\(\sqrt n\)和小于\(\sqrt n\) ...

【项目实战】CNN手写识别复杂模型的构造

【项目实战】CNN手写识别复杂模型的构造的更多相关文章

随机推荐

热门专题