Convolutional Neural Networks

使用全连接层的局限性：

图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。
对于大尺寸的输入图像，使用全连接层容易导致模型过大。

使用卷积层的优势：

卷积层保留输入形状。
卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算，从而避免参数尺寸过大。

LeNet 模型

LeNet分为卷积层块和全连接层块两个部分。下面我们分别介绍这两个模块。

卷积层块里的基本单位是卷积层后接平均池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的平均池化层则用来降低卷积层对位置的敏感性。

卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用

的窗口，并在输出上使用sigmoid激活函数。第一个卷积层输出通道数为6，第二个卷积层输出通道数则增加到16。

全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其中10为输出的类别个数。

下面我们通过Sequential类来实现LeNet模型。

#import

import sys

sys.path.append("/home/kesci/input")

import d2lzh1981 as d2l

import torch

import torch.nn as nn

import torch.optim as optim

import time

#net

class Flatten(torch.nn.Module):  #展平操作

    def forward(self, x):

        return x.view(x.shape[0], -1)

class Reshape(torch.nn.Module): #将图像大小重定型

    def forward(self, x):

        return x.view(-1,1,28,28)      #(B x C x H x W)

net = torch.nn.Sequential(     #Lelet

    Reshape(),

    nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2), #b*1*28*28  =>b*6*28*28

    nn.Sigmoid(),

    nn.AvgPool2d(kernel_size=2, stride=2),                              #b*6*28*28  =>b*6*14*14

    nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5),           #b*6*14*14  =>b*16*10*10

    nn.Sigmoid(),

    nn.AvgPool2d(kernel_size=2, stride=2),                              #b*16*10*10  => b*16*5*5

    Flatten(),                                                          #b*16*5*5   => b*400

    nn.Linear(in_features=16*5*5, out_features=120),

    nn.Sigmoid(),

    nn.Linear(120, 84),

    nn.Sigmoid(),

    nn.Linear(84, 10)

)

接下来我们构造一个高和宽均为28的单通道数据样本，并逐层进行前向计算来查看每个层的输出形状。

#print

X = torch.randn(size=(1,1,28,28), dtype = torch.float32)

for layer in net:

    X = layer(X)

    print(layer.__class__.__name__,'output shape: \t',X.shape)

Reshape output shape: 	 torch.Size([1, 1, 28, 28])

Conv2d output shape: 	 torch.Size([1, 6, 28, 28])

Sigmoid output shape: 	 torch.Size([1, 6, 28, 28])

AvgPool2d output shape: 	 torch.Size([1, 6, 14, 14])

Conv2d output shape: 	 torch.Size([1, 16, 10, 10])

Sigmoid output shape: 	 torch.Size([1, 16, 10, 10])

AvgPool2d output shape: 	 torch.Size([1, 16, 5, 5])

Flatten output shape: 	 torch.Size([1, 400])

Linear output shape: 	 torch.Size([1, 120])

Sigmoid output shape: 	 torch.Size([1, 120])

Linear output shape: 	 torch.Size([1, 84])

Sigmoid output shape: 	 torch.Size([1, 84])

Linear output shape: 	 torch.Size([1, 10])

可以看到，在卷积层块中输入的高和宽在逐层减小。卷积层由于使用高和宽均为5的卷积核，从而将高和宽分别减小4，而池化层则将高和宽减半，但通道数则从1增加到16。全连接层则逐层减少输出个数，直到变成图像的类别数10。

获取数据和训练模型

下面我们来实现LeNet模型。我们仍然使用Fashion-MNIST作为训练数据集。

# 数据

batch_size = 256

train_iter, test_iter = d2l.load_data_fashion_mnist(

    batch_size=batch_size, root='/home/kesci/input/FashionMNIST2065')

print(len(train_iter))

为了使读者更加形象的看到数据，添加额外的部分来展示数据的图像

#数据展示

import matplotlib.pyplot as plt

def show_fashion_mnist(images, labels):

    d2l.use_svg_display()

    # 这里的_表示我们忽略（不使用）的变量

    _, figs = plt.subplots(1, len(images), figsize=(12, 12))

    for f, img, lbl in zip(figs, images, labels):

        f.imshow(img.view((28, 28)).numpy())

        f.set_title(lbl)

        f.axes.get_xaxis().set_visible(False)

        f.axes.get_yaxis().set_visible(False)

    plt.show()

for Xdata,ylabel in train_iter:

    break

X, y = [], []

for i in range(10):

    print(Xdata[i].shape,ylabel[i].numpy())

    X.append(Xdata[i]) # 将第i个feature加到X中

    y.append(ylabel[i].numpy()) # 将第i个label加到y中

show_fashion_mnist(X, y)

torch.Size([1, 28, 28]) 3

torch.Size([1, 28, 28]) 8

torch.Size([1, 28, 28]) 1

torch.Size([1, 28, 28]) 4

torch.Size([1, 28, 28]) 0

torch.Size([1, 28, 28]) 0

torch.Size([1, 28, 28]) 4

torch.Size([1, 28, 28]) 9

torch.Size([1, 28, 28]) 4

torch.Size([1, 28, 28]) 7

因为卷积神经网络计算比多层感知机要复杂，建议使用GPU来加速计算。我们查看看是否可以用GPU，如果成功则使用cuda:0，否则仍然使用cpu。

# This function has been saved in the d2l package for future use

#use GPU

def try_gpu():

    """If GPU is available, return torch.device as cuda:0; else return torch.device as cpu."""

    if torch.cuda.is_available():

        device = torch.device('cuda:0')

    else:

        device = torch.device('cpu')

    return device

device = try_gpu()

device

device(type='cpu')

我们实现evaluate_accuracy函数，该函数用于计算模型net在数据集data_iter上的准确率。

#计算准确率

'''

(1). net.train()

  启用 BatchNormalization 和 Dropout，将BatchNormalization和Dropout置为True

(2). net.eval()

不启用 BatchNormalization 和 Dropout，将BatchNormalization和Dropout置为False

'''

def evaluate_accuracy(data_iter, net,device=torch.device('cpu')):

    """Evaluate accuracy of a model on the given data set."""

    acc_sum,n = torch.tensor([0],dtype=torch.float32,device=device),0

    for X,y in data_iter:

        # If device is the GPU, copy the data to the GPU.

        X,y = X.to(device),y.to(device)

        net.eval()

        with torch.no_grad():

            y = y.long()

            acc_sum += torch.sum((torch.argmax(net(X), dim=1) == y))  #[[0.2 ,0.4 ,0.5 ,0.6 ,0.8] ,[ 0.1,0.2 ,0.4 ,0.3 ,0.1]] => [ 4 , 2 ]

            n += y.shape[0]

    return acc_sum.item()/n

我们定义函数train_ch5，用于训练模型。

#训练函数

def train_ch5(net, train_iter, test_iter,criterion, num_epochs, batch_size, device,lr=None):

    """Train and evaluate a model with CPU or GPU."""

    print('training on', device)

    net.to(device)

    optimizer = optim.SGD(net.parameters(), lr=lr)

    for epoch in range(num_epochs):

        train_l_sum = torch.tensor([0.0],dtype=torch.float32,device=device)

        train_acc_sum = torch.tensor([0.0],dtype=torch.float32,device=device)

        n, start = 0, time.time()

        for X, y in train_iter:

            net.train()

            optimizer.zero_grad()

            X,y = X.to(device),y.to(device)

            y_hat = net(X)

            loss = criterion(y_hat, y)

            loss.backward()

            optimizer.step()

            with torch.no_grad():

                y = y.long()

                train_l_sum += loss.float()

                train_acc_sum += (torch.sum((torch.argmax(y_hat, dim=1) == y))).float()

                n += y.shape[0]

        test_acc = evaluate_accuracy(test_iter, net,device)

        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f, '

              'time %.1f sec'

              % (epoch + 1, train_l_sum/n, train_acc_sum/n, test_acc,

                 time.time() - start))

我们重新将模型参数初始化到对应的设备device(cpu or cuda:0)之上，并使用Xavier随机初始化。损失函数和训练算法则依然使用交叉熵损失函数和小批量随机梯度下降。

# 训练

lr, num_epochs = 0.9, 10

def init_weights(m):

    if type(m) == nn.Linear or type(m) == nn.Conv2d:

        torch.nn.init.xavier_uniform_(m.weight)

net.apply(init_weights)

net = net.to(device)

criterion = nn.CrossEntropyLoss()   #交叉熵描述了两个概率分布之间的距离，交叉熵越小说明两者之间越接近

train_ch5(net, train_iter, test_iter, criterion,num_epochs, batch_size,device, lr)

training on cpu

epoch 1, loss 0.0091, train acc 0.100, test acc 0.168, time 21.6 sec

epoch 2, loss 0.0065, train acc 0.355, test acc 0.599, time 21.5 sec

epoch 3, loss 0.0035, train acc 0.651, test acc 0.665, time 21.8 sec

epoch 4, loss 0.0028, train acc 0.717, test acc 0.723, time 21.7 sec

epoch 5, loss 0.0025, train acc 0.746, test acc 0.753, time 21.4 sec

epoch 6, loss 0.0023, train acc 0.767, test acc 0.754, time 21.5 sec

epoch 7, loss 0.0022, train acc 0.782, test acc 0.785, time 21.3 sec

epoch 8, loss 0.0021, train acc 0.798, test acc 0.791, time 21.8 sec

epoch 9, loss 0.0019, train acc 0.811, test acc 0.790, time 22.0 sec

epoch 10, loss 0.0019, train acc 0.821, test acc 0.804, time 22.1 sec

# test

for testdata,testlabe in test_iter:

    testdata,testlabe = testdata.to(device),testlabe.to(device)

    break

print(testdata.shape,testlabe.shape)

net.eval()

y_pre = net(testdata)

print(torch.argmax(y_pre,dim=1)[:10])

print(testlabe[:10])

torch.Size([256, 1, 28, 28]) torch.Size([256])

tensor([9, 2, 1, 1, 6, 1, 2, 6, 5, 7])

tensor([9, 2, 1, 1, 6, 1, 4, 6, 5, 7])

总结：

卷积神经网络就是含卷积层的网络。 LeNet交替使用卷积层和最大池化层后接全连接层来进行图像分类。

动手学习Pytorch(7)--LeNet的更多相关文章

动手学习pytorch——（1）线性回归
最近参加了伯禹教育的动手学习深度学习项目,现在对第一章(线性回归)部分进行一个总结. 这里从线性回归模型之从零开始的实现和使用pytorch的简洁两个部分进行总结. 损失函数,选取平方函数来评估误差, ...
动手学习Pytorch(6)--卷积神经网络基础
卷积神经网络基础本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充.步幅.输入通道和输出通道的含义. 二维卷积层本节介绍的是最常见的二维卷积层,常用于处理图像数据. 二维 ...
动手学习Pytorch(4)--过拟合欠拟合及其解决方案
过拟合.欠拟合及其解决方案过拟合.欠拟合的概念权重衰减丢弃法模型选择.过拟合和欠拟合训练误差和泛化误差在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差 ...
动手学习pytorch——（3）多层感知机
多层感知机(multi perceptron,MLP).对于普通的含隐藏层的感知机,由于其全连接层只是对数据做了仿射变换,而多个仿射变换的叠加仍然是一个仿射变换,即使添加更多的隐藏层,这种设计也只能与 ...
动手学习pytorch——（2）softmax和分类模型
内容太多,捡重要的讲. 在分类问题中,通常用离散的数值表示类别,这里存在两个问题.1.输出值的范围不确定,很难判断值的意义.2.真实标签是离散值,这些离散值与不确定的范围的输出值之间的误差难以衡量. ...
深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com VGGNet在2014年ImageNet图像分类任务竞赛中有出色的表现.网络结构如下图所示: 同样的, ...
深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（二）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com AlexNet在2012年ImageNet图像分类任务竞赛中获得冠军.网络结构如下图所示: 对CIFA ...
深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（一）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 前面几篇文章介绍了MINIST,对这种简单图片的识别,LeNet-5可以达到99%的识别率. CIFA ...
CNN的Pytorch实现(LeNet)
CNN的Pytorch实现(LeNet) 上次写了一篇CNN的详解,可是累坏了老僧我.写完后拿给朋友看,朋友说你这Pytorch的实现方式对于新人来讲会很不友好,然后反问我说里面所有的细节你都明白 ...

随机推荐

Java8 新特性(一)- Lambda 表达式
2014年3月18日发布了JavaSE 8 不追求技术的新,追求技术的稳定本质:Lambda 表达式是一个匿名函数作用:简化代码,增强代码的表达力 Lambda 语法格式 // 格式1:无参无返回 ...
Spring注解：InitBinder
注解 InitBinder 是用来初始化绑定器Binder的,而Binder是用来绑定数据的,换句话说就是将请求参数转成数据对象. @InitBinder用于在@Controller中标注于方法,表示 ...
【转】13个JavaScript图表（JS图表）图形绘制插件
现在网络上又有越来越多的免费的(JS 图表)JavaScript图表图形绘制插件.我之前给一家网站做过复杂的图形,我们用的是 highchart.在那段时间,没有很多可供选择的插件.但现在不同了,很容 ...
js 日期增减
js 的 Date 对象提供了许多方法,可以获取日期的年.月.日等信息,也可以修改年.月.日日期的增减可以使用setFullYear().setMonth().setDate() 等方法 exp: ...
Epplus Excel 导入 MSSQL 数据库
效果: 下载EXE 源码
Tarjan求割点和桥
by szTom 前置知识邻接表存储及遍历图 tarjan求强连通分量割点割点的定义在一个无向图中,如果有一个顶点集合,删除这个顶点集合以及这个集合中所有顶点相关联的边以后,图的连通分量增多, ...
自学 JAVA 的几点建议
微信公众号:一个优秀的废人如有问题或建议,请后台留言,我会尽力解决你的问题. 前言许久不见,最近公众号多了很多在校的师弟师妹们.有很多同学都加了我微信问了一些诸如 [如何自学 Java ]的问题, ...
暑假提高组集训Day1 T2
那么这一道题我在考试的时候写挂了(0分呜呜~) 我原来的思路是广搜来骗取部分分(哈哈~) 但是我忘记了一个非常重要的问题我广搜开的数组没有考虑负的下标下一次考试如果再写暴力就可以把坐标都加上一 ...
五个常见 AI 开发库
上一篇文章已经写过了,人工智能的发展不可谓不曲折,三起两落,不同的历史阶段,主流的研究方法不一样,开始时的 if-else 结构,简单的逻辑判断字符串匹配,到后期的穷举计算等,慢慢发展到现在的大数据与 ...
Egret学习-TiledMap使用
环境说明: 引擎版本:5.2.4 Egret Wing 4.1.6 1.下载依赖,下载地址https://github.com/egret-labs/egret-game-library/tree/m ...

动手学习Pytorch(7)--LeNet

Convolutional Neural Networks

LeNet 模型

获取数据和训练模型

总结：

动手学习Pytorch(7)--LeNet的更多相关文章

随机推荐

热门专题