训练分类器

目前为止,我们已经掌握了如何去定义神经网络、计算损失和更新网络中的权重。

关于数据

通常来讲,当你开始处理图像、文字、音频和视频数据,你可以使用 Python 的标准库加载数据进入 NumPy 的数组中。然后你可以将其转换成 torch.*Tensor

  • 对于图片,像 Pilow、OpenCV 这样的包很有用
  • 对于音频,可以使用 SciPy 和 Librosa 包
  • 对于文本,可以使用原生 Python 或 Cython 加载,也可以使用 NLTK 或 SpaCy

专门针对视觉(vision),已经有创建的一个叫 torchvision 的包,此包有对于诸如 Imagenet、CIFAR10、MNIST 等等的普通数据集的加载器的 torchvision.datasets ,也有对于图像的数据转换器的 torch.utils.data.DataLoader

这提供了极大的便利性并且避免了编写样板代码。

对于这篇博文,我们将使用 CIFAR10 数据集。它有类:“飞机”、“汽车”、“小鸟”、“猫”、“鹿”、“狗”、“青蛙”、“马”、“轮船”、“卡车”

CIFAR-10 的数据集的尺寸大小为 \(3\times 32\times 32\) ,其中,3 个颜色通道和 \(32\times 32\) 的像素。

训练一个图像分类器

我们将按照下面的步骤:

  1. 使用 torchvision 加载并标准化 CIFAR10 训练集和测试集
  2. 定义一个卷积神经网络
  3. 定义损失函数
  4. 在训练集上训练
  5. 在测试集上测试

1. 加载并标准化 CIFAR10

使用 torchvision 包,非常简单地加载 CIFAR10

import torch
import torchvision
import torchvision.transforms as transforms

torchvision 数据集的输出是范围在 [0,1] PILImage 图像。我们将其转换为范围在 [-1, 1] 标准化的 Tensor

注意:如果你在 Windows 上运行,并且你得到了 BrokenPipeError 的错误提示,尝试设置 torch.utils.data.DataLoader() 的 num_worker 为 0

transform = transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]) trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2) classes = ('plane', 'car', 'bird', 'cat',
'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
Files already downloaded and verified
Files already downloaded and verified

让我们看一看训练集中的一些图片。

import matplotlib.pyplot as plt
import numpy as np # 显示图像的函数
def imshow(img):
img = img / 2 + 0.5 # unnormalize
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0)))
plt.show() # 随机地显示一些训练集中的图片
dataiter = iter(trainloader)
images, labels = dataiter.next() # 显示图片
imshow(torchvision.utils.make_grid(images))
# 打印标签
print(' '.join('%5s' % classes[labels[j]] for j in range(4)))

 deer   car plane  deer

2. 定义卷积神经网络

import torch.nn as nn
import torch.nn.functional as F class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10) def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x net = Net()

3. 定义损失函数和优化器

让我们使用分类交叉熵损失函数和带动量的随机梯度下降法。

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)

4. 训练网络

这时事情变得有趣起来。我们只需要遍历我们的数据迭代器,并将输入馈送到网络中并优化即可。

for epoch in range(2):  # 在数据集上多循环几次

    running_loss = 0.0
for i, data in enumerate(trainloader, 0):
# 得到输入和标签,数据是一个列表 [inputs, labels]
inputs, labels = data # 将参数梯度清零
optimizer.zero_grad() # 前向传播 + 反向传播 + 优化
outputs = net(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step() # 输出统计数据
running_loss += loss.item()
if i % 2000 == 1999: # 每 2000 为一个小批量输出
print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 2000))
running_loss = 0.0
[1,  2000] loss: 2.107
[1, 4000] loss: 1.965
[1, 6000] loss: 1.934
[1, 8000] loss: 1.951
[1, 10000] loss: 1.927
[1, 12000] loss: 1.963
[2, 2000] loss: 1.941
[2, 4000] loss: 1.950
[2, 6000] loss: 1.973
[2, 8000] loss: 1.980
[2, 10000] loss: 1.981
[2, 12000] loss: 1.998

现在,我们将训练完的模型存储起来。

PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)

可以参考官方文档来查看更多的存储 PyTorch 模型的细节。

5. 在测试集上测试

我们已经在训练集上训练了 2 遍的网络。但是,我们仍需要检查网络是否已经学得了什么。

我们将通过预测神经网络输出的类标签,并检查它是否和真实标签相同。如果预测错误,我们将出错的样本添加到错误预测的列表中。

首先,让我们输出一个测试集的图像熟练下。

dataiter = iter(testloader)
images, labels = dataiter.next() # 输出图像
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))

GroundTruth:    cat  ship  ship plane

下一步,让我们重新加载我们存储了的模型。

注意:保存和重新加载模型在这里不是必须的,这里只是演示一下如何去做。

net = Net()
net.load_state_dict(torch.load(PATH))
<All keys matched successfully>

现在,让我们来看一下神经网络认为上面的图像属于哪一类

outputs = net(images)

输出是关于 10 个类的激励值。对于每个类,越高的激励值,网络就越认为这个图像属于哪一个类。所以,让我们先得到最高的激励值的索引:

_, predicted = torch.max(outputs, 1)

print('Predicted: ', ' '.join('%5s' % classes[predicted[j]] for j in range(4)))
Predicted:   ship plane plane plane

结果看上去还可以。

让我们看一下网络在整个数据集上的表现如何。

correct = 0
total = 0
with torch.no_grad():
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item() print('神经网络在 10000 个测试图像上的准确率(Accuracy): %d %%' % (100 * correct / total))
神经网络在 10000 个测试图像上的准确率(Accuracy): 24 %

这看上去比 10% 的准确率(随机的从 10 个类别中选一个)相比要好。神经网络似乎已经学到了一些东西。

现在让我们看一下在哪个类别上表演的好,在哪个类别上表现的差。

class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs, 1)
c = (predicted == labels).squeeze()
for i in range(4):
label = labels[i]
class_correct[label] += c[i].item()
class_total[label] += 1 for i in range(10):
print('%5s 的准确率: %2d %%' % (classes[i], 100 * class_correct[i] / class_total[i]))
plane 的准确率: 45 %
car 的准确率: 49 %
bird 的准确率: 0 %
cat 的准确率: 6 %
deer 的准确率: 73 %
dog 的准确率: 0 %
frog 的准确率: 7 %
horse 的准确率: 38 %
ship 的准确率: 13 %
truck 的准确率: 7 %

在 GPU 上训练

就像将一个张量转换进 GPU 一样,也可以将网络转进 GPU

如果我们的 CUDA 可用,首先定义我们的一块 cuda 设备:

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# 假设我们在 CUDA 的设备上,下面将会看到输出一个 CUDA 设备

print(device)
cpu

下面剩下的部分假设 device 是一块 CUDA 设备。

然后,这些方法将递归的遍历所有模块并将它们的参数和缓冲区转换到 CUDA 张量:

net.to(device)
Net(
(conv1): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
(pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
(fc1): Linear(in_features=400, out_features=120, bias=True)
(fc2): Linear(in_features=120, out_features=84, bias=True)
(fc3): Linear(in_features=84, out_features=10, bias=True)
)

切记,还要将每一步的输入和目标值也转到 GPU 上:

inputs, labels = data[0].to(device), data[1].to(device)

在多块 GPU 上训练

如果需要使用电脑上所有的 GPU 来获得更多的加速,就参考官方文档的数据并行

训练分类器 - 基于 PyTorch的更多相关文章

  1. [PyTorch入门之60分钟入门闪击战]之训练分类器

    训练分类器 目前为止,你已经知道如何定义神经网络.计算损失和更新网络的权重.现在你可能在想,那数据呢? What about data? 通常,当你需要处理图像.文本.音频或者视频数据时,你可以使用标 ...

  2. 基于YOLO-V2的行人检测(自训练)附pytorch安装方法

    声明:本文是别人发表在github上的项目,并非个人原创,因为那个项目直接下载后出现了一些版本不兼容的问题,故写此文帮助解决.(本人争取在今年有空的时间,自己实现基于YOLO-V4的行人检测) 项目链 ...

  3. 基于 PyTorch 和神经网络给 GirlFriend 制作漫画风头像

    摘要:本文中我们介绍的 AnimeGAN 就是 GitHub 上一款爆火的二次元漫画风格迁移工具,可以实现快速的动画风格迁移. 本文分享自华为云社区<AnimeGANv2 照片动漫化:如何基于 ...

  4. 如何利用OpenCV自带的级联分类器训练程序训练分类器

    介绍 使用级联分类器工作包括两个阶段:训练和检测. 检测部分在OpenCVobjdetect 模块的文档中有介绍,在那个文档中给出了一些级联分类器的基本介绍.当前的指南描述了如何训练分类器:准备训练数 ...

  5. 基于pytorch实现HighWay Networks之Highway Networks详解

    (一)简述---承接上文---基于pytorch实现HighWay Networks之Train Deep Networks 上文已经介绍过Highway Netwotrks提出的目的就是解决深层神经 ...

  6. 基于pytorch的电影推荐系统

    本文介绍一个基于pytorch的电影推荐系统. 代码移植自https://github.com/chengstone/movie_recommender. 原作者用了tf1.0实现了这个基于movie ...

  7. 目标检测-基于Pytorch实现Yolov3(1)- 搭建模型

    原文地址:https://www.cnblogs.com/jacklu/p/9853599.html 本人前段时间在T厂做了目标检测的项目,对一些目标检测框架也有了一定理解.其中Yolov3速度非常快 ...

  8. 基于Pytorch的简单小案例

    神经网络的理论知识不是本文讨论的重点,假设读者们都是已经了解RNN的基本概念,并希望能用一些框架做一些简单的实现.这里推荐神经网络必读书目:邱锡鹏<神经网络与深度学习>.本文基于Pytor ...

  9. 使用LabVIEW实现基于pytorch的DeepLabv3图像语义分割

    前言 今天我们一起来看一下如何使用LabVIEW实现语义分割. 一.什么是语义分割 图像语义分割(semantic segmentation),从字面意思上理解就是让计算机根据图像的语义来进行分割,例 ...

随机推荐

  1. JDK下载与安装

    Java有很多个版本,最新的版本会兼容之前的. 先附上下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downlo ...

  2. [日常摸鱼]bzoj2823 [AHOI2012]信号塔

    题意:$n$个点,求最小圆覆盖,$n \leq 5e5$ 这题数据是随机的hhh 我们可以先求出凸包然后对凸包上的点求最小圆覆盖-(不过直接求应该也行?) 反正随便写好像都能过- #include&l ...

  3. 小白数据分析——Python职位全链路分析

    最近在做Python职位分析的项目,做这件事的背景是因为接触Python这么久,还没有对Python职位有一个全貌的了解.所以想通过本次分析了解Python相关的职位有哪些.在不同城市的需求量有何差异 ...

  4. 庐山真面目之九微服务架构 NetCore 基于 Docker 基础镜像和挂载文件部署

    庐山真面目之九微服务架构 NetCore 基于 Docker 基础镜像和挂载文件部署 一.简介      我们在上一篇文章<庐山真面目之八微服务架构 NetCore 基于 Dockerfile ...

  5. DotNet .Net Framework与Net Core与Net Standard 以及.NET5

    Net Framework 是什么 1.Net Framework 是Net的一种实现,在此类库上我们可以使用C#,VB,F#进行程序编写,主要用于构建Windows 下的应用程序 2.有两部分组成部 ...

  6. 【进程/作业管理】篇章四:Linux任务计划、周期性任务执行

    命令归纳: at 未来时间点让特定任务运行一次 batch 未来时间点让系统自行选择在系统资源较空闲的时间去执行指定的任务 corn 周期性任务计划(corntad) at命令详解 <--- 假 ...

  7. 【扫盲】i++和++i的区别

    从学java开始,我们就听说过i++和++i的效果一样,都能使i的值累加1,效果如同i=i+1: 但是使用过程中,有和不同呢,今天我们来说说看. 案例一: int i=0; int j=i++; Sy ...

  8. Ubuntu不能直接从windows复制粘贴文件或文字

    终端输入: apt-get autoremove open-vm-tools sudo apt-get install open-vm-tools-desktop 然后重启电脑就可以了. 参考链接:h ...

  9. CentOS7下常用安装软件服务rpm方式的介绍

    简介:介绍rpm软件包的管理 rpm安装:安装别人编译好的软件包,rpm即Redhat Package Manager,是Redhat的软件包管理方式   rpm安装优点: 软件已经编译打包,所以传输 ...

  10. springboot使用aspectJ

    添加springboot-aop的starter <dependency> <groupId>org.springframework.boot</groupId> ...