pytorch例子学习——TRAINING A CLASSIFIER
参考:https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py
TRAINING A CLASSIFIER
到这里,你已经知道怎么定义神经网络,计算损失和更新网络的权重
现在你应该考虑:
What about data?
通常,当你必须要处理一些图片、文本、音频或视频数据时,你可以使用标准的python包去下载数据到一个numpy数组中。然后你可以转换该数组为torch.*Tensor
- 对于图像,如Pillow、OpenCV这些包就很有用
- 对于音频,如scipy、librosa这些包
- 对于文本,要么是原始python,要么是基于下载的Cython,或者是NLTK和SpaCy也都很有用
尤其是对于视图,我们创建了一个名为torchvision的包,有着用于如Imagenet、CIFAR10、MNIST等普通数据库的数据下载器和用于图像的数据转换器,即torchvision.datasets和torch.utils.data.DataLoader
这提供了很大的便利,也防止编写样板代码
在这个教程中,我们将使用CIFAR10数据集,它有着 ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’等类别,下面是CIFAR-10中大小为3*32*32的图像,即32*32像素大小的3通道颜色的图像
Training an image classifier训练一个图像分类器
我们将会按顺序进行下面的操作:
1.使用torchvision下载和归一化训练和测试数据集
2.定义卷积神经网络
3.定义损失函数
4.在训练数据中训练网络
5.在测试数据中测试网络
1. Loading and normalizing CIFAR10
使用torchvision,它能很容易地去下载CIFAR10数据
import torch
import torchvision
import torchvision.transforms as transforms
torchvision数据集的输出是范围在[0,1]的PILImage图像。我们转换它们成有着标准化范围[-1,1]的张量
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
]) //获取训练数据
trainset = torchvision.datasets.CIFAR10(
root='./data', #下载的数据存放的位置
train=True, #说明下载的是训练数据而不是测试数据
download=True, #确定要进行下载
transform=transform #下载的数据要进行的格式转换
)
trainloader = torch.utils.data.DataLoader( #对数据进行批处理
trainset, #指明使用的数据集
batch_size=, #一批数据的大小,即一批数据有四张图片
shuffle=True, #是否随机打乱图片进行分批,是则为true
num_workers= #获取数据的线程为2
) //获取测试数据
testset = torchvision.datasets.CIFAR10(root='./data', train=False,download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=,shuffle=False, num_workers=) //指明数据的类别
classes = ('plane', 'car', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')
运行后首先进行数据的下载:
(deeplearning2) userdeMBP:classifier cifar user$ python cifar10_tutorial.py
Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz
100.0%Files already downloaded and verified
下面展示一些训练图像:
import matplotlib.pyplot as plt
import numpy as np # 用来展示图像的函数 def imshow(img):
img = img / + 0.5 # 非归一化
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (, , ))) #是因为plt.imshow在显示时需要的输入是(imgsize,imgsieze,channels),但是这里是(channels,imgsize,imgsieze),所以需要将位置换换
plt.show() # 随机得到一些训练图像
dataiter = iter(trainloader) #生成迭代器
images, labels = dataiter.next() #每次运行next()就会调用trainloader,获得一个之前定义的batch_size=4的批处理图片集,即4张图片 # 展示图像
imshow(torchvision.utils.make_grid(images)) #make_grid的作用是将若干幅图像拼成一幅图像,在想要展示一批数据的时候十分有用
# 输出图像标签
print(' '.join('%5s' % classes[labels[j]] for j in range()))
然后点击关闭图片,就会继续向下运行,就能够得到预测的结果:
horse horse bird car
2. Define a Convolutional Neural Network定义一个卷积神经网络
从之前的神经网络部分复制神经网络,并修改其应用于3通道图片(而不是之前的1通道图片)
import torch.nn as nn
import torch.nn.functional as F class Net(nn.Module): #自定义一个神经网络
def __init__(self):
super(Net, self).__init__() #声明继承
self.conv1 = nn.Conv2d(, , ) #卷积层,参数为(inchannel,outchannel=number of filter,siza of filter,stride,padding)
self.pool = nn.MaxPool2d(, ) #池化层
self.conv2 = nn.Conv2d(, , ) #卷积层
self.fc1 = nn.Linear( * * , ) #全连接层
self.fc2 = nn.Linear(, ) #全连接层
self.fc3 = nn.Linear(, ) #全连接层,最后输出10个神经元,用于判断该图为哪个类别 def forward(self, x): #实现前向传播
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-, * * ) #用来将x展平成16 * * ,然后就可以进行下面的全连接层操作
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x net = Net()
3. Define a Loss function and optimizer定义一个损失函数和优化器
使用分类Cross-Entropy损失和带有动量的SGD优化
import torch.optim as optim criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
4. Train the network 训练网络
循环数据迭代,并输入到网络,然后进行优化
for epoch in range(): # 多次循环数据集,这里循环训练整个数据集两次 running_loss = 0.0
for i, data in enumerate(trainloader, ): #enumerate枚举数据并从下标0开始
# 得到输入数据
inputs, labels = data # 将参数的梯度都设为0
optimizer.zero_grad() # forward + backward + optimize
outputs = net(inputs) #forward
loss = criterion(outputs, labels) #计算损失
loss.backward() #后向传播
optimizer.step() #将优化后的参数输入网络,再次进行训练 #打印数据
running_loss += loss.item() #用于从tensor中获取python数字
if i % == : # 每处理2000次小批处理数据后打印一次结果
print('[%d, %5d] loss: %.3f' %(epoch + , i + , running_loss / ))
running_loss = 0.0 #然后清0 print('Finished Training')
然后返回输出为:
[, ] loss: 2.195
[, ] loss: 1.848
[, ] loss: 1.654
[, ] loss: 1.578
[, ] loss: 1.511
[, ] loss: 1.459
[, ] loss: 1.382
[, ] loss: 1.375
[, ] loss: 1.344
[, ] loss: 1.314
[, ] loss: 1.317
[, ] loss: 1.284
Finished Training
5. Test the network on the test data在测试数据中测试网络
我们对网络进行了两次遍历训练数据集的训练。但我们还是需要查看网络是否学习了所有的东西
我们将会通过预测神经网络输出的类型标签来检查它,并与事实相对照。如果预测是正确的,我们将样本添加到正确预测列表中。
好的,第一步,让我们从测试集中显示一个图像来熟悉它。
dataiter = iter(testloader)
images, labels = dataiter.next() # 打印图片
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range()))
然后出现四张图片:
然后点击关闭图片,就会返回实际该图片的标签:
('GroundTruth: ', ' cat ship ship plane')
然后让我们看看神经网络认为上面的例子是什么:
outputs = net(images)
输出是这10个类的能量。一个类的能量越高,网络越认为图像属于特定的类。所以,让我们得到最高能量的指数:
_, predicted = torch.max(outputs, ) print('Predicted: ', ' '.join('%5s' % classes[predicted[j]] for j in range()))
返回预测值:
('Predicted: ', ' cat plane truck plane')
让我们看看网络在整个数据集中表现得怎么样
correct =
total =
with torch.no_grad(): #设置为不计算梯度
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs.data, )
total += labels.size()
correct += (predicted == labels).sum().item() #相等 print('Accuracy of the network on the 10000 test images: %d %%' % ( * correct / total))
⚠️(predicted == labels).sum().item()作用:可见(predicted == labels).sum().item()作用
返回:
Accuracy of the network on the test images: %
这看起来比随机抽取10%的正确率(从10个类中随机抽取一个类)要好得多。看来网络学到了一些东西。
那么是哪些类执行得好,哪些类执行得不好呢?
class_correct = list(. for i in range())
class_total = list(. for i in range())
with torch.no_grad(): #设置在进行forward时不计算梯度
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs, )
c = (predicted == labels).squeeze()
for i in range():
label = labels[i]
class_correct[label] += c[i].item()
class_total[label] += for i in range():
print('Accuracy of %5s : %2d %%' % (
classes[i], * class_correct[i] / class_total[i]))
返回:
Accuracy of plane : %
Accuracy of car : %
Accuracy of bird : %
Accuracy of cat : %
Accuracy of deer : %
Accuracy of dog : %
Accuracy of frog : %
Accuracy of horse : %
Accuracy of ship : %
Accuracy of truck : %
接下来就是设置运行在GPU上:
就像你把张量传输到GPU上一样,你把神经网络传输到GPU上。
让我们首先定义我们的设备为第一个可见的cuda设备,如果我们有cuda可用:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") # Assuming that we are on a CUDA machine, this should print a CUDA device: print(device)
因为我是在CPU上运行的,所以这里print(device)会返回cpu
本节的其余部分假设设备是CUDA设备。
然后这些方法递归遍历所有模块,将它们的参数和缓冲区转换为CUDA张量:
net.to(device)
记住,你必须在每一步都把输入和目标值的发送到GPU中:
inputs, labels = inputs.to(device), labels.to(device)
为什么我没有注意到GPU与CPU相比的巨大加速?因为你的网络实在是太小了。
练习:
尝试增加网络的宽度(即第一个nn.Conv2d卷积层的参数2)和第二个nn.Conv2d卷积层的参数1 — 他们需要相同的数字,看看你得到什么样的加速。
实现目标:
- 高层次地理解PyTorch张量库和神经网络。
- 训练一个小的神经网络对图像进行分类
pytorch例子学习——TRAINING A CLASSIFIER的更多相关文章
- pytorch例子学习-DATA LOADING AND PROCESSING TUTORIAL
参考:https://pytorch.org/tutorials/beginner/data_loading_tutorial.html DATA LOADING AND PROCESSING TUT ...
- PyTorch教程之Training a classifier
我们已经了解了如何定义神经网络,计算损失并对网络的权重进行更新. 接下来的问题就是: 一.What about data? 通常处理图像.文本.音频或视频数据时,可以使用标准的python包将数据加载 ...
- pytorch例子学习——TRANSFER LEARNING TUTORIAL
参考:https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html 以下是两种主要的迁移学习场景 微调convnet : ...
- pytorch例子学习——NEURAL TRANSFER USING PYTORCH神经迁移
参考:https://pytorch.org/tutorials/advanced/neural_style_tutorial.html 具体的理论就不解释了,这里主要是解释代码: ⚠️使用的是pyt ...
- 训练一个图像分类器demo in PyTorch【学习笔记】
[学习源]Tutorials > Deep Learning with PyTorch: A 60 Minute Blitz > Training a Classifier 本文相当于 ...
- PyTorch深度学习实践——反向传播
反向传播 课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 目录 反向传播 笔记 作业 笔记 在之前课程中介绍的线性 ...
- PyTorch深度学习实践——多分类问题
多分类问题 目录 多分类问题 Softmax 在Minist数据集上实现多分类问题 作业 课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩 ...
- PyTorch深度学习实践——处理多维特征的输入
处理多维特征的输入 课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 这一讲介绍输入为多维数据时的分类. 一个数据集 ...
- 数百个 HTML5 例子学习 HT 图形组件 – 3D建模篇
http://www.hightopo.com/demo/pipeline/index.html <数百个 HTML5 例子学习 HT 图形组件 – WebGL 3D 篇>里提到 HT 很 ...
随机推荐
- VMWAR-workstatuon : 安装win10、server 2008 r2、server 2012 r2
最新版的VMWAR 不是很文档,建议大家还是下载稳定版,截止当前最新版的为15,用了,有点问题. 换成14~ 可以了.(15创建虚拟机安装vmware tools 怎么都安装不了). 关于创建虚拟机, ...
- cookie 和 session区别
cookie 和 session区别 ① cookie介绍说明 cookie 存放在浏览器缓存中---浏览器进行查看(谷歌) [设置]---[高级]---[内容设置]---[cookie]---[所有 ...
- [DOM基础]offsetHeight,clientHeight,scrollHeight,innerHeight,outerHeight等属性的解释
由于经常搞混这几个属性,所以查找资料总结一下,方便以后翻出来温习. 一.偏移量-以offset开头的 1.offsetHeight:元素在垂直方向上占用的空间大小,像素.包括元素的高度.可见的水平滚动 ...
- 排错-Loadrunner录制打不开浏览器解决方法
排错-Loadrunner录制打不开浏览器解决方法 by:授客 QQ:1033553122 问题描述: 采用自带的web测试站点http://127.0.0.1:1080/WebTours/,进行录制 ...
- js数组的用法以及数组根据下标(数值或字符)移除元素
1.创建数组var array = new Array();var array = new Array(size);//指定数组的长度var array = new Array(item1,item2 ...
- git 入门教程之忽略文件
忽略文件 "并不是所有的牛奶都叫特仑苏",在版本控制系统中也有相似的表达,那就是"并不是所有的文件都需要提交". 有的是因为没必要提交,比如日志文件,系统缓存文 ...
- git 入门教程之里程碑式标签
"春风得意马蹄疾,一日看尽长安花",对于项目也是如此,最值得期待的恐怕就要数新版本发布的时刻了吧?每当发布新版本时要么是版本号命名(比如v0.0.1)或者代号命名(比如Chelse ...
- 解决Chrome与jQuery菜单兼容问题
题外,Chrome最近在耗电量方面超过了Edge,不过内存占用还是高啊,开发时偶尔用用.这不,http://jqueryui.com/menu/的官方菜单都支持的不好,改改吧! 打开jquery-ui ...
- js每隔一段时间执行函数
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
- PHP断言(ASSERT)的用法
简述 编写代码时,我们总是会做出一些假设,断言就是用于在代码中捕捉这些假设,可以将断言看作是异常处理的一种高级形式.程序员断言在程序中的某个特定点该的表达式值为真.如果该表达式为假,就中断操作. 可以 ...