动手学深度学习6-认识Fashion

获取数据集
读取小批量样本
小结

本节将使用torchvision包，它是服务于pytorch深度学习框架的，主要用来构建计算机视觉模型。

torchvision主要由以下几个部分构成：

torchvision.datasets:一些加载数据的函数以及常用的数据集的接口
torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet，VGG，ResNet；
torchvision.transforms:常用的图片变换，例如裁剪，旋转等；
torchvision.utils: 其他的一些有用的方法

获取数据集

导入本节需要的包或者模块

import torch

import torchvision

import torchvision.transforms as transforms

import matplotlib.pyplot as plt

import time

import sys

sys.path.append('..')  # 为了导入上层目录的d2lzh_pytorch

import d2lzh_pytorch as d2l

通过调用torchvision的torchvision.datasets来下载这个数据集

可以通过train参数获取指定的训练集或者测试集、

测试集只用了评估模型，并不用来训练模型

同时指定了参数transform = transform.ToTensor()使所有数据转化为Tensor,如果不进行转化，则返回的是PIL照片。

transform.ToTensor()将尺寸为（H，W，C)且数据位于[0,255]的PIL图片或者数据类型为np.unit8的Numpy数组转化为(CxHxW)且数据类型为torch.float32且位于[0.0,1.0]的Tensor。

如果用像素值（0，255）表示图片数据，一律将其类型设置为unit8,避免出问题

mnist_train= torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=True,transform=transforms.ToTensor())

mnist_test = torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=False,transform=transforms.ToTensor())

print(type(mnist_train))

print(len(mnist_train), len(mnist_test))

<class 'torchvision.datasets.mnist.FashionMNIST'>

60000 10000

feature,label = mnist_train[0]

print(feature.shape,label)  # channel * height* width

torch.Size([1, 28, 28]) tensor(9)

feature对应的高和宽均为28像素的图像，由于我们使用了transforms.ToTensor()，所以每个像素的数值为[0,1]的32位浮点数。需要注意的是，feature的尺寸是(CxHxW)的，而不是（HxWxC)。第一维是通道数，因为数据集中是灰度图像，所以通道数为1，后面两维分别是图像的高和宽。

Fashion_MNIST中一共包括了10个类别，分别是t-shirt(T恤）,trouser(裤子），pullover(套衫),dress(连衣裙),coat(外套)，sandal(凉鞋),shirt(衬衫),sneaker(运动鞋),bag(包）和ankle boot(短靴）

import d2lzh_pytorch as d2l

def get_fashion_mnist_labels(labels):

    text_labels = ['t-shirt','trouser','pullover','dress','coat','sandal',

                  'shirt','sneaker','bag','ankle boost'

                  ]

    return [text_labels[int(i)] for i in labels]

def show_fashion_mnist(images,labels):

    d2l.use_svg_display()

    _,figs = plt.subplots(1,len(images),figsize=(12,12))  # 1行10列

    for f ,img,lbl in zip(figs,images,labels):

        f.imshow(img.view((28,28)).numpy())

        f.set_title(lbl)

        f.axes.get_xaxis().set_visible(False)

        f.axes.get_yaxis().set_visible(False)

    plt.show()

X,y = [],[]

for i in range(10):

    X.append(mnist_train[i][0])

    y.append(mnist_test[i][1])

show_fashion_mnist(X,get_fashion_mnist_labels(y))

读取小批量样本

我们将在训练集上训练模型，并将训练好的模型预测测试集上评估模型的表现。

可以用torch.utils.data.Dataloader来创建一个读取小批量样本的DataLoader实例。

在实际中，数据读取经常是训练的性能瓶颈，特别是当模型较为简单或者计算硬件性能较高时，pytorch的DataLoader中一个很方便的功能是允许使用多进程来加速数据读取。这里我们通过参数num_workers来设置进程数来加速读取数据

batch_size= 256

if sys.platform.startswith('win'):

    num_worker=0   # 表示不用额外的进程来加速读取数据

else:

    num_worker=4

train_iter = torch.utils.data.DataLoader(mnist_train,batch_size=batch_size,shuffle=True,num_workers=num_worker)

test_iter = torch.utils.data.DataLoader(mnist_test,batch_size=batch_size,shuffle=False,num_workers=num_worker)

start = time.time()

for X,y in train_iter:

    continue

print('%.2f sec' % (time.time()-start))

1.28 sec

小结

Fashion_MNIST 是一个10类服饰的分类数据集，之后章节后使用它来验证不同算法的表现
我们将高和宽分别是H和W像素的图像的形状记为HxW或(h,w)

动手学深度学习6-认识Fashion_MNIST图像数据集的更多相关文章

小白学习之pytorch框架(2)-动手学深度学习(begin-random.shuffle()、torch.index_select()、nn.Module、nn.Sequential())
在这向大家推荐一本书-花书-动手学深度学习pytorch版,原书用的深度学习框架是MXNet,这个框架经过Gluon重新再封装,使用风格非常接近pytorch,但是由于pytorch越来越火,个人又比 ...
对比《动手学深度学习》 PDF代码+《神经网络与深度学习》PDF
随着AlphaGo与李世石大战的落幕,人工智能成为话题焦点.AlphaGo背后的工作原理"深度学习"也跳入大众的视野.什么是深度学习,什么是神经网络,为何一段程序在精密的围棋大赛中 ...
【动手学深度学习】Jupyter notebook中 import mxnet出错
问题描述打开d2l-zh目录,使用jupyter notebook打开文件运行,import mxnet 出现无法导入mxnet模块的问题, 但是命令行运行是可以导入mxnet模块的. 原因: 激活 ...
《动手学深度学习》系列笔记—— 1.2 Softmax回归与分类模型
目录 softmax的基本概念交叉熵损失函数模型训练和预测获取Fashion-MNIST训练集和读取数据 get dataset softmax从零开始的实现获取训练集数据和测试集数据模型参 ...
动手学深度学习14- pytorch Dropout 实现与原理
方法从零开始实现定义模型参数网络评估函数优化方法定义损失函数数据提取与训练评估 pytorch简洁实现小结针对深度学习中的过拟合问题,通常使用丢弃法(dropout),丢弃法有很多的 ...
动手学深度学习9-多层感知机pytorch
多层感知机隐藏层激活函数小结多层感知机之前已经介绍过了线性回归和softmax回归在内的单层神经网络,然后深度学习主要学习多层模型,后续将以多层感知机(multilayer percetro ...
动手学深度学习1- pytorch初学
pytorch 初学 Tensors 创建空的tensor 创建随机的一个随机数矩阵创建0元素的矩阵直接从已经数据创建tensor 创建新的矩阵计算操作加法操作转化形状 tensor 与nu ...
mxnet 动手学深度学习
http://zh.gluon.ai/chapter_crashcourse/introduction.html 强化学习(Reinforcement Learning) 如果你真的有兴趣用机器学习开 ...
动手学深度学习10- pytorch多层感知机从零实现
多层感知机定义模型的参数定义激活函数定义模型定义损失函数训练模型小结多层感知机 import torch import numpy as np import sys sys.path.a ...

随机推荐

Powershell ExecutionPolicy 执行策略
简单说明 powershell对于脚本的执行有着严格的安全限制 Get-ExecutionPolicy -List #查看当前的执行策略 Set-ExecutionPolicy -Scope Curr ...
mongodb复杂条件查询 (or与and)
分类专栏: mongodb 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/tjbsl/ ...
排序算法Java代码实现（二）—— 冒泡排序
本篇内容: 冒泡排序冒泡排序算法思想: 冒泡排序的原理是:从左到右,相邻元素进行比较. 每次比较一轮,就会找到序列中最大的一个或最小的一个.这个数就会从序列的最右边冒出来. 代码实现: /** * ...
纯 JS 设置文本框的默认提示
HTML5 中有个新特性叫 placeholder,一般用它来描述输入字段的预期值,适用于 text.search.password 等类型的 input 以及 textarea.示例如下: < ...
C 函数声明、函数参数
参考连接:https://www.runoob.com/cprogramming/c-functions.html 局部变量与全局变量在内存中的储存方式全局变量保存在内存中的全局储存区中,占用静态的 ...
Python【day 14-2】递归遍历文件夹
#需求遍历文件夹中所有的子文件夹及子文件--用递归实现 '''''' ''' 伪代码 1.遍历根目录--listdir for 得到第一级子文件夹(不包含子文件夹的子文件)和文件 2.判断是文件还是 ...
Struts2 常量配置
除了action的配置,struts还有其他的一些配置,比如编码方式. 这些配置用键值对来表示,键是固定的,是常量,所以也叫做常量配置. 常量配置有5种方式,Struts会按以下顺序依次搜索加载常量( ...
HLAPI
和SPS硬件交互的API
澄清Fundebug录屏技术的几点误会
1. "视频"并非真的视频.也不是通过连续播放大量截图来实现首先请大家观看这个视频: 视频中,当鼠标点击"场景重现",会立即播放一段"视频" ...
tornado的请求与响应
tornado请求与响应相关一.配置文件config.py 中的settings 有哪些配置: debug:设置tornado是否工作再调试模式下,默认为false 即工作再生产模式下 true的特 ...

动手学深度学习6-认识Fashion_MNIST图像数据集

获取数据集

读取小批量样本

小结

动手学深度学习6-认识Fashion_MNIST图像数据集的更多相关文章

随机推荐

热门专题