[Pytorch]Pytorch中图像的基本操作(TenCrop)

转自：https://www.jianshu.com/p/73686691cf13

下面是几种常写的方式

第一种方式

        normalize = transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])

        transformList = []

        transformList.append(transforms.RandomResizedCrop(transCrop))

        transformList.append(transforms.RandomHorizontalFlip())

        transformList.append(transforms.ToTensor())

        transformList.append(normalize)

        transformSequence = transforms.Compose(transformList)

第二种方式

train_augmentation = torchvision.transforms.Compose([torchvision.transforms.Resize(256),

                                                    torchvision.transforms.RandomCrop(224),

                                                    torchvision.transofrms.RandomHorizontalFlip(),

                                                    torchvision.transforms.ToTensor(),

                                                    torch vision.Normalize([0.485, 0.456, -.406], [0.229, 0.224, 0.225])

                                                    ])

需要主要的是:

Pytorch 常用PIL库来读取图像数据,读取之后的格式是PIL Image
在进行Normalize时, 需要先转成Tensor的形式.
Resize和crop的操作是对 PIL Image 的格式进行的操作.现在论文中一般将图片先resize到(256,256)然后randomCrop到(224,和224)中.

Resize和Crop的区别

resize相当于对原来的图像进行压缩,大致的形状是不发生变化的,也就是说可以看到图片的样子

Crop是对图片进行随机的剪切,切出来的可能是整个图片的一部分,其中RandomCrop的操作更常用

RandomResizedCrop类也是比较常用, 总的来讲就是先做crop，再resize到指定尺寸

FiveCrop和TenCrop

这两种操作之后,一张图变成五张,一张图变成十张,那么在训练或者测试的时候怎么避免和标签混淆呢

思路是,这多个图拥有相同的标签,假如是分类任务,就可以使用交叉熵进行,然后求10张图的平均

transform = Compose([

    TenCrop(size), # this is a list of PIL Images

    Lambda(lambda crops: torch.stack([ToTensor()(crop) for crop in crops])) # returns a 4D tensor

])

#In your test loop you can do the following:


input, target = batch # input is a 5d tensor, target is 2d


bs, ncrops, c, h, w = input.size()


result = model(input.view(-1, c, h, w)) # fuse batch size and ncrops


result_avg = result.view(bs, ncrops, -1).mean(1) # avg over crops

      </div>

[Pytorch]Pytorch中图像的基本操作(TenCrop)的更多相关文章

MATLAB中图像的基本操作
MATLAB中图像的基本操作 1.读取.显示图片 MATLAB中提供了immread()与imshow()函数读取和显示图片.其中读取函数imread()原型: imread: A = imread( ...
PyTorch官方中文文档：torch.nn
torch.nn Parameters class torch.nn.Parameter() 艾伯特(http://www.aibbt.com/)国内第一家人工智能门户,微信公众号:aibbtcom ...
Qt中图像的显示与基本操作
Qt可显示基本的图像类型,利用QImage.QPxmap类可以实现图像的显示,并且利用类中的方法可以实现图像的基本操作(缩放.旋转). 1. Qt可显示的图像类型参考Qt的帮助文档,可支持的类型,即 ...
【转载】Qt中图像的显示与基本操作
Qt可显示基本的图像类型,利用QImage.QPxmap类可以实现图像的显示,并且利用类中的方法可以实现图像的基本操作(缩放.旋转). 参考:Qt中图像的显示与基本操作 - ykm0722的专栏 - ...
【Qt开发】Qt中图像的显示与基本操作
Qt可显示基本的图像类型,利用QImage.QPxmap类可以实现图像的显示,并且利用类中的方法可以实现图像的基本操作(缩放.旋转). 1. Qt可显示的图像类型参考Qt的帮助文档,可支持的类型,即 ...
PyTorch官方中文文档：torch.optim 优化器参数
内容预览: step(closure) 进行单次优化 (参数更新). 参数: closure (callable) –...~ 参数: params (iterable) – 待优化参数的iterab ...
Matlab基础：关于图像的基本操作
-- %% 学习目标:学习关于图像的基本操作 %% 通过抖动来增强图像的的色彩对比度 clear all; close all; I = imread('cameraman.tif');%读取灰度图像 ...
[pytorch] PyTorch Hook
PyTorch Hook¶ 为什么要引入hook? -> hook可以做什么? 都有哪些hook? 如何使用hook? 1. 为什么引入hook?¶ 参考:Pytorch中autogra ...
opencv入门系列教学（五）图像的基本操作（像素值、属性、ROI和边框）
0.序言每个图像是由一个个点组成的,而这些点可以表示为像素值的形式. 这篇博客里我们将学会: 访问像素值并修改它们 . 访问图像属性 . 设置感兴趣区域(ROI) . 分割和合并图像. 对于图像的基 ...

随机推荐

python 面向对象 issubclass
判断是否他的父类 class Foo(object): pass obj = Foo() class Boo(Foo): pass class Coo(Boo): pass obj = Boo() ...
dedecms自增标签[field:global.autoindex/]的运用
用bootstrap建站时用到幻灯片切换模块,里面有个active(下面代码中的data-slide-to="0"),其余的按顺序递增(1,2),如果用dedecms就可以用aut ...
C#静态类,静态构造函数,静态变量
静态变量位于栈上,它是一个全局变量,在编译期就已经生成. public class Cow public static int count; private int id; { id = ++coun ...
hashcode（）和equals（）的作用、区别、联系
介绍一. hashCode()方法和equal()方法的作用其实一样,在Java里都是用来对比两个对象是否相等一致,那么equal()既然已经能实现对比的功能了,为什么还要hashCode() ...
[vue]实现父子组件数据双向绑定
参考: http://www.cnblogs.com/xxcanghai/p/6124699.html <!DOCTYPE html> <html lang="en&quo ...
spring security积累
使用数据库管理用户权限: Spring Security默认情况下需要两张表,用户表和权限表 create table users( username varchar_ignorecase(50) n ...
容器集成平台 rancher部署
下载rancher镜像 docker pull rancher/server:stable rancher/server:latest #开发版 rancher/server:stable #稳定版 ...
SVM计算过程，对偶形式，核函数
SVM是一个分类方法,用w^X+b定义分类函数, 于是求w.b,为寻最大间隔,引出1/2||w||^2,继而引入拉格朗日因子,化为对单一因数对偶变量a的求解(求解过程中会涉及到一系列最优化或凸二次规 ...
asp.net本地读取excel正确。但在iis服务器上就报错未在本地计算机上注册“Microsoft.ACE.OleDb.12.0”提供程序
本地vs2010可以上传ecxel文件.并读取数据,但部署到本地IIS.并访问.则提示: 未在本地计算机上注册“Microsoft.ACE.OleDb.12.0”提供程序首先:确保安装了Micros ...
【剑指Offer学习】【面试题3 ：二维数组中的查找】
package 二维数组查找; public class Test03 { /** * 在一个二维数组中,每一行都按 package 二维数组查找; public class Test03 { /** ...