pytorch 计算图像数据集的均值和标准差

在使用 torchvision.transforms进行数据处理时我们经常进行的操作是：

transforms.Normalize((0.485,0.456,0.406), (0.229,0.224,0.225))

前面的(0.485,0.456,0.406)表示均值，分别对应的是RGB三个通道；后面的(0.229,0.224,0.225)则表示的是标准差

这上面的均值和标准差的值是ImageNet数据集计算出来的，所以很多人都使用它们

但是如果你想要计算自己的数据集的均值和标准差，让其作为你的transforms.Normalize函数的参数的话可以进行下面的操作

代码get_mean_std.py：

# coding:utf-

import os

import numpy as np

from torchvision.datasets import ImageFolder

import torchvision.transforms as transforms

from dataloader import Dataloader

from options import options

import pickle

"""

    在训练前先运行该函数获得数据的均值和标准差

"""

class Dataloader():

    def __init__(self, opt):

        # 训练，验证，测试数据集文件夹名

        self.opt = opt

        self.dirs = ['train', 'test', 'testing']

        self.means = [, , ]

        self.stdevs = [, , ]

        self.transform = transforms.Compose([transforms.Resize(opt.isize),

                                        transforms.CenterCrop(opt.isize),

                                        transforms.ToTensor(),#数据值从[0,255]范围转为[0,1]，相当于除以255操作

                                        # transforms.Normalize((0.485,0.456,0.406), (0.229,0.224,0.225))

                                        ])

        # 因为这里使用的是ImageFolder，按文件夹给数据分类，一个文件夹为一类，label会自动标注好

        self.dataset = {x: ImageFolder(os.path.join(opt.dataroot, x), self.transform) for x in self.dirs}

    def get_mean_std(self, type, mean_std_path):

        """

        计算数据集的均值和标准差

        :param type: 使用的是那个数据集的数据，有'train', 'test', 'testing'

        :param mean_std_path: 计算出来的均值和标准差存储的文件

        :return:

        """

        num_imgs = len(self.dataset[type])

        for data in self.dataset[type]:

            img = data[]

            for i in range():

                # 一个通道的均值和标准差

                self.means[i] += img[i, :, :].mean()

                self.stdevs[i] += img[i, :, :].std()

        self.means = np.asarray(self.means) / num_imgs

        self.stdevs = np.asarray(self.stdevs) / num_imgs

        print("{} : normMean = {}".format(type, self.means))

        print("{} : normstdevs = {}".format(type, self.stdevs))

        # 将得到的均值和标准差写到文件中，之后就能够从中读取

        with open(mean_std_path, 'wb') as f:

            pickle.dump(self.means, f)

            pickle.dump(self.stdevs, f)

            print('pickle done')

if __name__ == '__main__':

    opt = options().parse()

    dataloader = Dataloader(opt)

    for x in dataloader.dirs:

        mean_std_path = 'mean_std_value_' + x + '.pkl'

        dataloader.get_mean_std(x, mean_std_path)

然后再从相应的文件读取均值和标准差放到dataloader.py的transforms.Normalize函数中即可：

# coding:utf-

import os

import torch

import torchvision.transforms as transforms

from torchvision.datasets import ImageFolder

import numpy as np

import pickle

"""

    用于加载训练train、验证test和测试数据testing

"""

class Dataloader():

    def __init__(self, opt):

        # 训练，验证，测试数据集文件夹名

        self.opt = opt

        self.dirs = ['train', 'test', 'testing']

        # 均值和标准差存储的文件路径

        self.mean_std_path = {x: 'mean_std_value_' + x + '.pkl' for x in self.dirs}

        # 初始化为0

        self.means = {x: [, , ] for x in self.dirs}

        self.stdevs = {x: [, , ] for x in self.dirs}

        print(type(self.means['train']))

        print(self.means)

        print(self.stdevs)

        for x in self.dirs:

            #如果存在则说明之前有获取过均值和标准差

            if os.path.exists(self.mean_std_path[x]):

                with open(self.mean_std_path[x], 'rb') as f:

                    self.means[x] = pickle.load(f)

                    self.stdevs[x] = pickle.load(f)

                    print('pickle load done')

        print(self.means)

        print(self.stdevs)

        # 将相应的均值和标准差设置到transforms.Normalize函数中

        self.transform = {x: transforms.Compose([transforms.Resize(opt.isize),

                                        transforms.CenterCrop(opt.isize),

                                        transforms.ToTensor(),

                                        transforms.Normalize(self.means[x], self.stdevs[x]),

                                        ]) for x in self.dirs}

...

pytorch 计算图像数据集的均值和标准差的更多相关文章

计算图像数据集的RGB均值
最近在跑代码的时候,需要用到RGB三个通道上的均值,如下图所示: 写了一个程序,如下: import os import cv2 import random import numpy as np #数 ...
opencv学习之路（38）、Mat像素统计基础——均值，标准差，协方差；特征值，特征向量
本文部分内容转自 https://www.cnblogs.com/chaosimple/p/3182157.html 一.统计学概念二.为什么需要协方差三.协方差矩阵注:上述协方差矩阵还需要除以 ...
OpenCV2+入门系列（四）：计算图像的直方图，平均灰度，灰度方差
本篇懒得排版,直接在网页html编辑器编辑在图像处理时,我们常常需要求出图像的直方图.灰度平均值.灰度的方差,这里给出一个opencv2+自带程序,实现这些功能. 直方图对于直方图,使用cv::c ...
Caffe学习系列(15)：计算图片数据的均值
图片减去均值后,再进行训练和测试,会提高速度和精度.因此,一般在各种模型中都会有这个操作. 那么这个均值怎么来的呢,实际上就是计算所有训练样本的平均值,计算出来后,保存为一个均值文件,在以后的测试中, ...
计算图像相似度——《Python也可以》之一
声明:本文最初发表于赖勇浩(恋花蝶)的博客http://blog.csdn.net/lanphaday 先将两张图片转化为直方图,图像的相似度计算就转化为直方图的距离计算了,本文依照如下公式进行直方图 ...
OpenCV 学习（计算图像的直方图）
OpenCV 计算图像的直方图计算图像的直方图是图像处理领域一个非经常见的基本操作. OpenCV 中提供了 calcHist 函数来计算图像直方图.只是这个函数说实话挺难用的,研究了好久才掌握了些 ...
C语言之文件操作07——读取文件数据并计算均值方差标准差
//文件 /* =============================================================== 题目:从文本文件"high.txt" ...
动手学深度学习6-认识Fashion_MNIST图像数据集
获取数据集读取小批量样本小结本节将使用torchvision包,它是服务于pytorch深度学习框架的,主要用来构建计算机视觉模型. torchvision主要由以下几个部分构成: torchv ...
什么是pytorch（4.数据集加载和处理）(翻译)
数据集加载和处理这里主要涉及两个包:torchvision.datasets 和torch.utils.data.Dataset 和DataLoader torchvision.datasets是一 ...

随机推荐

【转】Deep dive into pipe function in RxJS
原文: https://codewithstyle.info/deep-dive-pipe-function-rxjs/ --------------------------------------- ...
重装windows10系统的教程
1.首先从官网上下载一个win10的系统, 2.准备一个8GB的移动U盘,下载好的镜像文件烧录在这个U盘, 3.按照不同型号的机型,使用不同的按键进入BOIS模式,然后选中U盘作为启动项,读取出来这个 ...
vbs读取TXT每一行并赋值到变量a
vbs代码: Dim fso,f,a Set fso = CreateObject("Scripting.FileSystemObject") Set f=fso.OpenText ...
keras模块学习之-参数初始化与对象调用-笔记
本笔记由博客园-圆柱模板博主整理笔记发布,转载需注明,谢谢合作! 参数初始化(Initializations) 这个模块的作用是在添加layer时调用init进行这一层的权重初始化,有两种初始化方法 ...
C++创建对象的3种方式（转载）
#include <iostream> using namespace std; class A { private: int n; public: A(int m):n(m) { } ~ ...
go实现多聊天并发服务端
package main import ( "fmt" "net" "time")type Client struct { ch chan ...
ES中的分析和分析器
在ES存储的文档,进行存储时,会对文档的内容进行分析和分词分析的过程: 首先,将一块文本分成适合于倒排索引的独立的词条 , 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 reca ...
Hibernate框架的查询方式
技术分析之Hibernate框架的查询方式 1. 唯一标识OID的检索方式 * session.get(对象.class,OID) 2. 对象的导航的方式 ...
简述 OSI 七层协议？
OSI七层协议是一个用于计算机或通信系统间互联的标准体系. 物理层功能:主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0. 数据链路层的功能:定义了电信号的分组方式按照以太 ...
[TypeScript] Optional Chaining with TypeScript 3.7
TypeScript 3.7 adds support for optional chaining. This lesson shows you how to use it in your code ...

pytorch 计算图像数据集的均值和标准差

pytorch 计算图像数据集的均值和标准差的更多相关文章

随机推荐

热门专题