pytorch实现花朵数据集读取

import os

from PIL import Image

from torch.utils import data

import numpy as np

from torchvision import transforms as T

class My_Data(data.Dataset):

    def __init__(self, root, transforms=None, train=True, test=False):

        '''

        目标：获取所有图片路径，并根据训练、验证、测试划分数据

        '''

        self.test = test

        classs = os.listdir(root)

        imgs = []

        labels = []

        for idx, folder in enumerate(classs):

            cate = os.path.join(root, folder)

            for img_num, im in enumerate(os.listdir(cate)):

                img_path = os.path.join(cate, im)

                #打包图片路径（转换为list）

                imgs.append(img_path)

                #打包标签路径（转换为list）

                labels.append(idx)

        if self.test:

            imgs = sorted(imgs, key=lambda x: int(x.split('.')[-2].split('/')[-1]))

        else:

            imgs = list(zip(imgs , labels))

            #将图片路径与标签打包成一个list

        imgs_num = len(imgs)

        # shuffle imgs

        np.random.seed(100)

        imgs = np.random.permutation(imgs)

        # 划分训练、验证集，验证:训练 = 3:7

        if self.test:

            self.imgs = imgs

        elif train:

            self.imgs = imgs[:int(0.7 * imgs_num)]

        else:

            self.imgs = imgs[int(0.7 * imgs_num):]

        if transforms is None:

            # 数据转换操作，测试验证和训练的数据转换有所区别

            normalize = T.Normalize(mean=[0.485, 0.456, 0.406],

                                    std=[0.229, 0.224, 0.225])

            # 测试集和验证集不用数据增强

            if self.test or not train:

                self.transforms = T.Compose([

                    T.Resize(32),

                    T.CenterCrop(32),

                    T.ToTensor(),

                    normalize

                ])

                # 训练集需要数据增强

            else:

                self.transforms = T.Compose([

                    T.Resize(32),

                    T.RandomResizedCrop(32),

                    T.RandomHorizontalFlip(),

                    T.ToTensor(),

                    normalize

                ])

    def __getitem__(self,index):

        '''

        返回一张图片的数据

        对于测试集，没有label，返回图片id，如1000.jpg返回1000

        送入一个batch_size的数据

        '''

        img_lables = self.imgs[index]

        img_path = img_lables[0]

        if self.test:

            label = int(self.imgs[index].split('.')[-2].split('/')[-1])

        else:

            label = int(img_lables[1])

        data = Image.open(img_path)

        data = self.transforms(data)

        return data, label

    def __len__(self):

        '''

        返回数据集中所有图片的个数

        '''

        return len(self.imgs)

作为备份使用。

pytorch实现花朵数据集读取的更多相关文章

Pytorch数据集读取
Pytorch中数据集读取在机器学习中,有很多形式的数据,我们就以最常用的几种来看: 在Pytorch中,他自带了很多数据集,比如MNIST.CIFAR10等,这些自带的数据集获得和读取十分简便: ...
基于深度学习和迁移学习的识花实践——利用 VGG16 的深度网络结构中的五轮卷积网络层和池化层，对每张图片得到一个 4096 维的特征向量，然后我们直接用这个特征向量替代原来的图片，再加若干层全连接的神经网络，对花朵数据集进行训练（属于模型迁移）
基于深度学习和迁移学习的识花实践(转) 深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件.不过 Tens ...
[Pytorch]PyTorch Dataloader自定义数据读取
整理一下看到的自定义数据读取的方法,较好的有一下三篇文章, 其实自定义的方法就是把现有数据集的train和test分别用含有图像路径与label的list返回就好了,所以需要根据数据集随机应变. 所 ...
pytorch 加载数据集
pytorch初学者,想加载自己的数据,了解了一下数据类型.维度等信息,方便以后加载其他数据. 1 torchvision.transforms实现数据预处理 transforms.Totensor( ...
【小白学PyTorch】16 TF2读取图片的方法
[新闻]:机器学习炼丹术的粉丝的人工智能交流群已经建立,目前有目标检测.医学图像.NLP等多个学术交流分群和水群唠嗑的总群,欢迎大家加炼丹兄为好友,加入炼丹协会.微信:cyx645016617. 参考 ...
CIFAR-10数据集读取
参考:https://jingyan.baidu.com/article/656db9183296c7e381249cf4.html 1.使用读取方式pickle def unpickle(file) ...
什么是pytorch（4.数据集加载和处理）(翻译)
数据集加载和处理这里主要涉及两个包:torchvision.datasets 和torch.utils.data.Dataset 和DataLoader torchvision.datasets是一 ...
深度学习（tensorflow） —— 自己数据集读取opencv
先来看一下我们的目录: dataset1 和creat_dataset.py 属于同一目录 mergeImg1 和mergeImg2 为Dataset1的两子目录(两类为例子)目录中存储图像等文件核 ...
pytorch 计算图像数据集的均值和标准差
在使用 torchvision.transforms进行数据处理时我们经常进行的操作是: transforms.Normalize((0.485,0.456,0.406), (0.229,0.224, ...

随机推荐

MySQL5.5登录密码忘记了，怎嘛办？
1.关闭正在运行的MySQL. 2.打开DOS窗口,转到mysql\bin目录. 3.输入mysqld --skip-grant- tables回车.如果没有出现提示信息,那就对了. 4.再开一 ...
StringUtils中isEmpty 和isBlank的区别
StringUtils在commons-lang-2.2.jar包中:org.apache.commons.lang.StringUtils ; StringUtils方法的操作对象是java.lan ...
vue2.0 之表单控件绑定
表单控件绑定v-model 1.文本 <template> <div> <input type="text" name="" v- ...
Java跨平台（系统）的主要原理
Java是可以在系统运行的,主要是Java在执行的时候先通过Java虚拟机JVM,对应不同的操作系统,JVM会采用对应的翻译机制.
ajax上传文件及进度显示
之前在博文:原生ajax写法就提及过ajax2.0与1.0的差别是多了FormData和利用FormData文件上传(当然还有跨域,但不是本文的重点). 那么具体怎么样实现ajax上传文件呢? 一般来 ...
用Shell编写的俄罗斯方块代码
用Shell编写的俄罗斯方块代码不得不承认任何一门语言玩6了,啥都能搞出来啊,竟然用Shell编写出来了一个俄罗斯方块游戏的代码,很有意思,这个代码不是我写出来的,不过大家可以下载一下在window ...
UDP网路会议室的代码
UDP网络会议室视频已经录制好,这里贴上代码仅供参考 MainWindow代码: using System; using System.Collections.Generic; using Syste ...
Java编程思想学习笔记3
三.操作符 1.优先级当一个表达式中存在多个操作符时,操作符的优先级就决定了各部分的计算顺序.程序员常常忘记其他优先级规则,所以应该用括号明确规定计算顺序. 当编译器观察到一个String后面紧跟着 ...
ubuntu配置lua环境，并进行c与lua的相互调用
1.安装lua环境先查看一下apt可获取的lua版本我们选择lua5.1版本进行安装 sudo apt install lua5.1 安装完之后测试一下是否安装成功,如果可以正常使用,则lua环境 ...
contourf和contour用法区别
import numpy as np import matplotlib.pyplot as plt %matplotlib inline from matplotlib.colors import ...

pytorch实现花朵数据集读取

pytorch实现花朵数据集读取的更多相关文章

随机推荐

热门专题