CIFAR-10数据集读取

参考：https://jingyan.baidu.com/article/656db9183296c7e381249cf4.html

1、使用读取方式pickle

def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

返回的是一个python字典

2、通过字典的内置函数，获取键值

>>> dict.keys()
dict_keys([b'labels', b'batch_label', b'data', b'filenames'])

3、打印所有键值对应的值

>>> dict[b'labels']------------------对应的是每个图片的真实结果Y，通过batches.meta可以找出对应的字符结果，比如：0表示‘airplane’
[6, 9, 9, 4, 1, 1, 2, 7, 8, 3, 4, 7, 7, 2, 9, 9, 9, 3, ............. 9, 1, 1, 5]（结果省略了一些）

>>> len(dict[b'labels'])-----------代表图片的结果数量确实为10000
10000

>>> dict[b'batch_label']------------对应当前数据集是训练集中的那一份
b'training batch 1 of 5'

>>> dict[b'filenames']---------------对应数据集中每张图片的文件名
[b'leptodactylus_pentadactylus_s_000004.png', b'camion_s_000148.png', b'tipper_truck_s_001250.png', b'american_elk_s_001521.png',......... b'estate_car_s_001433.png', b'cur_s_000170.png']（结果同样省略了一些）

>>> dict[b'data']----------------每张图片的数据，每一位类型为uint8
array([[ 59, 43, 50, ..., 140, 84, 72],
       [154, 126, 105, ..., 139, 142, 144],
       [255, 253, 253, ..., 83, 83, 84],
       ...,
       [ 71, 60, 74, ..., 68, 69, 68],
       [250, 254, 211, ..., 215, 255, 254],
       [ 62, 61, 60, ..., 130, 130, 131]], dtype=uint8)

>>> dict[b'data'].shape----------由于我们需要用图像数据来进行卷积，所以需要知道shape
(10000, 3072)（代表有10000张图片，每张图片3072b大小（32 x 32 x 3），前1024是Red通道的图片data，接着是Green通道的1024图片，之后是Blue通道的1024图片）

CIFAR-10数据集读取的更多相关文章

【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow
原网址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, ...
Pytorch数据集读取
Pytorch中数据集读取在机器学习中,有很多形式的数据,我们就以最常用的几种来看: 在Pytorch中,他自带了很多数据集,比如MNIST.CIFAR10等,这些自带的数据集获得和读取十分简便: ...
Bunch 转换为 HDF5 文件：高效存储 Cifar 等数据集
关于如何将数据集封装为 Bunch 可参考关于『AI 专属数据库的定制』的改进. PyTables 是 Python 与 HDF5 数据库/文件标准的结合.它专门为优化 I/O 操作的性能.最大限 ...
【神经网络与深度学习】基于Windows+Caffe的Minst和CIFAR—10训练过程说明
Minst训练我的路径:G:\Caffe\Caffe For Windows\examples\mnist 对于新手来说,初步完成环境的配置后,一脸茫然.不知如何跑Demo,有么有!那么接下来的教 ...
深度学习（tensorflow） —— 自己数据集读取opencv
先来看一下我们的目录: dataset1 和creat_dataset.py 属于同一目录 mergeImg1 和mergeImg2 为Dataset1的两子目录(两类为例子)目录中存储图像等文件核 ...
DL Practice：Cifar 10分类
Step 1:数据加载和处理一般使用深度学习框架会经过下面几个流程: 模型定义(包括损失函数的选择)——>数据处理和加载——>训练(可能包括训练过程可视化)——>测试所以自己写代 ...
实验10—— java读取歌词文件内容动画输出
1.Read.java package cn.tedu.demo; import java.io.BufferedReader; import java.io.File; import java.io ...
DPM检测模型训练自己的数据集读取接口修改
(转载请注明作者和出处楼燚(yì)航的blog :http://www.cnblogs.com/louyihang-loves-baiyan/ 未经允许请勿用于商业用途) 本文主要是针对上一篇基于D ...
pytorch实现花朵数据集读取
import os from PIL import Image from torch.utils import data import numpy as np from torchvision imp ...

随机推荐

C# 控件置于最顶层、最底层
btn.BringToFront();//将控件放置所有控件最前端 btn.SendToBack();//将控件放置所有控件最底端
【Entity Framework】Model First Approach
EF中的model first 所谓mf, 就是使用vs提供的edm designer去设计model,然后将设计好的model使用vs在指定的数据库中生成数据库即可. 当你的项目既没有数据库也没有c ...
3rd，Python登录模拟
需求: 1. 用户输入帐号密码进行登陆 2. 用户信息保存在文件内 3. 用户密码输入错误三次后锁定用户 #导入getpass库,用于密码验证 import getpass #定义用户名.密码 _us ...
linux 因内存不足而 kill 掉 java 程序
grep "Out of memory" /var/log/messages Sep 17 16:13:34 xxxaaa kernel: Out of memory: Kill ...
HRBUST 1186 青蛙过河（思路错了）
在河上有一座独木桥,一只青蛙想沿着独木桥从河的一侧跳到另一侧.在桥上有一些石子,青蛙很讨厌踩在这些石子上.由于桥的长度和青蛙一次跳过的距离都是正整数,我们可以把独木桥上青蛙可能到达的点看成数轴上的一串 ...
Java版人脸识别SDK dem
虹软人脸识别SDK之Java版,支持SDK 1.1+,以及2.0版本,滴滴,抓紧上车! 前言由于业务需求,最近跟人脸识别杠上了,本以为虹软提供的SDK是那种面向开发语言的,结果是一堆dll······ ...
echarts tooltip巧用
tooltip : { trigger: 'item', triggerOn: 'click', formatter:function(params,ticket,callback){ var res ...
图论++【洛谷p1744】特价采购商品&&【一本通1342】最短路径问题
(虽然题面不是很一样,但是其实是一个题qwq) [传送门] 算法标签: 利用Floyed的o(n3)算法: (讲白了就是暴算qwq) 从任意一条单边路径开始.所有两点之间的距离是边的权,或者无穷大,如 ...
Android测试（四）——内容供应器泄露
内容供应器:用来存储和查询应用程序中的数据或来自电话的数据,所有内容供应器都具有唯一的统一的资源标识符(URI)以便被识别和查询. 内容供应期命名惯例:以content://开始当Android A ...
spring boot扫描mapper文件
一个简单的功能,百度查的都是XX,谷歌万岁. 因为扫描不到自动生成的mapper就无法注入到service 方案一.@Mapper 如果Mapper文件所在的包和你的配置mapper的项目的pom定义 ...

CIFAR-10数据集读取

CIFAR-10数据集读取的更多相关文章

随机推荐

热门专题