SVHN数据集 Format1 剪裁版
SVHN数据集官网:http://ufldl.stanford.edu/housenumbers/
SVHN数据集官方提供的有两种格式
Format1是那种在街上拍的照片,每张照片的尺寸都不同,然后label提供了照片上门牌上的所有数字,和每一个单独的数字的bounding box;
Format2是把街拍图片上的数字一个一个截出来,然后resize成32*32的图片,label是一个单独的数字。
官方的Format2特别好读,numpy矩阵啥的官方都给了,网上教程也一大堆。但是Format1不太好读,我整了一下午,整了一个从bounding box剪出来的,多数字的版本,这里给大家提供一个开箱即用的预处理过的好读的格式发出来。
input和label如下
input:
label:[2, [2, 3]]
使用方法
import pickle
# 读取数据
f = open('train-set.blob', 'rb')
x_train_set, y_train_set = pickle.load(f)
f.close()
f = open('test-set.blob', 'rb')
x_test_set, y_test_set = pickle.load(f)
f.close()
# 展示图片和对应标签
from PIL import Image
index = 666
im = Image.fromarray(x_train_set[i].reshape(64,64,3))
im.show()
print(y_train_set[i])
数据格式
x_XXX_set::一个列表,列表中每个元素是一个numpy数组,表示一张图片,数组的尺寸是3*64*64,表示(通道,高度,宽度)。这个numpy数组的dtype为uint8,范围在0-255之间。通道有三个,意思是RGB的,具体哪个是R哪个是G哪个是B我就没管了
y_XXX_set:一个列表,列表中每个元素是一个列表,对应一张图片的label。这个小列表的格式为[数字的数量, [第一个数字,第二个数字,...]],列表中数字的数据类型都是python中的内置的int数据类型。
在原数据集中,图片上的0用“10”来标注。在我们这个版本里做出了修改,0就是用0标注。也就是0-9的正常标注。
下载地址:
有csdn积分的哥们施舍一下:https://download.csdn.net/download/qq_39480548/15617097
实在没积分的哥们咱也不能一棒子打死:https://pan.baidu.com/s/1jgc3-iQjMeDO30mhe8WGmQ 提取码: h9p3
SVHN数据集 Format1 剪裁版的更多相关文章
- 《2018:skymind.ai 发布了一份非常全面的开源数据集》
这是一份非常全面的开源数据集,你,真的不想要吗? 近期,skymind.ai 发布了一份非常全面的开源数据集.内容包括生物识别.自然图像以及深度学习图像等数据集,现机器之心将其整理如下:(内附链接 ...
- 论文翻译:XNOR-Net: ImageNet Classification Using BinaryConvolutional Neural Networks
目录 Abstract 1 Introduction 2 Related Work 3 Binary Convolutional Neural Network 3.1 Binary-Weight-Ne ...
- AGS中通过FeatureServer插入数据失败、插入数据在WMTS请求中无法显示以及version概念的讨论
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.背景 在多个项目中,当我方接口给其他部门人员使用时出现了插入数据失 ...
- 《利用Python进行数据分析: Python for Data Analysis 》学习随笔
NoteBook of <Data Analysis with Python> 3.IPython基础 Tab自动补齐 变量名 变量方法 路径 解释 ?解释, ??显示函数源码 ?搜索命名 ...
- ArcGIS Geodatabase版本控制机制的学习总结
本文是最近内部的一个学习的自我整理,只有关键信息,如果需要详细了解,请参阅ArcGIS帮助文档: http://resources.arcgis.com/zh-cn/help/main/10.1/in ...
- [转]Binarized Neural Networks_ Training Neural Networks with Weights and Activations Constrained to +1 or −1
原文: 二值神经网络(Binary Neural Network,BNN) 在我刚刚过去的研究生毕设中,我在ImageNet数据集上验证了图像特征二值化后仍然具有很强的表达能力,可以在检索中达到较好的 ...
- Python 数据分析5
数据规整化 清理 转换 合并 重塑 数据库风格的DataFrame合并 pd.merge(df1, df2) # 默认会将重叠列的列名当作键,最好显式的指定下,另外merge默认是使用的inner j ...
- 论文翻译:BinaryConnect: Training Deep Neural Networks with binary weights during propagations
目录 摘要 1.引言 2.BinaryConnect 2.1 +1 or -1 2.2确定性与随机性二值化 2.3 Propagations vs updates 2.4 Clipping 2.5 A ...
- Pandas数据的去重,替换和离散化,异常值的检测
数据转换 移除重复数据 import pandas as pd import numpy as np from pandas import Series data = pd.DataFrame( {' ...
随机推荐
- 牛客编程巅峰赛S2第7场 - 钻石&王者 A.牛牛的独特子序列 (字符串,二分)
题意:给你一个字符串,找出一个类似为\(aaabbbccc\)这样的由连续的\(abc\)构成的子序列,其中\(|a|=|b|=|c|\),问字符串中能构造出的子序列的最大长度. 题解:这题刚开始一直 ...
- 第 45 届国际大学生程序设计竞赛(ICPC)亚洲网上区域赛模拟赛. A.Easy Equation (前缀和/差分)
题意:RT,给你四个数\(a,b,c,d\),求\(x+y+z=k\)的方案数. 题解:我们可以先枚举\(x\)的值,然后\(x+y\)能取到的范围一定是\([x,x+b]\),也就是说这个区间内每个 ...
- 连接MongoDb数据库 -- Python
1.安装完mongoDb数据库后,如果需要我们的Python程序和MongoDb数据库进行交互,需要安装pymongo模块: 安装方式:采用pip install pymongo的方式 Microso ...
- 【ybt金牌导航1-2-3】折线统计
折线统计 题目链接:ybt金牌导航1-2-3 题目大意 在一个图上有一些点,保证任意两个点的横纵坐标都不相同. 要你选一些集合,按 x 坐标排序依次连接,会构成一些连续上升下降的折线,问你折线数量是 ...
- MySQL 多实例及其主从复制
目录 Mysql 实例 Mysql 多实例 创建多实例目录 编辑配置文件 初始化多实例数据目录 授权目录 启动多实例 连接多实例并验证 Mysql 多实例设置密码 设置密码后连接 Mysql 多实例主 ...
- Kubernets二进制安装(4)之Docker安装
注意:需要安装Docker的机器为mfyxw30.mfyxw40.mfyxw50 集群规划 主机名 角色 IP地址 mfyxw30.mfyxw.com Docker 192.168.80.30 mfy ...
- leetcode_二叉树篇_python
主要是深度遍历和层序遍历的递归和迭代写法. 另外注意:因为求深度可以从上到下去查 所以需要前序遍历(中左右),而高度只能从下到上去查,所以只能后序遍历(左右中). 所有题目首先考虑root否是空.有的 ...
- Bootstrap巨幕
这是一个轻量.灵活的组件,它能延伸至整个浏览器视口来展示网站上的关键内容. jumbotron修饰 <div class="jumbotron"> <h1> ...
- 全球最好 css3 website
http://www.awwwards.com/ http://www.revolution.pn/ http://www.bestcss.in/ http://www.csswinner.com/ ...
- I ❤️ W3C : Secure Contexts
I ️ W3C : Secure Contexts Secure Contexts W3C Candidate Recommendation, 15 September 2016 https://ww ...