从Wolframserver获取DC comics卡通人物数据
背景知识
DC comics是美国时代华纳旗下DC娱乐下属的一个漫绘图书出版商。
超人、蝙蝠侠之类漫画的始作俑者。
在Wolfram的眼下为止3750个PopularCurves数据中(所有下载数据有2-3GB之巨!)。当中有248个图片专属于DC comics里的漫画角色。
由于248个数据图片信息小于250MB。easy处理。这篇博客介绍怎样下载这248个角色的包含图片在内的信息,尤其是显示当中的图片。
代码实现
预备条件
想要下载这些数据,首先要确保自己有一台能够正常连接到internet的电脑,电脑上安装有wolfram的经典产品Mathematica最新版10.1. 由于数据有数百兆之多,所以,请确保足够的网络带宽。考虑到图片数据处理的问题,您的电脑的内存不能太小。
废话少说,直接上代码吧。
下载原始图片数据
这里的代码下载DC Comics数据中自带的图片信息并显示。最后再把它们合并在一个GIF动画文件里。
ClearAll["Global`*"];
dcComics=Quiet@Check[EntityValue[EntityClass["PopularCurve","DCComics"],"Entities"],50];
While[NumberQ@doComics,dcComics=Quiet@Check[EntityValue[EntityClass["PopularCurve","DCComics"],"Entities"],50]];
nCharacters=(Dimensions@dcComics)[[1]]
If[!ValueQ@dcImgList,dcImgList=ConstantArray[0,{nCharacters}]];
Do[dcImg=Quiet@Check[EntityValue[dcComics[[i]],"Image"],50];
While[NumberQ@dcImg,dcImg=Quiet@Check[EntityValue[dcComics[[i]],"Image"],50]];
dcImgLabel=Quiet@Check[EntityValue[dcComics[[i]],"Name"],50];
While[NumberQ@dcImgLabel,dcImgLabel=Quiet@Check[EntityValue[dcComics[[i]],"Name"],50]];
dcImgList[[i]]=Labeled@@{dcImg,ToString@i<>"."<>dcImgLabel};
Print@dcImgList[[i]],{i,1,nCharacters}];(*每下载一幅图片都显示它*)
(*把所有图片导出到一个GIF动画中,*)
Export["dcComics.gif",dcImgList,"TransitionEffect"->Background,"TransparentColor"->White]
到此为止,得到的这个GIF往往须要用gifsicle或convert之类处理才干正常使用。我用gifsicle处理的时候用的是这种命令:
gifsicle dcComics.gif -d120 "#0-247" > final.gif
结果是这种:
下载图片的參数方程信息及其个性化绘制
默认的DC Comics的图片数据中都有一个“十”字形的坐标轴,非常难看。
鉴于每幅图片都有自己的參数方程和參数区间的信息,能够获取这些信息之后,自己画一个纯净版的出来。比方,第142号图片女记者、超人嫂Lois Lane,代码例如以下:
mCurve=142;(*获取第142幅图片信息并用參数曲线方式单独显示它*)
mhp=Quiet@Check[(EntityValue[dcComics[[#]],"Properties"])&@mCurve,50];
While[NumberQ@mhp,mhp=Quiet@Check[(EntityValue[dcComics[[#]],"Properties"])&@mCurve,50]];
mhe=Quiet@Check[EntityValue[dcComics[[mCurve]],mhp[[10]]][t],50];
While[NumberQ@mhe,mhe=Quiet@Check[EntityValue[dcComics[[mCurve]],mhp[[10]]][t],50]];
hdom=Quiet@Check[EntityValue[dcComics[[mCurve]],mhp[[6]]],50];
While[NumberQ@hdom,hdom=Quiet@Check[EntityValue[dcComics[[mCurve]],hp[[6]]],50]];
mlabel=Quiet@Check[EntityValue[dcComics[[mCurve]],"Name"],50];
While[NumberQ@mlabel,mlabel=Quiet@Check[EntityValue[dcComics[[mCurve]],"Name"],50]];
Print[Style[mlabel,Red]];
ParametricPlot[mhe,{t,hdom[[1]],hdom[[2]]},PlotPoints->1500,PlotStyle->{Blue,Thickness[.002]},Axes->False]
图片例如以下:
总结
主要解决的问题
主要学习了处理下载中的time out exception的办法。
可能的问题
假设不能连接到互联网或wolfram server故障,上面的下载用代码将无法正常工作。假设数据有更新。则实际的数据个数可能不是如今的248个。142号图片也可能不是Lois Lane。
从Wolframserver获取DC comics卡通人物数据的更多相关文章
- request获取请求头和请求数据
package cn.itcast.request; import java.io.IOException; import java.io.InputStream; import java.io.Pr ...
- 获取股票历史数据和当前数据的API
关键字:股票,stock,API,接口 1.获取股票当前数据 新浪数据接口:http://hq.sinajs.cn/list={code}.{code}替换为股票代码,沪市股票代码加前缀sh,深市股票 ...
- Silverlight获取DataGrid选中的行数据
注意触发的事件为:CurrentCellChanged后台代码: /// <summary> /// 获取datagrid当前选中的单元格数据 /// 如果绑定的数据源为实体的话默认选中的 ...
- Android中获取网页表单中的数据实现思路及代码
在Android中获取网页里表单中的数据具体实现代码如下,感兴趣的各位可以参考过下哈,希望对大家有所帮助 MainActivity如下: 复制代码 代码如下: package cn.testjavas ...
- 怎样获取浏览器上次的会话数据(session)
怎样获取浏览器上次的会话数据: 要知道上次会话session_id是多少? 让cookie保存的PHPSESSID的值不要浏览器一退出就被删除了? 所以我们要设置自己的session_id,不要系统自 ...
- Android中获取网页表单中的数据
MainActivity如下: package cn.testjavascript; import java.util.StringTokenizer; import android.os.Bundl ...
- 项目中通过Sorlj获取索引库中的数据
在开发项目中通过使用Solr所提供的Solrj(java客户端)获取索引库中的数据,这才是真正对项目起实质性作用的功能,提升平台的检索性能及检索结果的精确性 第一步,引入相关依赖的jar包 第二步,根 ...
- Python获取股票历史、实时数据与更新到数据库
要做量化投资,数据是基础,正所谓"巧妇难为无米之炊" 在免费数据方面,各大网站的财经板块其实已提供相应的api,如新浪.雅虎.搜狐...可以通过urlopen相应格式的网址获取数据 ...
- 获取DataTable前几条数据
#region 获取DataTable前几条数据 /// <summary> /// 获取DataTable前几条数据 /// </summary> /// <param ...
随机推荐
- javascript的setTimeout()用法总结,js的setTimeout()方法
引子 js的setTimeout方法用处比较多,通常用在页面刷新了.延迟执行了等等.但是很多javascript新手对setTimeout的用法还是不是很了解.虽然我学习和应用javascript已经 ...
- [Papers]NSE, $u_3$, Lebesgue space [Cao-Titi, IUMJ, 2008]
$$\bex u_3\in L^p(0,T;L^q(\bbR^3)),\quad \frac{2}{p}+\frac{3}{q}=\frac{2}{3}+\frac{2}{3q},\quad \fra ...
- Launcher2编译
Android的源码包,压缩文件大概有3个G左右,要使用其中自带的一些源码需要很多技巧,否则会提示找不到一些库,大量的报错让人心神不定,不知所从. 我拿桌面代码举个例子吧. 桌面代码在源码包的pack ...
- [OFBiz]开发 二
1.svn中check出的apache-ofbiz-10.04(svn_2010-04-01代码备分)由于它的所有文件都不含有中文,所以Eclipse使用什么编码方式都可以(ISO, GBK, UTF ...
- unicode ansi utf-8 unicode_big_endian编码的区别
随便说说字符集和编码 快下班时,爱问问题的小朋友Nico又问了一个问题: "sqlserver里面有char和nchar,那个n据说是指unicode的数据,这个是什么意思.&quo ...
- 关于CCSprite改变box2d刚体位置以及角度。
同事今天在讨论一个事情,box2d中,body不可以直接设置位置,这样是不合理的,因为在物理的世界,你去左右它的物理检测.它就没有存在的必要了.但是,有人就想直接用box2d的碰撞.不用物理模拟.怎么 ...
- H264编码参数的一些小细节
一次写播放器,基于ijkplayer.在播放一些网络视频的时候,发现无论怎么转码,视频比例始终不对.即便获取了分辨率,但是播放的时候,view不是分辨率比例的那个长宽比.使用ffmpeg查看了一下属性 ...
- 【转】Nginx系列(二)--模块化
原博文出于: http://blog.csdn.net/liutengteng130/article/details/46700977 感谢! 高度模块化的设计设Nginx架构的基础.在Nginx中 ...
- Hibernate之Session缓存以及操作Session缓存的相关方法
1.Session概述 A.Session 接口是 Hibernate 向应用程序提供的操纵数据库的最主要的接口, 它提供了基本的保存, 更新, 删除和加载 Java 对象的方法. B. Sessio ...
- Shell字符串使用十进制转换
其实不知道该起什么题目. 先说下需求,线上的log是按照五分钟为粒度切分的,即每五分钟产生一个文件,19:04的log写入到 1900结尾的log文件中,19:05写入到1905结尾的log文件中. ...