ruby 批量下载王者荣耀皮肤

主要采用ruby Parallel库提供的多线程方式：

require 'unirest'

require 'open-uri'

require 'parallel'

require 'json'

url = 'http://pvp.qq.com/web201605/js/herolist.json'

response = Unirest.get(url)

/(\[.*\])/ =~ response.body.force_encoding('utf-8')

hero_list = JSON $1

#返回ename, cname, skin_name组成的hash数组

hero_list.each do |hero|

  hero.select!{|key, _| key=='ename' || key == 'cname' || key == 'skin_name'}

  # hero.select!{|key, _| key =~ /[('ename')|('cname')|('skin_name')]/}

end

def download_hero_img(url, path, img_name)

  img_file = open(url,:ssl_verify_mode => OpenSSL::SSL::VERIFY_NONE){ |f| f.read }

  puts "download #{path}/#{img_name}.jpg"

  open("#{path}/#{img_name}.jpg", 'wb'){ |f| f.write(img_file)}

end

a = Proc.new{hero_list.pop || Parallel::Stop}

# 分成10个线程爬取

Parallel.map(a, in_threads:10) do |hero|

  path = "./#{hero['cname']}"

  Dir.mkdir(path) unless Dir.exists?(path)

  # url = "http://game.gtimg.cn/images/yxzj/img201606/heroimg/#{hero['ename']}/#{hero['ename']}"

  skin_list = hero['skin_name'].split('|')

  # puts skin_list

  skin_list.each_with_index do |skin, index|

    url = "https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/#{hero['ename']}/#{hero['ename']}-bigskin-#{index.to_i+1}.jpg"

    img_name = skin

    download_hero_img(url, path, img_name)

  end

end

线程参考资料：

Ruby 中的多进程与多线程

Parallel github

Parallel ruby的并行多线程处理插件

多线程队列(Queue)下载博客文章到本地

ruby 批量下载王者荣耀皮肤的更多相关文章

python学习--第二天爬取王者荣耀英雄皮肤
今天目的是爬取所有英雄皮肤在爬取所有之前,先完成一张皮肤的爬取打开anacond调出编译器Jupyter Notebook 打开王者荣耀官网下拉找到位于网页右边的英雄/皮肤点击[+更多] 进入 ...
python 爬取王者荣耀英雄皮肤代码
import os, time, requests, json, re, sys from retrying import retry from urllib import parse "& ...
Python 爬取 "王者荣耀.英雄壁纸" 过程中的矛和盾
1. 前言学习爬虫,最好的方式就是自己编写爬虫程序. 爬取目标网站上的数据,理论上讲是简单的,无非就是分析页面中的资源链接.然后下载.最后保存. 但是在实施过程却会遇到一些阻碍. 很多网站为了阻止爬 ...
利用python爬取王者荣耀英雄皮肤图片
前两天看到同学用python爬下来LOL的皮肤图片,感觉挺有趣的,我也想试试,于是决定来爬一爬王者荣耀的英雄和皮肤图片. 首先,我们找到王者的官网http://pvp.qq.com/web201605 ...
20行Python代码爬取王者荣耀全英雄皮肤
引言王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 ...
python爬虫王者荣耀高清皮肤大图背景故事通用爬虫
wzry-spider python通用爬虫-通用爬虫爬取静态网页,面向小白基本上纯python语法切片索引,少用到第三方爬虫网络库这是一只小巧方便,强大的爬虫,由python编写主要实现了: ...
用Python爬取《王者荣耀》英雄皮肤数据并可视化分析，用图说话
大家好,我是辰哥~ 今天辰哥带大家分析一波当前热门手游<王者荣耀>英雄皮肤,比如皮肤上线时间.皮肤类型(勇者:史诗:传说等).价格. 1.获取数据数据来源于<王者荣耀官方网站> ...
Python爬无止境，获得王者荣耀全部高清皮肤
作为一名热爱王者两年的程序员,早就想爬取所有英雄皮肤的高清照片,在设个幻灯片放映,真香,这次只用16行代码就能实现,对于新手拿这个作为实战练手项目既简单又容易上手,快来尝试下. 百度"王者荣 ...
Python爬取 | 王者荣耀英雄皮肤海报
这里只展示代码,具体介绍请点击下方链接. Python爬取 | 王者荣耀英雄皮肤海报 import requests import re import os import time import wi ...

随机推荐

Centos如何通过yum安装php7
执行如下命令安装epel yum -y install epel-release 更换rpm源,请根据自己的centos版本选择相应的rpm源进行安装 Centos 5.X: rpm -Uvh ...
新浪OAuth网络登录，请求access_token时遇到21323的错误
按照新浪给出的文档写了,但是遇到错误,总是获取不到token值,也是post方式提交的. 查阅百度资料,发现有网友给出了解决办法,是因为文档中有这么一句提示: HTTP请求方式:POST 这句话太简 ...
SVD singular value decomposition
SVD singular value decomposition https://en.wikipedia.org/wiki/Singular_value_decomposition 奇异值分解在统计 ...
远程计算机或设备将不接受连接，IE无法上网
遇到一个奇葩问题,IE浏览器突然不能上网了,但是其他浏览器可以,QQ什么的也都正常,只有IE是出现:远程计算机或设备将不接受连接这个问题,网上找了很多答案都没用,什么设置WINS,允许远程访问,取消 ...
Hbase集群部署及shell操作
本文详述了Hbase集群的部署. 集群部署 1.将安装包上传到集群并解压 scp hbase-0.99.2-bin.tar.gz mini1:/root/apps/ tar -zxvf hbase-0 ...
在Node中使用ES7新特征——async、await
async与await两个关键字是在ES7中添加的新特征,旨在更加直观的书写异步函数,避免出现callback hell. callback hell是什么? readFileContents(&qu ...
51nod 1515 明辨是非 [并查集+set]
今天cb巨巨突然拿题来问,感觉惊讶又开心,希望他早日康复!!坚持学acm!加油! 题目链接:51nod 1515 明辨是非 [并查集] 1515 明辨是非题目来源: 原创基准时间限制:1 秒空间 ...
TCP建立连接和释放连接过程
TCP(Transmission Control Protocol 传输控制协议)是一种面向连接的.可靠的.基于字节流的传输层通信协议.TCP建立连接需要三次握手,释放连接需要四次握手. 1.TCP整 ...
yii2.0 在save保存之前的操作（放在模型model文件内）
public function beforeSave($insert){ if(parent::beforeSave($insert)) { if($insert) { } else { } retu ...
STC12LE5620AD RAM问题
1.此款单片机内部有 sram:768B=512B(aux)+256B(Internal) 2.内部RAM解析 2. 3.内部扩展RAM 4.keil中可以选择内存类型 5. 网上摘抄的一段话: 在S ...

ruby 批量下载王者荣耀皮肤

ruby 批量下载王者荣耀皮肤的更多相关文章

随机推荐

热门专题