pic_scrapy_python

 # _*_ coding:UTF-8 _*_

 import requests,json,time,sys

 from contextlib import closing

 class get_photos(object):

     def __init__(self):

         self.photos_id = []

         self.download_server = 'https://unsplash.com/photos/xxx/download?force=true'

         self.target = 'https://unsplash.com/napi/feeds/home'

         self.headers = {'authorization': 'Client-ID c94869b36aa272dd62dfaeefed769d4115fb3189a9d1ec88ed457207747be626'}

     #获取图片ID

     def get_ids(self):

         req = requests.get(url = self.target,headers = self.headers,verify = False)

         html = json.loads(req.text)

         next_page = html['next_page']

         print(next_page)

         for each in html['photos']:

             self.photos_id.append(each['id'])

         time.sleep(1)

         for i in range(4):

             req = requests.get(url = next_page,headers = self.headers,verify = False)

             html = json.loads(req.text)

             next_page = html['next_page']

             for each in html['photos']:

                 self.photos_id.append(each['id'])

             time.sleep(1)

     #图片下载

     def download(self,photo_id,filename):

         headers = {'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

         target = self.download_server.replace('xxx',photo_id)

         with closing(requests.get(url = target,stream = True,verify = False,headers = self.headers)) as r:

             with open('%d.jpg'%filename,'ab+') as f:

                 for chunk in r.iter_content(chunk_size = 1024):

                     if chunk:

                         f.write(chunk)

                         f.flush()

 if __name__ == '__main__':

     gp = get_photos()

     print('获取图片链接中：')

     gp.get_ids()

     print('图片下载中：')

     for i in range(len(gp.photos_id)):

         print('正在下载第%d张图片'%(i+1))

         gp.download(gp.photos_id[i],(i+1))

pic_scrapy_python的更多相关文章

随机推荐

002-linux命令-文件和目录、查看文件内容-文件和目录、查看文件内容
一.文件和目录 cd /home :进入‘/home’目录 cd .. 返回上一级目录 cd ../..返回上两级目录 cd 进入个人的主目录 cd ~user1进入个人的主目录 cd - 返回上次所 ...
Redis入门到高可用（十）—— Spring与Redis的整合
1.pom文件  <dependency> <groupId>org.springframework.data</groupId> ...
docker知识点
1 安装 http://www.runoob.com/docker/centos-docker-install.html 2 dockerhub官网找到 emqttd 执行 docker pull ...
MySQL--10MySQL图形化管理工具
iOS 开发笔记-加载/初始化
ViewDidLoad 一般我们会在这里做界面上的初始化操作,比如往view中添加一些子视图.从数据库或者网络加载模型数据装配到子视图中在自定义控制里 initWithFrame:一般用于添加控件, ...
实现多线程异步自动上传本地文件到 Amazon S3
最近抽空做个小工具,使用AWSSDK 对本地文件目录监控,并自动同步上传文件到S3 的过程,使用的是多线程异步上传,针对大文件进行了分块参考文献: https://www.codeproject.c ...
arcgis api for flex 开发入门
参考:http://blog.sina.com.cn/s/articlelist_2346836525_1_1.html 参考教程:https://www.jb51.net/books/81280.h ...
python+selenium入门
from selenium import webdriver打开浏览器 driver = webdriver.Chrome() 打开网页 driver.get("http://www.bai ...
ES6之箭头表达式
ES2015新增的特性箭头表达式,省去了关键词function,文中``双撇号和${}是Typescript的语法.以下是一些学习笔记: 1.单行箭头表达式: var foo = (arg1,arg2 ...
C# JArray与JObject 的使用
STEP1.using Newtonsoft.Json.Linq; STEP2 如何获取json里的某个属性(节点)值,对其删改,新增 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 ...

pic_scrapy_python

pic_scrapy_python的更多相关文章

随机推荐

热门专题