爬虫系列4:Requests+Xpath 爬取动态数据

【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html

【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/10267721.html

【保存】:参考前文 爬虫系列3:https://www.cnblogs.com/yizhiamumu/p/10270926.html

【动态】:参考前文 爬虫系列4:https://www.cnblogs.com/yizhiamumu/p/10272977.html

  1. # 动态爬取数据,如页面不分页,而是点击查看更多
  2. # https://movie.douban.com/tag/#/?sort=T&range=0,10&tags=%E5%8A%B1%E5%BF%97
  3. # 安装jsonview 插件
  4. ## F12 - network- XHR
  5. # 发现规律
  6. # https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E5%8A%B1%E5%BF%97&start=20
  7. # https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E5%8A%B1%E5%BF%97&start=40
  8. # 循环爬取
  9. # for a in range(3):
  10. # url='https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=&start={}'.format(a*20)
  1. import requests
  2. import json
  3. import time
  4.  
  5. for a in range(3):
  6. url_visit = 'https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=&start={}'.format(a*20)
  7. file = requests.get(url_visit).json() #这里跟之前的不一样,因为返回的是 json 文件
  8. time.sleep(6)
  9.  
  10. for i in range(20):
  11. dict=file['data'][i] #取出字典中 'data' 下第 [i] 部电影的信息
  12. urlname=dict['url']
  13. title=dict['title']
  14. rate=dict['rate']
  15. cast=dict['casts']
  16.  
  17. print('{} {} {} {}\n'.format(title,rate,' '.join(cast),urlname))
  1.  
  2. 打印结果:
  1. 我不是药神 9.0 徐峥 王传君 周一围 谭卓 章宇 https://movie.douban.com/subject/26752088/
  2.  
  3. 这个杀手不太冷 9.4 让·雷诺 娜塔莉·波特曼 加里·奥德曼 丹尼·爱罗 彼得·阿佩尔 https://movie.douban.com/subject/1295644/
  4.  
  5. 肖申克的救赎 9.6 蒂姆·罗宾斯 摩根·弗里曼 鲍勃·冈顿 威廉姆·赛德勒 克兰西·布朗 https://movie.douban.com/subject/1292052/
  6.  
  7. 盗梦空间 9.3 莱昂纳多·迪卡普里奥 约瑟夫·高登-莱维特 艾伦·佩吉 汤姆·哈迪 渡边谦 https://movie.douban.com/subject/3541415/
  8.  
  9. 复仇者联盟3:无限战争 8.1 小罗伯特·唐尼 克里斯·海姆斯沃斯 克里斯·埃文斯 马克·鲁弗洛 乔什·布洛林 https://movie.douban.com/subject/24773958/
  10.  
  11. 阿甘正传 9.4 汤姆·汉克斯 罗宾·怀特 加里·西尼斯 麦凯尔泰·威廉逊 莎莉·菲尔德 https://movie.douban.com/subject/1292720/
  12.  
  13. 西虹市首富 6.6 沈腾 宋芸桦 张一鸣 张晨光 常远 https://movie.douban.com/subject/27605698/
  14.  
  15. 泰坦尼克号 9.3 莱昂纳多·迪卡普里奥 凯特·温丝莱特 比利·赞恩 凯西·贝茨 弗兰西丝·费舍 https://movie.douban.com/subject/1292722/
  16.  
  17. 霸王别姬 9.6 张国荣 张丰毅 巩俐 葛优 英达 https://movie.douban.com/subject/1291546/
  18.  
  19. 三傻大闹宝莱坞 9.2 阿米尔·汗 卡琳娜·卡普尔 马达范 沙尔曼·乔希 奥米·瓦依达 https://movie.douban.com/subject/3793023/
  20.  
  21. 千与千寻 9.3 柊瑠美 入野自由 夏木真理 菅原文太 中村彰男 https://movie.douban.com/subject/1291561/
  22.  
  23. 让子弹飞 8.7 姜文 葛优 周润发 刘嘉玲 陈坤 https://movie.douban.com/subject/3742360/
  24.  
  25. 怦然心动 9.0 玛德琳·卡罗尔 卡兰·麦克奥利菲 瑞贝卡·德·莫妮 安东尼·爱德华兹 约翰·马奥尼 https://movie.douban.com/subject/3319755/
  26.  
  27. 海上钢琴师 9.2 蒂姆·罗斯 普路特·泰勒·文斯 比尔·努恩 梅兰尼·蒂埃里 阿尔贝托·巴斯克斯 https://movie.douban.com/subject/1292001/
  28.  
  29. 忠犬八公的故事 9.3 理查·基尔 萨拉·罗默尔 琼·艾伦 罗比·萨布莱特 艾瑞克·阿瓦利 https://movie.douban.com/subject/3011091/
  30.  
  31. 当幸福来敲门 9.0 威尔·史密斯 贾登·史密斯 坦迪·牛顿 布莱恩·豪威 詹姆斯·凯伦 https://movie.douban.com/subject/1849031/
  32.  
  33. 毒液:致命守护者 7.2 汤姆·哈迪 米歇尔·威廉姆斯 里兹·阿迈德 斯科特·黑兹 瑞德·斯科特 https://movie.douban.com/subject/3168101/
  34.  
  35. 少年派的奇幻漂流 9.0 苏拉·沙玛 伊尔凡·可汗 拉菲·斯波 阿迪勒·侯赛因 塔布 https://movie.douban.com/subject/1929463/
  36.  
  37. 一出好戏 7.1 黄渤 舒淇 王宝强 张艺兴 于和伟 https://movie.douban.com/subject/26985127/
  38.  
  39. 摔跤吧!爸爸 9.1 阿米尔·汗 法缇玛·萨那·纱卡 桑亚·玛荷塔 阿帕尔夏克提·库拉那 沙克希·坦沃 https://movie.douban.com/subject/26387939/
  40.  
  41. 阿凡达 8.6 萨姆·沃辛顿 佐伊·索尔达娜 西格妮·韦弗 史蒂芬·朗 米歇尔·罗德里格兹 https://movie.douban.com/subject/1652587/
  42.  
  43. 那些年,我们一起追的女孩 8.1 柯震东 陈妍希 敖犬 郝劭文 蔡昌宪 https://movie.douban.com/subject/4920528/
  44.  
  45. 大话西游之大圣娶亲 9.2 周星驰 吴孟达 朱茵 蔡少芬 蓝洁瑛 https://movie.douban.com/subject/1292213/
  46.  
  47. 疯狂动物城 9.2 金妮弗·古德温 杰森·贝特曼 伊德里斯·艾尔巴 珍妮·斯蕾特 内特·托伦斯 https://movie.douban.com/subject/25662329/
  48.  
  49. 星际穿越 9.2 马修·麦康纳 安妮·海瑟薇 杰西卡·查斯坦 卡西·阿弗莱克 迈克尔·凯恩 https://movie.douban.com/subject/1889243/
  50.  
  51. 楚门的世界 9.2 金·凯瑞 劳拉·琳妮 艾德·哈里斯 诺亚·艾默里奇 娜塔莎·麦克艾霍恩 https://movie.douban.com/subject/1292064/
  52.  
  53. 放牛班的春天 9.2 热拉尔·朱尼奥 让-巴蒂斯特·莫尼耶 弗朗索瓦·贝莱昂 凯德·麦拉德 玛丽·布奈尔 https://movie.douban.com/subject/1291549/
  54.  
  55. 机器人总动员 9.3 本·贝尔特 艾丽莎·奈特 杰夫·格尔林 佛莱德·威拉特 西格妮·韦弗 https://movie.douban.com/subject/2131459/
  56.  
  57. 飞屋环游记 8.9 爱德华·阿斯纳 克里斯托弗·普卢默 乔丹·长井 鲍勃·彼德森 戴尔里·林多 https://movie.douban.com/subject/2129039/
  58.  
  59. 初恋这件小事 8.3 平采娜·乐维瑟派布恩 马里奥·毛瑞尔 苏达拉·布查蓬 雅尼卡·桑普蕾舞 诺特·阿查拉那·阿瑞亚卫考 https://movie.douban.com/subject/4739952/
  60.  
  61. 天使爱美丽 8.7 奥黛丽·塔图 马修·卡索维茨 吕菲斯 洛莱拉·克拉沃塔 塞尔日·梅兰 https://movie.douban.com/subject/1292215/
  62.  
  63. 你的名字。 8.4 神木隆之介 上白石萌音 长泽雅美 市原悦子 成田凌 https://movie.douban.com/subject/26683290/
  64.  
  65. 碟中谍6:全面瓦解 8.1 汤姆·克鲁斯 亨利·卡维尔 文·瑞姆斯 西蒙·佩吉 丽贝卡·弗格森 https://movie.douban.com/subject/26336252/
  66.  
  67. 龙猫 9.1 日高法子 坂本千夏 糸井重里 岛本须美 北林谷荣 https://movie.douban.com/subject/1291560/
  68.  
  69. 剪刀手爱德华 8.7 约翰尼·德普 薇诺娜·瑞德 黛安·韦斯特 安东尼·迈克尔·豪尔 凯西·贝克 https://movie.douban.com/subject/1292370/
  70.  
  71. 头号玩家 8.7 泰伊·谢里丹 奥利维亚·库克 本·门德尔森 马克·里朗斯 丽娜·维特 https://movie.douban.com/subject/4920389/
  72.  
  73. 无间道 9.1 刘德华 梁朝伟 黄秋生 曾志伟 郑秀文 https://movie.douban.com/subject/1307914/
  74.  
  75. 无双 8.1 周润发 郭富城 张静初 冯文娟 廖启智 https://movie.douban.com/subject/26425063/
  76.  
  77. 大话西游之月光宝盒 8.9 周星驰 吴孟达 罗家英 蓝洁瑛 莫文蔚 https://movie.douban.com/subject/1299398/
  78.  
  79. 红海行动 8.3 张译 黄景瑜 海清 杜江 蒋璐霞 https://movie.douban.com/subject/26861685/
  80.  
  81. 战狼2 7.1 吴京 弗兰克·格里罗 吴刚 张翰 卢靖姗 https://movie.douban.com/subject/26363254/
  82.  
  83. 寻梦环游记 9.0 安东尼·冈萨雷斯 盖尔·加西亚·贝纳尔 本杰明·布拉特 阿兰纳·乌巴奇 芮妮·维克托 https://movie.douban.com/subject/20495023/
  84.  
  85. 罗马假日 9.0 奥黛丽·赫本 格利高里·派克 埃迪·艾伯特 哈特利·鲍尔 哈考特·威廉姆斯 https://movie.douban.com/subject/1293839/
  86.  
  87. V字仇杀队 8.8 娜塔莉·波特曼 雨果·维文 斯蒂芬·瑞 斯蒂芬·弗雷 约翰·赫特 https://movie.douban.com/subject/1309046/
  88.  
  89. 美丽人生 9.5 罗伯托·贝尼尼 尼可莱塔·布拉斯基 乔治·坎塔里尼 朱斯蒂诺·杜拉诺 赛尔乔·比尼·布斯特里克 https://movie.douban.com/subject/1292063/
  90.  
  91. 七宗罪 8.8 摩根·弗里曼 布拉德·皮特 凯文·史派西 格温妮斯·帕特洛 安德鲁·凯文·沃克 https://movie.douban.com/subject/1292223/
  92.  
  93. 动物世界 7.2 李易峰 迈克尔·道格拉斯 周冬雨 曹炳琨 王戈 https://movie.douban.com/subject/26925317/
  94.  
  95. 老炮儿 7.8 冯小刚 许晴 张涵予 刘桦 李易峰 https://movie.douban.com/subject/24751756/
  96.  
  97. 失恋33 7.3 白百何 文章 张嘉译 王耀庆 张子萱 https://movie.douban.com/subject/4873490/
  98.  
  99. 蝴蝶效应 8.7 阿什顿·库彻 梅罗拉·沃特斯 艾米·斯马特 埃尔登·汉森 威廉姆·李·斯科特 https://movie.douban.com/subject/1292343/
  100.  
  101. 人再囧途之泰囧 7.4 徐峥 王宝强 黄渤 陶虹 谢楠 https://movie.douban.com/subject/10574622/
  102.  
  103. 辛德勒的名单 9.5 连姆·尼森 本·金斯利 拉尔夫·费因斯 卡罗琳·古多尔 乔纳森·萨加尔 https://movie.douban.com/subject/1295124/
  104.  
  105. 唐伯虎点秋香 8.5 周星驰 巩俐 陈百祥 郑佩佩 朱咪咪 https://movie.douban.com/subject/1306249/
  106.  
  107. 海王 7.8 杰森·莫玛 艾梅柏·希尔德 威廉·达福 帕特里克·威尔森 妮可·基德曼 https://movie.douban.com/subject/3878007/
  108.  
  109. 夏洛特烦恼 7.5 沈腾 马丽 尹正 艾伦 王智 https://movie.douban.com/subject/25964071/
  110.  
  111. 复仇者联盟 8.1 小罗伯特·唐尼 克里斯·埃文斯 斯嘉丽·约翰逊 克里斯·海姆斯沃斯 杰瑞米·雷纳 https://movie.douban.com/subject/1866479/
  112.  
  113. 芳华 7.6 黄轩 苗苗 钟楚曦 杨采钰 李晓峰 https://movie.douban.com/subject/26862829/
  114.  
  115. 黑天鹅 8.5 娜塔莉·波特曼 米拉·库尼斯 文森特·卡索 芭芭拉·赫希 薇诺娜·瑞德 https://movie.douban.com/subject/1978709/
  116.  
  117. 本杰明·巴顿奇事 8.8 凯特·布兰切特 布拉德·皮特 朱莉娅·奥蒙德 芳妮·A·钱勃丝 伊莱亚斯·科泰斯 https://movie.douban.com/subject/1485260/
  118.  
  119. 北京遇上西雅图 7.4 汤唯 吴秀波 海清 宋美曼 宋美慧 https://movie.douban.com/subject/10574468/
  1.  
  2. by:【一只阿木木】

爬虫系列4:Requests+Xpath 爬取动态数据的更多相关文章

  1. 爬虫系列1:Requests+Xpath 爬取豆瓣电影TOP

    爬虫1:Requests+Xpath 爬取豆瓣电影TOP [抓取]:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html [分页]: ...

  2. 爬虫系列2:Requests+Xpath 爬取租房网站信息

    Requests+Xpath 爬取租房网站信息 [抓取]:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html [分页]:参考前文 ...

  3. 爬虫系列(十三) 用selenium爬取京东商品

    这篇文章,我们将通过 selenium 模拟用户使用浏览器的行为,爬取京东商品信息,还是先放上最终的效果图: 1.网页分析 (1)初步分析 原本博主打算写一个能够爬取所有商品信息的爬虫,可是在分析过程 ...

  4. Python 爬虫实例(8)—— 爬取 动态页面

    今天使用python 和selenium爬取动态数据,主要是通过不停的更新页面,实现数据的爬取,要爬取的数据如下图 源代码: #-*-coding:utf-8-*- import time from ...

  5. Golang+chromedp+goquery 简单爬取动态数据

    目录 Golang+chromedp+goquery 简单爬取动态数据 Golang的安装 下载golang软件 解压golang 配置golang 重新导入配置 chromedp框架的使用 实际的代 ...

  6. 爬虫系列3:Requests+Xpath 爬取租房网站信息并保存本地

    数据保存本地 [抓取]:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html [分页]:参考前文 爬虫系列2:https://www ...

  7. Python爬虫学习三------requests+BeautifulSoup爬取简单网页

    第一次第一次用MarkDown来写博客,先试试效果吧! 昨天2018俄罗斯世界杯拉开了大幕,作为一个伪球迷,当然也得为世界杯做出一点贡献啦. 于是今天就编写了一个爬虫程序将腾讯新闻下世界杯专题的相关新 ...

  8. 爬虫(十):AJAX、爬取AJAX数据

    1. AJAX 1.1 什么是AJAX AJAX即“Asynchronous JavaScript And XML”(异步JavaScript和XML)可以使网页实现异步更新,就是不重新加载整个网页的 ...

  9. Python3爬虫系列:理论+实验+爬取妹子图实战

    Github: https://github.com/wangy8961/python3-concurrency-pics-02 ,欢迎star 爬虫系列: (1) 理论 Python3爬虫系列01 ...

随机推荐

  1. Delphi7安装

    在学习和使用Delphi之前,我们要先安装它的开发环境,本机系统为Win7 32.下面我简要介绍一下它的安装过程. (1)下载Delphi7并解压,双击setup.exe可执行文件开始安装. (2)开 ...

  2. 微信小程序前端开发踩坑(一)

    之前由于不了解微信小程序的整个的运行开发机制,走了很多的弯路,脑子灵光的可能不会遇到,这个主题系列的帖子希望可以帮助到像我一样理解能力慢的孩子. 不论是开发微信小程序还是说学习任何一门编程语言,最重要 ...

  3. 配置3层交换机VLAN间通信

    SW2 Switch>en Switch#conf t Enter configuration commands, one per line. End with CNTL/Z. Switch(c ...

  4. JAVA日常之三

    一.Main方法的args参数 args[] 是程序运行前可传入的参数,比如 java HelloWorld a,那么在HelloWorld的main方法里面 args就是{"a" ...

  5. JAVA日常之一

    一.JDK安装及环境变量设置 下载jdk安装包,如jdk-8u65-windows-x64.exe,点击安装,记住安装路径如E:\Program Files\Java\jdk1.8.0_65: 打开环 ...

  6. npm install 插件 --save与 --save -dev的区别

    npm i 插件   ,会把插件安装到node_modules目录中,不会修改package.json, npm i 插件 --save  ,项目发布上线之后还会依赖用到的插件,没有这些插件,项目不能 ...

  7. 实验五 CC2530平台上ADC组件的TinyOS编程

    实验五 CC2530平台上ADC组件的TinyOS编程 实验目的: 加深和巩固学生对于TinyOS编程方法的理解和掌握 让学生初步掌握传感器的ADC组件应用方法 学生通过本实验能够初步的了解和掌握CC ...

  8. memcached命令行、Memcached数据导出和导入、php连接memcache、php的session存储到memcached

    1.memcached命令行 telnet 127.0.0.1 11211set key2 0 30 2abSTOREDget key2VALUE key2 0 2abEND  如: set key3 ...

  9. IntelliJ IDEA 使用教程

    在IDEA当中,Project和  Module是作为两个不同的概念,对项目结构是重要意义的 eclipse和idea的区别 IDEA里面的子工程要称为Module就是模块化的概念,作为聚合工程亦或普 ...

  10. 使用CNN生成图像先验,实现更广泛场景的盲图像去模糊

    现有的最优方法在文本.人脸以及低光照图像上的盲图像去模糊效果并不佳,主要受限于图像先验的手工设计属性.本文研究者将图像先验表示为二值分类器,训练 CNN 来分类模糊和清晰图像.实验表明,该图像先验比目 ...