python 并发爬虫的快感

import time

from tomorrow import threads

from requests_html import HTMLSession

session=HTMLSession()

@threads(50)  # 使用装饰器，这个函数异步执行

def download(url):

    return session.get(url)

def main():

    start = time.time()

    urls = [

        'https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879'

    ]

    req_list=[]

    for i in urls:

        req_list.append(download(i))

    print(req_list)

    responses = [i.html.xpath("//title/text()") for i in req_list]

    print(responses)

    end = time.time()

    print("Time: %f seconds" % (end - start))

if __name__ == "__main__":

    main()

python 并发爬虫的快感的更多相关文章

python并发爬虫利器tomorrow(一)
tomorrow是我最近在用的一个爬虫利器,该模块属于第三方的一个模块,使用起来非常的方便,只需要用其中的threads方法作为装饰器去修饰一个普通的函数,既可以达到并发的效果,本篇将用实例来展示to ...
python异步爬虫
本文主要包括以下内容线程池实现并发爬虫回调方法实现异步爬虫协程技术的介绍一个基于协程的异步编程模型协程实现异步爬虫线程池.回调.协程我们希望通过并发执行来加快爬虫抓取页面的速度.一般的实 ...
Python并发编程之深入理解yield from语法（八）
大家好,并发编程进入第八篇. 直到上一篇,我们终于迎来了Python并发编程中,最高级.最重要.当然也是最难的知识点--协程. 当你看到这一篇的时候,请确保你对生成器的知识,有一定的了解.当然不了解 ...
Python并发编程二（多线程、协程、IO模型）
1.python并发编程之多线程(理论) 1.1线程概念在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程线程顾名思义,就是一条流水线工作的过程(流水线的工作需要电源,电源就相当于 ...
基于Scrapy框架的Python新闻爬虫
概述该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地详细代码下载:http://www.demoda ...
python并发编程&多进程(二)
前导理论知识见:python并发编程&多进程(一) 一 multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_cou ...
Python分布式爬虫抓取知乎用户信息并进行数据分析
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了... 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目, ...
《实战Python网络爬虫》- 感想
端午节假期过了,之前一直在做出行准备,后面旅游完又休息了一下,最近才恢复状态. 端午假期最后一天收到一个快递,回去打开,发现是微信抽奖中的一本书,黄永祥的<实战Python网络爬虫>. 去 ...
Python网络爬虫与信息提取
1.Requests库入门 Requests安装用管理员身份打开命令提示符: pip install requests 测试:打开IDLE: >>> import requests ...

随机推荐

【CodeChef-SPCLN】Cleaning the Space
https://odzkskevi.qnssl.com/7dfb262544887eff6fb35bfb444759d6?v=1502084197 做法是类似于最大割之类的东西,把每个碎片按照按钮拆点 ...
BZOJ4070 [Apio2015]雅加达的摩天楼【分块 + 最短路】
题目链接 BZOJ4070 题解考虑暴力建图,将每个\(B_i\)向其能到的点连边,复杂度\(O(\sum \frac{n}{p_i})\),当\(p\)比较小时不适用考虑优化建图,每个\(dog ...
【bzoj4036】按位或
Portal --> bzoj4036 Solution 感觉容斥的东西内容有点qwq多啊qwq还是以题目的形式来慢慢补档好了这里补的是min-max容斥其实min-max容斥 ...
“Spring.Context.Support.ContextRegistry”的类型初始值设定项引发异常。-解决方法
注释掉web/app.config中的:
shiro的原理理解
1.shiro原理图如下: 框架解释: subject:主体,可以是用户也可以是程序,主体要访问系统,系统需要对主体进行认证.授权. securityManager:安全管理器,主体进行认证和授权都 ...
re正则模块
1.正则表达式的常用符号 '.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 '^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上 ...
正则(?is)
Q:经常看见的正则前面的 (?i) (?s) (?m) (?is) (?im) 是什么意思?A: 称为内联匹配模式,通常用内联匹配模式代替使用枚举值RegexOptions指定的全局匹配模式,写起来更 ...
centos7通过yum安装MySQL
一:去官网查看最新安装包 https://dev.mysql.com/downloads/repo/yum/ 二:下载MySQL源安装包 wget http://dev.mysql.com/get/m ...
OpenCV---色彩空间（一）
颜色空间:用三种或者更多特征来指定颜色的方法,被称为颜色空间或者颜色模型 1.RGB(OpenCV中为BGR): 一幅图像由三个独立的图像平面或者通道构成:红.蓝.绿(以及可选项:透明度alpha通道 ...
常用Path路径
正三角形(左):<Path Data="M40,0 L0,30 40,60 z" Stretch="Uniform"/> 正三角形(上):<P ...

python 并发爬虫的快感

python 并发爬虫的快感的更多相关文章

随机推荐

热门专题