安装和使用pyspider框架时遇到的问题
安装pyspider, 直接cmd中输入 pip install pyspider, 而后提示报错
从网上找到解决方法,pycurl需要根据python版本采用wheel方法安装.
下载链接为https://www.lfd.uci.edu/~gohlke/pythonlibs/, 打开网页搜索pycurl,找到对应版本.
pip install wheel安装好直接, cmd切换到wheel文件目录, 输入 pip install 安装包名称.whl 即可
由于pycuel链接较慢,可用如下地址下载
https://pan.baidu.com/s/1jjf-CD6W0kJ8tDlj88C-QQ
-----------------------------------------------------------------------------
然后启动又遇到问题如图
问题产生原因为python3.7中async被纳为关键词,需要将pyspider中的async替换掉, 建议改为async_,
分别在run.py、fetcher->tornado_fetcher.py、webui->app.py , ctrl+f查找async替换掉即可.
---------------------------------------------------------------------------
接下来启动,再次报错如下:
百度得到解决方法如下:
产生原因为 WsgiDAV发布了版本 pre-release 3.x导致,需要降低版本,
将wsgidav替换为2.4.1
cmd输入如下命令
•# python -m pip install wsgidav==2.4.1 即可解决.
---------------------------------------------------------------
测试雪球网,
{
"fetch": {},
"process": {
"callback": "index_page"
},
"project": "xueqiu",
"schedule": {
"age":
},
"taskid": "6d1a833f721781353912c169bdaace49",
"url": "https://xueqiu.com/"
}
提示报错
[E :: base_handler:] HTTP : SSL certificate problem: unable to get local issuer certificate
Traceback (most recent call last):
File "d:\program files\python36\lib\site-packages\pyspider\libs\base_handler.py", line , in run_task
result = self._run_task(task, response)
File "d:\program files\python36\lib\site-packages\pyspider\libs\base_handler.py", line , in _run_task
response.raise_for_status()
File "d:\program files\python36\lib\site-packages\pyspider\libs\response.py", line , in raise_for_status
six.reraise(Exception, Exception(self.error), Traceback.from_string(self.traceback).as_traceback())
File "d:\program files\python36\lib\site-packages\six.py", line , in reraise
raise value.with_traceback(tb)
File "d:\program files\python36\lib\site-packages\pyspider\fetcher\tornado_fetcher.py", line , in http_fetch
response = yield gen.maybe_future(self.http_client.fetch(request))
File "d:\program files\python36\lib\site-packages\tornado\httpclient.py", line , in fetch
self._async_client.fetch, request, **kwargs))
File "d:\program files\python36\lib\site-packages\tornado\ioloop.py", line , in run_sync
return future_cell[].result()
File "d:\program files\python36\lib\site-packages\tornado\concurrent.py", line , in result
raise_exc_info(self._exc_info)
File "<string>", line , in raise_exc_info
Exception: HTTP : SSL certificate problem: unable to get local issuer certificate
测试了百度到的各种解决办法,均无果.
去他喵的.
最后把
"url": "https://xueqiu.com/"
改成
"url": "http://xueqiu.com/"
测试通过,收工
安装和使用pyspider框架时遇到的问题的更多相关文章
- 解决pyspider框架web预览框过小问题
解决pyspider框架web预览框过小问题 Chrome 使用pyspider框架时,web预览框只有一小条: 解决办法: 找到debug.min.css文件,替换为如下内容: body{margi ...
- Python爬虫-pyspider框架的使用
pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优 ...
- PySpider框架的基本用法
pyspider安装: 3.7之后无法正常使用,使用可以下载Python3.6或以下,或者修改pyspider内部代码 ———————————————————————————————————————— ...
- Python爬虫之PySpider框架
概述 pyspider 是一个支持任务监控.项目管理.多种数据库,具有 WebUI 的爬虫框架,它采用 Python 语言编写,分布式架构.详细特性如下: 拥有 Web 脚本编辑界面,任务监控器,项目 ...
- 利用 pyspider 框架抓取猫途鹰酒店信息
利用框架 pyspider 能实现快速抓取网页信息,而且代码简洁,抓取速度也不错. 环境:macOS:Python 版本:Python3. 1.首先,安装 pyspider 框架,使用pip3一键安装 ...
- Pyspider框架
1, 2,在ubuntu安装pyspider如果出现pycul的问题 首先执行命令:sudo apt-get install libssl-dev libcurl4-openssl-dev pytho ...
- Ubuntu 14.04 安装caffe深度学习框架
简介:如何在ubuntu 14.04 下安装caffe深度学习框架. 注:安装caffe时一定要保持网络状态好,不然会遇到很多麻烦.例如下载不了,各种报错. 一.安装依赖包 $ sudo apt-ge ...
- Symfony4中文文档: 安装和设置Symfony框架
安装和设置Symfony框架 要创建新的Symfony应用程序, 首先确保使用的是PHP7.1 或更高版本并且已经安装Componser. 如果未安装, 请首先在系统上全局安装Componser. 如 ...
- win2003下安装python3.4 + pyspider
昨天尝试了在win2003下安装python2.7.这个是文章地址:https://www.cnblogs.com/alpiny/p/11706606.html 但是程序跑了一晚上,发现有一点问题,是 ...
随机推荐
- Java中super关键字的位置
1.子类的构造函数如果要引用super的话,必须把super放在函数的首行. 例如: class Base { Base() { System.out.println("Base&qu ...
- 【sql】leetcode习题 (共 42 题)
[175]Combine Two Tables (2018年11月23日,开始集中review基础) Table: Person +-------------+---------+ | Column ...
- Hadoop(三)YARN
Yet Another Resources Negotiator 从Hadoop2.0版本开始引入YARN,主要功能: 集群资源管理系统 负责集群的统一管理和调度 与客户端交互,处理客户端请求 一.基 ...
- JAVA设计模式之迭代器设计模式
一.迭代器模式简介 Iterator模式也叫迭代模式,是行为模式之一,它把对容器中包含的内部对象的访问委让给外部类,使用Iterator(遍历)按顺序进行遍历访问的设计模式. 二.迭代器模式的角色与职 ...
- JavaIO流之File操作
IO流: File: File(文件/文件夹地址)构造函数: public File(String path); public File(String parentPath, String child ...
- PHP ftp_mkdir() 函数
定义和用法 ftp_mkdir() 函数在 FTP 服务器上创建一个新目录. 如果成功,该函数返回新目录的名称和路径.如果失败,则返回 FALSE. 语法 ftp_mkdir(ftp_connecti ...
- 【LeetCode 10】正则表达式匹配
题目链接 [题解] 看到这个题解 写的代码. 就是加个备忘录法.优化一下暴力的做法. 匹配的时候如果遇到号的话,就两种可能.不再考虑它前面一个字符了. 跳过这个或者.或者继续用前面那个字符匹配. 即d ...
- snaker配置
1,导入jar包 jar包 2,snaker的配置 3,snaker的工具类 以上是使用snaker的最基本的配置. http://lightfor.org/snaker/demo.html
- STM32嵌入式开发学习笔记(六):串口通信(上)
本文我们将了解STM32与外部设备通过串口通信的方式. 所谓串口通信,其实是一个类似于计算机网络的概念,它有物理层,比如规定用什么线通信,几伏特算高电平,几伏特算低电平.传输层,通信前要发RTS,CT ...
- 第十四届华中科技大学程序设计竞赛--J Various Tree
链接:https://www.nowcoder.com/acm/contest/106/J来源:牛客网 时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 32768K,其他语言65536 ...