python 3 安装 scrapy 并运行成功

今天，python 3 安装 scrapy，并运行成功。特此纪念！

我的环境：windows 10(64位) + python 3.5.2(64位)

其中几个要点说明一下：

1、有几个依赖库需要事先单独安装

往往，在安装scrapy依赖库，即在

pip install scrapy

过程中，会出现红色错误的。此时，做两件事

更新pip: $ python pip install --upgrade pip
去lfd下载单独的whl文件，pip安装之(若有多个依赖库安装出现红色文字错误，则此步重复！)

2、特别地，pywin32的安装问题

去lfd下载单独的whl文件，pip安装之
然后，运行命令$ python pywin32_postinstall.py -install，切记！

好了，运行官网首页的例子：

import scrapy

class BlogSpider(scrapy.Spider):

    name = 'blogspider'

    start_urls = ['https://blog.scrapinghub.com']

    def parse(self, response):

        for url in response.css('ul li a::attr("href")').re('.*/category/.*'):

            yield scrapy.Request(response.urljoin(url), self.parse_titles)

    def parse_titles(self, response):

        for post_title in response.css('div.entries > ul > li a::text').extract():

            yield {'title': post_title}

保存为myspider.py文件，命令行进入此文件夹，运行如下命令，使启动爬虫：

scrapy runspider myspider.py

OK了，可以看到成功的信息。

python 3 安装 scrapy 并运行成功的更多相关文章

Python爬虫：scrapy 的运行流程和各模块的作用
scrapy的运行流程爬虫 -> 起始URL封装Request -> 爬虫中间件 -> 引擎 -> 调度器(Scheduler): 缓存请求, 请求去重调度器 -> ...
python 里安装 tensorflow 后运行出错的问题解决
如果出现一下错误: libcublas.so.8.0: cannot open shared object file: No such file or directory 原因是没有 cuda 环境, ...
Python：安装Bio库不成功，出现ModuleNotFoundError: No module named 'Bio'
Bio库的安装并不是pip install bio,而是biopython. ./anaconda3/bin/pip3 install biopython -i https://pypi.douban ...
Python|PyCharm安装scrapy包
[转]http://www.cnblogs.com/xiaoli2018/p/4566639.html
python3.7.1安装Scrapy爬虫框架
python3.7.1安装Scrapy爬虫框架环境:win7(64位), Python3.7.1(64位) 一.安装pyhthon 详见Python环境搭建:http://www.runoob.co ...
python3.7 安装Scrapy 失败问题
python的Scrapy框架,需要Twisted依赖以及VC++ 14 以上的环境,这些就不再赘述.讲讲今天安装Twisted和Scrapy遇到的其他问题. 首先就是直接安装Twisted成功后,安 ...
Python 爬虫6——Scrapy的安装和使用
前面我们简述了使用Python自带的urllib和urllib2库完成的一下爬取网页数据的操作,但其实能完成的功能都很简单,假如要进行复制的数据匹配和高效的操作,可以引入第三方的框架,例如Scrapy ...
python 安装scrapy
1. 首先你先得安装PYTHON...还是推荐2.7吧,之前装了3.3似乎和这个世界格格不入...先装个2.7. 并将python加入系统的环境变量. 2. 去scrapy 官网下载最新版本的scra ...
python爬虫随笔-scrapy框架(1)——scrapy框架的安装和结构介绍
scrapy框架简介 Scrapy,Python开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy用途广泛,可以用于数据挖掘.监测和自动化测试 ...

随机推荐

彻底退出所有的Acticity
有时候点击回退键退出应用,会出现有些Activity不能完全退出的情况,那么可以使用前面这个方法: 在需要退出的Activity的onCreate()方法中加入 ExitApplication.get ...
阿里云ECS/Ubuntu下JDK、Tomcat、MySQL安装记录
今天六一儿童节,然后... ... ... ... 然后就是父亲节呀孩子们!!! ———————————————————————割———————————————————————— 同事需要JDK.To ...
windows下使用tomcat部署网站
一.配置过程: 1. 配置java环境(之前已装过,跳过此步骤) 2. 下载tomcat (1)找到支持此java版本的tomcat版本: (2)下载与当前系统对应的安装文件 http://tom ...
docker-3 基础命令
创建镜像创建镜像的方法有三种: 基于已有的容器创建基于本地模板导入基于dockerfile 基于已有的容器创建主要使用docker commit 命令,命令格式: docker commit ...
精----Java读取xml文件的四种方法
xml文件: Xml代码 <?xml version="1.0" encoding="GB2312"?> <RESULT> <VA ...
jenkins maven svn 部署web项目到本地Tomcat
查了N多网页,折腾了几个小时,终于部署成功,部署的过程比较坎坷,遇到各种问题,记录一下,不管大家是否会遇到的同样的问题,希望有所帮助: 常规操作: 1.下载jenkins,必须要做的一步,http:/ ...
Plus One
Plus One https://leetcode.com/problems/plus-one/ Given a non-negative number represented as an array ...
C++ string的大小写转换
将一个string转换成大写或者小写,是项目中经常需要做的事情,但string类里并没有提供这个方法.自己写个函数来实现,说起来挺简单,但做起来总让人觉得不方便.打个比方:早上起来想吃个汉堡,冰箱里 ...
用Python和摄像头制作简单的延时摄影
“延时摄影(英语:Time-lapse photography)是以一种较低的帧率拍下图像或者视频,然后用正常或者较快的速率播放画面的摄影技术.在一段延时摄影视频中,物体或者景物缓慢变化的过程被压缩 ...
ZOJ 3232 It's not Floyd Algorithm --强连通分量+Floyd
题意:给你一个传递闭包的矩阵,mp[u][v] = 1表示u可以到达v,为0代表不可到达,问你至少需要多少条边组成的传递闭包符合这个矩阵给出的关系分析:考虑一个强连通分量,如果这个分量有n个节点,那 ...

python 3 安装 scrapy 并运行成功

1、有几个依赖库需要事先单独安装

2、特别地，pywin32的安装问题

python 3 安装 scrapy 并运行成功的更多相关文章

随机推荐

热门专题