scrapy 安装详解
一、 Scrapy简介
Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.
官方主页: http://www.scrapy.org/
二、 安装Python2.7
下载地址:http://www.python.org/ftp/python/2.7.3/python-2.7.3.msi
1) 安装python
安装目录:D:\Python27
2) 添加环境变量
略System Properties -> Advanced -> Environment Variables - >System Variables -> Path -> Edit
3) 验证环境变量
- T:\>set Path
- Path=C:\WINDOWS\system32;C:\WINDOWS;C:\WINDOWS\System32\Wbem;D:\Rational\common;D:\Rational\ClearCase\bin;D:\Python27;D:\Python27\Scripts
- PATHEXT=.COM;.EXE;.BAT;.CMD;.VBS;.VBE;.JS;.JSE;.WSF;.WSH
4) 验证Python

- T:\>python
- Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> exit()
- T:\>

三、 安装Twisted
Twisted is an event-driven networking engine written in Python and licensed under the open source
1) 安装setuptools
Download, build, install, upgrade, and uninstall Python packages -- easily!
官方主页:http://pypi.python.org/pypi/setuptools
下载地址:http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe
安装过程:略
2) 安装Zope.Interface
官方主页:http://pypi.python.org/pypi/zope.interface/
下载地址:http://pypi.python.org/packages/2.7/z/zope.interface/zope.interface-4.0.1-py2.7-win32.egg
安装过程:

- T:\>d:
- D:\>cd D:\Python27\Scripts
- D:\Python27\Scripts>easy_install.exe zope.interface-4.0.1-py2.7-win32.egg
- Processing zope.interface-4.0.1-py2.7-win32.egg
- creating d:\python27\lib\site-packages\zope.interface-4.0.1-py2.7-win32.egg
- Extracting zope.interface-4.0.1-py2.7-win32.egg to d:\python27\lib\site-packages
- Adding zope.interface 4.0.1 to easy-install.pth file
- Installed d:\python27\lib\site-packages\zope.interface-4.0.1-py2.7-win32.egg
- Processing dependencies for zope.interface==4.0.1
- Finished processing dependencies for zope.interface==4.0.1
- D:\Python27\Scripts>

验证安装:
- D:\Python27\Scripts>python
- Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> import zope.interface
- >>>
3) 安装Twisted
官方主页:http://twistedmatrix.com/trac/wiki/TwistedProject
下载地址:http://pypi.python.org/packages/2.7/T/Twisted/Twisted-12.1.0.win32-py2.7.msi
安装过程:略
四、 安装w3lib
官方主页:http://pypi.python.org/pypi/w3lib
下载地址: http://pypi.python.org/packages/source/w/w3lib/w3lib-1.2.tar.gz
解压过程:略
安装过程:

- T:\w3lib-1.2>python setup.py install
- running install
- running build
- running build_py
- creating build
- creating build\lib
- creating build\lib\w3lib
- copying w3lib\encoding.py -> build\lib\w3lib
- copying w3lib\form.py -> build\lib\w3lib
- copying w3lib\html.py -> build\lib\w3lib
- copying w3lib\http.py -> build\lib\w3lib
- copying w3lib\url.py -> build\lib\w3lib
- copying w3lib\util.py -> build\lib\w3lib
- copying w3lib\__init__.py -> build\lib\w3lib
- running install_lib
- creating D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\encoding.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\form.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\html.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\http.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\url.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\util.py -> D:\Python27\Lib\site-packages\w3lib
- copying build\lib\w3lib\__init__.py -> D:\Python27\Lib\site-packages\w3lib
- byte-compiling D:\Python27\Lib\site-packages\w3lib\encoding.py to encoding.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\form.py to form.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\html.py to html.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\http.py to http.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\url.py to url.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\util.py to util.pyc
- byte-compiling D:\Python27\Lib\site-packages\w3lib\__init__.py to __init__.pyc
- running install_egg_info
- Writing D:\Python27\Lib\site-packages\w3lib-1.2-py2.7.egg-info
- T:\w3lib-1.2>

验证安装:
- T:\>python
- Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> import w3lib
- >>>
五、 安装libxml2
官方主页:http://users.skynet.be/sbi/libxml-python/http://pypi.python.org/pypi/pyOpenSSL
下载地址:http://users.skynet.be/sbi/libxml-python/binaries/libxml2-python-2.7.7.win32-py2.7.exe
安装过程:略
验证安装:
- T:\>python
- Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> import libxml2
- >>>
六、 安装pyOpenSSL
官方主页:http://pypi.python.org/pypi/pyOpenSSL
下载地址:http://pypi.python.org/packages/2.7/p/pyOpenSSL/pyOpenSSL-0.13.winxp32-py2.7.msi
安装过程:略
验证安装:
- T:\>python
- Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> import OpenSSL
- >>>
七、 安装Scrapy
官方主页:http://scrapy.org/
下载地址:http://pypi.python.org/packages/source/S/Scrapy/Scrapy-0.14.4.tar.gz
解压过程:略
安装过程:

- T:\Scrapy-0.14.4>python setup.py install
- ……
- Installing easy_install-2.7-script.py script to D:\Python27\Scripts
- Installing easy_install-2.7.exe script to D:\Python27\Scripts
- Installing easy_install-2.7.exe.manifest script to D:\Python27\Scripts
- Using d:\python27\lib\site-packages
- Finished processing dependencies for Scrapy==0.14.4
- T:\Scrapy-0.14.4>

验证安装:

- T:\>scrapy
- Scrapy 0.14.4 - no active project
- Usage:
- scrapy <command> [options] [args]
- Available commands:
- fetch Fetch a URL using the Scrapy downloader
- runspider Run a self-contained spider (without creating a project)
- settings Get settings values
- shell Interactive scraping console
- startproject Create new project
- version Print Scrapy version
- view Open URL in browser, as seen by Scrapy
- Use "scrapy <command> -h" to see more info about a command
- T:\>

scrapy 安装详解的更多相关文章
- Linux ssh登录和软件安装详解
阿哲Style Linux第一天 ssh登录和软件安装详解 Linux学习第一天 操作环境: Ubuntu 16.04 Win10系统,使用putty_V0.63 本身学习Linux就是想在服务器 ...
- 【转】Linux下Android ADB驱动安装详解
原文网址:http://blog.csdn.net/zhenwenxian/article/details/5901350 Linux下Android ADB驱动安装详解 概述 最近由于内置的合作商比 ...
- scribefire 多博客管理利器 安装详解
scribefire 多博客管理利器 安装详解 一.ScribeFire介绍 ScribeFire 是 Firefox (火狐浏览器)上著名的博客写作工具,目前已跨平台支持多浏览器(Firefox,C ...
- CentOS 6.5的安装详解
CentOS 6.5的安装详解 主流: 目前的Linux操作系统主要应用于生产环境, 主流企业级Linux系统仍旧是RedHat或者CentOS 免费: RedHat 和CentOS差别不大,Cent ...
- Linux下tomcat的安装详解
Linux下tomcat的安装详解 来源: ChinaUnix博客 日期: 2007.01.21 22:59 (共有0条评论) 我要评论 一,安装前的准备:1,Linux版本:我的是企业版.(至于红帽 ...
- Phoenix和SQuirrel安装详解
Phoenix安装详解 描述 现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等.今天的主角是Phoenix. phoenix,中文译为“凤凰” ...
- zabbix agent安装详解
安装 Installing repository configuration package Zabbix 2.2 for RHEL5, Oracle Linux 5, CentOS 5: rpm - ...
- zabbix server安装详解
简介 zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案. zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以 ...
- Oracle Database 12c Release 2安装详解
第1章 Oracle Database 12c Release 2安装详解 1.1 下载方法 oracle官网https://www.oracle.com 1)打开官方网站,找到下载连接 2)选择更多 ...
随机推荐
- 我对 aspnetpager和repeater以及查询条件的封装
/// <summary> /// 绑定所有图片列表 /// </summary> /// <param name=&qu ...
- [ CodeVS冲杯之路 ] P1169
不充钱,你怎么AC? 题目:http://codevs.cn/problem/1169/ 感觉这题目好恐怖,莫名其妙乱码一堆就AC了…… 它看上去是两个子问题,实际上可以看成从起点找两条不相交的路径使 ...
- 寻找道路(NOIP2014)神奇之题。。
原题传送门 这道题嘛.. 首先根据题目,我们要先知道哪些点能够到达终点.(反向BFS) 然后我们再求最短路的途中,必须随时判断周围的点是否被第一次BFS标记过.. 所以再来一次BFS. 数组记得清零, ...
- rootkit 内核函数hook
转自:https://0x90syntax.wordpress.com/2016/02/21/suterusu-rootkitx86%e4%b8%8earm%e7%9a%84%e5%86%85%e8% ...
- 华为上机测试题(地铁换乘-java)
PS:自己写的,自测试OK,供大家参考. /* 高级题样题:地铁换乘描述:已知2条地铁线路,其中A为环线,B为东西向线路,线路都是双向的.经过的站点名分别如下,两条线交叉的换乘点用T1.T2表示.编写 ...
- Centos 环境变量
1. 控制台中,不赞成使用这种方法,因为换个shell,你的设置就无效了,因此这种方法仅仅是临时使用,以后要使用的时候又要重新设置,比较麻烦. 这个只针对特定的shell; $ PATH=" ...
- 2.tornado请求与响应
之前我们介绍了tornado的基础流程,但还遗留了一些问题.今天我们就来解决遗留问题并学习新的内容 settings,使用tornado.web.Application(handler, **sett ...
- Ubuntu配置网络遇到的一些问题
Ubuntu配置网络遇到的一些问题 在配置Ubuntu网络时,曾遇到了一些问题.查找了一些博客,所幸都解决了.记录一下,以便日后查阅. 设置DNS sudo vim /etc/resolv.conf ...
- c# 防止重复运行 弹出已运行窗口并传递消息
最近在写一款软件 软件是用来接收其他程序传递过来的命令行,并形成列表 大概的最终效果就像下图一样 原本为了程序美观是打算用listbox自绘列表,字和图片都绘制好了发现自己不会绘制按钮 所以最终采用了 ...
- RMQ-ST算法
1068 : RMQ-ST算法 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi和小Ho在美国旅行了相当长的一段时间之后,终于准备要回国啦!而在回国之前,他们准备去 ...