一、 Scrapy简介

Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.

官方主页: http://www.scrapy.org/

二、 安装Python2.7

官方主页:http://www.python.org/

下载地址:http://www.python.org/ftp/python/2.7.3/python-2.7.3.msi

1) 安装python

安装目录:D:\Python27

2) 添加环境变量

略System Properties -> Advanced -> Environment Variables - >System Variables -> Path -> Edit

3) 验证环境变量

  1. T:\>set Path
  2. Path=C:\WINDOWS\system32;C:\WINDOWS;C:\WINDOWS\System32\Wbem;D:\Rational\common;D:\Rational\ClearCase\bin;D:\Python27;D:\Python27\Scripts
  3. PATHEXT=.COM;.EXE;.BAT;.CMD;.VBS;.VBE;.JS;.JSE;.WSF;.WSH

4) 验证Python

  1. T:\>python
  2. Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> exit()
  5.  
  6. T:\>

三、 安装Twisted

Twisted is an event-driven networking engine written in Python and licensed under the open source

1) 安装setuptools

Download, build, install, upgrade, and uninstall Python packages -- easily!

官方主页:http://pypi.python.org/pypi/setuptools

下载地址:http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe

安装过程:略

2) 安装Zope.Interface

官方主页:http://pypi.python.org/pypi/zope.interface/

下载地址:http://pypi.python.org/packages/2.7/z/zope.interface/zope.interface-4.0.1-py2.7-win32.egg

安装过程:

  1. T:\>d:
  2. D:\>cd D:\Python27\Scripts
  3. D:\Python27\Scripts>easy_install.exe zope.interface-4.0.1-py2.7-win32.egg
  4. Processing zope.interface-4.0.1-py2.7-win32.egg
  5. creating d:\python27\lib\site-packages\zope.interface-4.0.1-py2.7-win32.egg
  6. Extracting zope.interface-4.0.1-py2.7-win32.egg to d:\python27\lib\site-packages
  7. Adding zope.interface 4.0.1 to easy-install.pth file
  8.  
  9. Installed d:\python27\lib\site-packages\zope.interface-4.0.1-py2.7-win32.egg
  10. Processing dependencies for zope.interface==4.0.1
  11. Finished processing dependencies for zope.interface==4.0.1
  12.  
  13. D:\Python27\Scripts>

验证安装:

  1. D:\Python27\Scripts>python
  2. Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> import zope.interface
  5. >>>

3) 安装Twisted

官方主页:http://twistedmatrix.com/trac/wiki/TwistedProject

下载地址:http://pypi.python.org/packages/2.7/T/Twisted/Twisted-12.1.0.win32-py2.7.msi

安装过程:略

四、 安装w3lib

官方主页:http://pypi.python.org/pypi/w3lib

下载地址: http://pypi.python.org/packages/source/w/w3lib/w3lib-1.2.tar.gz

解压过程:略

安装过程:

  1. T:\w3lib-1.2>python setup.py install
  2. running install
  3. running build
  4. running build_py
  5. creating build
  6. creating build\lib
  7. creating build\lib\w3lib
  8. copying w3lib\encoding.py -> build\lib\w3lib
  9. copying w3lib\form.py -> build\lib\w3lib
  10. copying w3lib\html.py -> build\lib\w3lib
  11. copying w3lib\http.py -> build\lib\w3lib
  12. copying w3lib\url.py -> build\lib\w3lib
  13. copying w3lib\util.py -> build\lib\w3lib
  14. copying w3lib\__init__.py -> build\lib\w3lib
  15. running install_lib
  16. creating D:\Python27\Lib\site-packages\w3lib
  17. copying build\lib\w3lib\encoding.py -> D:\Python27\Lib\site-packages\w3lib
  18. copying build\lib\w3lib\form.py -> D:\Python27\Lib\site-packages\w3lib
  19. copying build\lib\w3lib\html.py -> D:\Python27\Lib\site-packages\w3lib
  20. copying build\lib\w3lib\http.py -> D:\Python27\Lib\site-packages\w3lib
  21. copying build\lib\w3lib\url.py -> D:\Python27\Lib\site-packages\w3lib
  22. copying build\lib\w3lib\util.py -> D:\Python27\Lib\site-packages\w3lib
  23. copying build\lib\w3lib\__init__.py -> D:\Python27\Lib\site-packages\w3lib
  24. byte-compiling D:\Python27\Lib\site-packages\w3lib\encoding.py to encoding.pyc
  25. byte-compiling D:\Python27\Lib\site-packages\w3lib\form.py to form.pyc
  26. byte-compiling D:\Python27\Lib\site-packages\w3lib\html.py to html.pyc
  27. byte-compiling D:\Python27\Lib\site-packages\w3lib\http.py to http.pyc
  28. byte-compiling D:\Python27\Lib\site-packages\w3lib\url.py to url.pyc
  29. byte-compiling D:\Python27\Lib\site-packages\w3lib\util.py to util.pyc
  30. byte-compiling D:\Python27\Lib\site-packages\w3lib\__init__.py to __init__.pyc
  31. running install_egg_info
  32. Writing D:\Python27\Lib\site-packages\w3lib-1.2-py2.7.egg-info
  33.  
  34. T:\w3lib-1.2>

验证安装:

  1. T:\>python
  2. Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> import w3lib
  5. >>>

五、 安装libxml2

官方主页:http://users.skynet.be/sbi/libxml-python/http://pypi.python.org/pypi/pyOpenSSL

下载地址:http://users.skynet.be/sbi/libxml-python/binaries/libxml2-python-2.7.7.win32-py2.7.exe

安装过程:略

验证安装:

  1. T:\>python
  2. Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> import libxml2
  5. >>>

六、 安装pyOpenSSL

官方主页:http://pypi.python.org/pypi/pyOpenSSL

下载地址:http://pypi.python.org/packages/2.7/p/pyOpenSSL/pyOpenSSL-0.13.winxp32-py2.7.msi

安装过程:略

验证安装:

  1. T:\>python
  2. Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> import OpenSSL
  5. >>>

七、 安装Scrapy

官方主页:http://scrapy.org/

下载地址:http://pypi.python.org/packages/source/S/Scrapy/Scrapy-0.14.4.tar.gz

解压过程:略

安装过程:

  1. T:\Scrapy-0.14.4>python setup.py install
  2.  
  3. ……
  4. Installing easy_install-2.7-script.py script to D:\Python27\Scripts
  5. Installing easy_install-2.7.exe script to D:\Python27\Scripts
  6. Installing easy_install-2.7.exe.manifest script to D:\Python27\Scripts
  7.  
  8. Using d:\python27\lib\site-packages
  9. Finished processing dependencies for Scrapy==0.14.4
  10.  
  11. T:\Scrapy-0.14.4>

验证安装:

  1. T:\>scrapy
  2. Scrapy 0.14.4 - no active project
  3.  
  4. Usage:
  5. scrapy <command> [options] [args]
  6.  
  7. Available commands:
  8. fetch Fetch a URL using the Scrapy downloader
  9. runspider Run a self-contained spider (without creating a project)
  10. settings Get settings values
  11. shell Interactive scraping console
  12. startproject Create new project
  13. version Print Scrapy version
  14. view Open URL in browser, as seen by Scrapy
  15.  
  16. Use "scrapy <command> -h" to see more info about a command
  17.  
  18. T:\>

scrapy 安装详解的更多相关文章

  1. Linux ssh登录和软件安装详解

    阿哲Style   Linux第一天 ssh登录和软件安装详解 Linux学习第一天 操作环境: Ubuntu 16.04 Win10系统,使用putty_V0.63 本身学习Linux就是想在服务器 ...

  2. 【转】Linux下Android ADB驱动安装详解

    原文网址:http://blog.csdn.net/zhenwenxian/article/details/5901350 Linux下Android ADB驱动安装详解 概述 最近由于内置的合作商比 ...

  3. scribefire 多博客管理利器 安装详解

    scribefire 多博客管理利器 安装详解 一.ScribeFire介绍 ScribeFire 是 Firefox (火狐浏览器)上著名的博客写作工具,目前已跨平台支持多浏览器(Firefox,C ...

  4. CentOS 6.5的安装详解

    CentOS 6.5的安装详解 主流: 目前的Linux操作系统主要应用于生产环境, 主流企业级Linux系统仍旧是RedHat或者CentOS 免费: RedHat 和CentOS差别不大,Cent ...

  5. Linux下tomcat的安装详解

    Linux下tomcat的安装详解 来源: ChinaUnix博客 日期: 2007.01.21 22:59 (共有0条评论) 我要评论 一,安装前的准备:1,Linux版本:我的是企业版.(至于红帽 ...

  6. Phoenix和SQuirrel安装详解

    Phoenix安装详解 描述 现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等.今天的主角是Phoenix. phoenix,中文译为“凤凰” ...

  7. zabbix agent安装详解

    安装 Installing repository configuration package Zabbix 2.2 for RHEL5, Oracle Linux 5, CentOS 5: rpm - ...

  8. zabbix server安装详解

    简介 zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案. zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以 ...

  9. Oracle Database 12c Release 2安装详解

    第1章 Oracle Database 12c Release 2安装详解 1.1 下载方法 oracle官网https://www.oracle.com 1)打开官方网站,找到下载连接 2)选择更多 ...

随机推荐

  1. 我对 aspnetpager和repeater以及查询条件的封装

    /// <summary>         /// 绑定所有图片列表         /// </summary>         /// <param name=&qu ...

  2. [ CodeVS冲杯之路 ] P1169

    不充钱,你怎么AC? 题目:http://codevs.cn/problem/1169/ 感觉这题目好恐怖,莫名其妙乱码一堆就AC了…… 它看上去是两个子问题,实际上可以看成从起点找两条不相交的路径使 ...

  3. 寻找道路(NOIP2014)神奇之题。。

    原题传送门 这道题嘛.. 首先根据题目,我们要先知道哪些点能够到达终点.(反向BFS) 然后我们再求最短路的途中,必须随时判断周围的点是否被第一次BFS标记过.. 所以再来一次BFS. 数组记得清零, ...

  4. rootkit 内核函数hook

    转自:https://0x90syntax.wordpress.com/2016/02/21/suterusu-rootkitx86%e4%b8%8earm%e7%9a%84%e5%86%85%e8% ...

  5. 华为上机测试题(地铁换乘-java)

    PS:自己写的,自测试OK,供大家参考. /* 高级题样题:地铁换乘描述:已知2条地铁线路,其中A为环线,B为东西向线路,线路都是双向的.经过的站点名分别如下,两条线交叉的换乘点用T1.T2表示.编写 ...

  6. Centos 环境变量

    1. 控制台中,不赞成使用这种方法,因为换个shell,你的设置就无效了,因此这种方法仅仅是临时使用,以后要使用的时候又要重新设置,比较麻烦. 这个只针对特定的shell; $ PATH=" ...

  7. 2.tornado请求与响应

    之前我们介绍了tornado的基础流程,但还遗留了一些问题.今天我们就来解决遗留问题并学习新的内容 settings,使用tornado.web.Application(handler, **sett ...

  8. Ubuntu配置网络遇到的一些问题

    Ubuntu配置网络遇到的一些问题 在配置Ubuntu网络时,曾遇到了一些问题.查找了一些博客,所幸都解决了.记录一下,以便日后查阅. 设置DNS sudo vim /etc/resolv.conf ...

  9. c# 防止重复运行 弹出已运行窗口并传递消息

    最近在写一款软件 软件是用来接收其他程序传递过来的命令行,并形成列表 大概的最终效果就像下图一样 原本为了程序美观是打算用listbox自绘列表,字和图片都绘制好了发现自己不会绘制按钮 所以最终采用了 ...

  10. RMQ-ST算法

    1068 : RMQ-ST算法 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi和小Ho在美国旅行了相当长的一段时间之后,终于准备要回国啦!而在回国之前,他们准备去 ...