scrapy是个好玩的爬虫框架,基本用法就是:输入起始的一堆url,让爬虫去get这些网页,然后parse页面,获取自己喜欢的东西.. 用上去有django的感觉,有settings,有field.还会自动生成一堆东西.. 用法:scrapy-admin.py startproject abc 生成一个project. 试试就知道会生成什么东西.在spiders包中新建一个py文件,里面写自定义的爬虫类. 自定义爬虫类必须有变量 domain_name 和 start_urls,和实例方法par…