一 代码 # -*- coding: utf-8 -*- import scrapy class ZhihuSpider(scrapy.Spider): # 爬虫名字,名字唯一,允许自定义 name = 'zhihu' # 允许爬取的域名,scrapy每次发起的url爬取数据,先回进行域名检测,检测通过就爬取 allowed_domains = ['zhihu.com'] #发起的起始url地址,scrapy项目启动自动调用start_request()方法,把start_urls # url的…