本文获取的字段有为职位名称,公司名称,公司地点,薪资,发布时间 创建爬虫项目 scrapy startproject qianchengwuyou cd qianchengwuyou scrapy genspider -t crawl qcwy www.xxx.com items中定义爬取的字段 import scrapy class QianchengwuyouItem(scrapy.Item): # define the fields for your item here like: job
读取csv文件 通过csv.reader()和DictReader()两个函数 reader()函数返回一个迭代器 会包含表头 通过next函数可以跳过,但是它只能通过下标访问数据: DictReader()函数返回一个字典,不包含表头,可以通过键名访问!! import csv # with open('1 (2).csv','r') as fp: # reader=csv.reader(fp) # # next(reader) # for x in reader: #