利用scrapy框架抓取腾讯的招聘信息,爬取地址为:https://hr.tencent.com/position.php 抓取字段包括:招聘岗位,人数,工作地点,发布时间,及具体的工作要求和工作任务 最终结果保存为两个文件,一个文件放前面的四个字段信息,一个放具体内容信息 1.网页分析 通过网页源码和F12显示的代码对比发现,该网页属于静态网页. 可以采用xpath解析网页源码,获取tr标签下的相关内容,具体见代码部分. 2.编辑items.py文件 通过scrapy startproject…