通过使Scrapy框架,进行数据挖掘和对web站点页面提取结构化数据,掌握如何使用Twisted异步网络框架来处理网络通讯的问题,可以加快我们的下载速度,也可深入接触各种中间件接口,灵活的完成各种需求,使得我们的爬虫更强大.更高效. 熟悉掌握基本的网页和url分析,同时能灵活使用Xmind工具对Python爬虫程序(网络爬虫)流程图进行分析.同时,使用Weka 3.7工具,对所获取得到的数据进行数据挖掘分析操作. 一.项目分析 本次的实验内容要求使用scrapy框架,爬取腾讯招聘官网中网页(ht…