写在开头 在之前的三篇文章中,我尝试了使用python爬虫实现的对于特定站点的<剑来>小说的爬取,对于豆瓣的短评的爬取,也有对于爬取的短评数据进行的词云展示,期间运用了不少的知识,现在是时间回顾一下.在此之后,我会再关注一些爬虫框架的使用,以及更多的爬虫的优化方法,争取做到尽量多的吸收新知识,巩固旧知识. 在参考文章爬虫(1)--- Python网络爬虫二三事的基础上,我写了这篇文章. 这篇文章主要的目的有两个,收集新知识,巩固旧知识. 关于爬虫背后的(这一节是主要是http的概要,下一节是我…