声明:本文为原创,转载请注明出处 本文总共三章,前面两章废话吐槽比较多,想看结果的话,直接看第三章(后续会更新,最近忙着毕设呢,毕设也是我自己做的,关于射频卡的,有时间我也放上来,哈哈). 一,系统总体结构 首先吐槽一下,标题取得好水,原谅我是一枚耿直的工科男.系统框图如下所示,简单看一下,对整体有个把握,总体由4个部分组成 上图中,装载URL队列的是先进先出的队列,整个爬虫系统的设计就是基于宽度优先遍历的原则设计的.所以,对于执行整个下载任务的引擎而言,它只是启动一个线程池,然后机械的从队列里…