异常处理 作为爬虫的抓取过程基本就那么多内容了,后面再将一些正则表达式的东西简单介绍一下基本就完事了,下面先说说异常处理的方法.先介绍一下抓取过程中的主要异常,如URLError和HTTPError. URLError可能产生的原因主要有:网络无连接,即本机无法上网:连接不到特定的服务器:服务器不存在等.如下所示: 错误代号是11004,错误原因是getaddrinfo failed.这类错误相对来说比较少,理由是在我们抓取网页时,一般都会人工通过浏览器访问一遍,而最为常见的是HTTPError…