网络是十分复杂的.网页数据格式不友好,网站服务器宕机,目标数据的标签找不到,都 是很麻烦的事情.网络数据采集最痛苦的遭遇之一,就是爬虫运行的时候你洗洗睡了,梦 想着明天一早数据就都会采集好放在数据库里,结果第二天醒来,你看到的却是一个因某 种数据格式异常导致运行错误的爬虫,在前一天当你不再盯着屏幕去睡觉之后,没过一会 儿爬虫就不再运行了.那个时候,你可能想骂发明互联网(以及那些奇葩的网络数据格 式)的人,但是你真正应该斥责的人是你自己,为什么一开始不估计可能会出现的异常! html = urlo…