版本1.5 本次简单添加了四路多线程(由于我电脑CPU是四核的),速度飙升.本想试试xPath,但发现反倒是多此一举,故暂不使用 #-*- coding:utf-8 -*- import re,urllib,os,urllib2,chardet,requests,time from multiprocessing.dummy import Pool def urllink(link): #网页HTML获取以及编码转换 html_1 = urllib2.urlopen(link,timeout=1…