很多人学习python,爬虫入门,在python爬虫中,有很多库供开发使用. 用于请求的urllib(python3)和request基本库,xpath,beautiful soup,pyquery这样的解析库.其中xpath中用到大量的正则表示式,对于新手来说,写正则很容易出错,在这里,从beautiful soup开始说. from beautiful_soup.constant import HTML_TEXT from bs4 import BeautifulSoupsoup = Bea…