这里主要是做一个关于数据爬取以后的数据解析功能的整合,方便查阅,以防混淆 主要讲到的技术有Xpath,BeautifulSoup,PyQuery,re(正则) 首先举出两个作示例的代码,方便后面举例 解析之前需要先将html代码转换成相应的对象,各自的方法如下: Xpath: In [7]: from lxml import etree In [8]: text = etree.HTML(html) BeautifulSoup: In [2]: from bs4 import Beautiful