BeautifulSoup4库 和lxml一样,Beautiful Soup也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML数据.lxml只会局部遍历,而Beautiful Soup是基于HTMLDOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml.BeautifulSoup用未解析HTML比较简单,AP非常人性化,支持CSS选择器.Python标准库中的HTML解析器,也支持lxml的XML解析器.Beautiful…