用python写爬虫呢,最常见的过滤方式有BeautifulSoup, css selector, XPath, 如果使用前两个,BeautifulSoup包就能解决,然而使用XPath,就要引入lxml包了. 接下来我以我的博客为例,教大家怎么使用XPath. 我们要做什么: 关于XPath, 网上有诸多语法教程,我不再详细介绍. 我们要抓取的是 http://www.cnblogs.com/chenyansu/ 中第三篇文章,7月15日的文章的简介,它在网页中显示为这样的: 在chrome浏…