最近做了一个项目,要求获取各大主流网页上的关键信息,本人以前了解过网页爬虫的知识,所以想到了网页爬虫了实现功能 第一次尝试: 采用webclient获取远程网页的内容,然后采用正则表达式进行过滤 但,由于正则表达式对我来说,书写起来比较复杂,研究个大半个月,一点进展都没有,每天看着正则表达式像看天书(回头需要向正则牛逼的人请教一下) 第一次尝试失败,项目马上就要验收了,这个功能一直卡壳了,,,,,,,, 突然有一次,在网上看到了有人提及到了HtmlAgilityPack这个开源的工具包,本想着试