参考:http://blog.csdn.net/wgyscsf/article/details/53454910 概述 在爬虫过程中,一般情况下都是直接解析html源码进行分析解析即可.但是,有一种情况是比较特殊的:网页的数据采用异步加载的,比如ajax加载的数据,在我们“查看网页源代码”是查看不到的.采用常规的爬虫这一块是解析不到的. 第一种解决方案是采用一些第三方的工具,模拟浏览器的行为,去加载数据.比如:Selenium.PhantomJs. 优点:不必考虑动态页面的各种变化多端(无论动态…