md 弄了一天了……(这个月不会在摸爬虫了,浪费生命) 进入正题: 起初是想写一个爬虫来爬一个网站的视频,但是怎么爬取都爬取不到,分析了下源代码之后,发现源代码中并没有视频的dom 但是在浏览器检查元素的时候又是有的,这就让我很难过了 百度了一大天,发现是因为普通方法获取的只是服务器端本地的静态资源,也就是第一手资源 而浏览器检查元素的资源是经过js渲染后的代码 所以就要想办法去获得渲染后的代码 在看了若干个帖子之后……外加上一个httpclient课程和另一个htmlunit课程…… 终于,在