scrapy抓取一些需要js加载页面时一般要么是通过接口直接获取数据,要么是js加载,但是我通过selenium也可以获取动态页面 但是有个问题,容易给反爬,因为在scrapy中间件mid中使用selenium的ip不会跟着你在中间件中切换的ip变化,还是使用本机的ip在访问网站, 这里通过 确定网页url进行过滤,什么网页使用selenium,什么使用scrapy自带的抓取, 为selenium单独设置一个获取ip的办法,当然也可以使用全局变量 from selenium import web