selenium操作下拉滚动条的几种方法

数据采集中，经常遇到动态加载的数据，我们经常使用selenium模拟浏览器操作，需要多次下拉刷新页面才能采集到所有的数据，就此总结了几种selenium操作下拉滚动条的几种方法
我这里演示的是Java版本的,使用chromedriver，当然你可以换成python或其他语言，浏览器用firefox或者phantomjs(无头浏览器)，大部分都是适用的，不同浏览器有略微的差异。

初始化一个浏览器

首先要允许浏览器运行js脚本

DesiredCapabilities sCaps = new DesiredCapabilities();

sCaps.setJavascriptEnabled(true);

System.getProperties().setProperty("webdriver.chrome.driver", "D:/tool/chromedriver.exe");

WebDriver webDriver  = new ChromeDriver(sCaps);

1.直接操作页面

#下拉到页面底部

((JavascriptExecutor) webDriver).executeScript("window.scrollTo(0,document.body.scrollHeight)");

#上拉到页面顶端

((JavascriptExecutor) webDriver).executeScript("window.scrollTo(document.body.scrollHeight,0)");

或：

#下拉到页面1000位置

((JavascriptExecutor) webDriver).executeScript("window.scrollTo(0,1000)");

#上拉到页面顶端 0,0位置

((JavascriptExecutor) webDriver).executeScript("window.scrollTo(0,0)");

2.拖动到页面元素位置

经过测试这种方式最靠谱，在Chrome和phantomjs都测试通过，而其他方式有些网站在Chrome中没问题，但到了phantomjs中就有问题了，页面根本不动。
不过这几种方式对大部分网站应该还是都可以的。

比如要把页面拖动到id为test的元素位置，当然findElement方法还支持xpath和css选择器等多种方式

String script = "return arguments[0].scrollIntoView();";

WebElement element = webDriver.findElement(By.id("#test"));

((JavascriptExecutor) webDriver).executeScript(script, element);

3. 发送PAGE_DOWN、END等键盘事件

END：可以让页面直接下拉到底
HOME：上拉到顶端
PAGE_DOWN：小幅度下拉

org.openqa.selenium.Keys 模块中常用的变量属性含义

Keys.DOWN, Keys.UP, Keys.LEFT,Keys.RIGHT 键盘箭头键
Keys.ENTER, Keys.RETURN 回车和换行键
Keys.HOME, Keys.END,
Keys.PAGE_DOWN,Keys.PAGE_UP
Home 键、End 键、PageUp 键和Page Down 键
Keys.ESCAPE, Keys.BACK_SPACE,Keys.DELETE Esc、Backspace 和字母键
Keys.F1, Keys.F2, . . . , Keys.F12 键盘顶部的F1 到F12 键
Keys.TAB Tab 键
...

WebElement webElement = webDriver.findElement(By.cssSelector("body"));

                webElement.click(); // 有的时候必须点击一下，下拉才能生效（有的网站是这样，原因未找到）

#小幅度下拉

                webElement.sendKeys(Keys.PAGE_DOWN);

#或者直接下拉到底

              webElement.sendKeys(Keys.END);

查看源码可以看出来，selenium封装了键盘上的Key，意思是我们可以通过sendKeys发送键盘事件，比如搜索的时候点击ENTER事件

public enum Keys implements CharSequence {

    NULL('\ue000'),

    CANCEL('\ue001'),

    HELP('\ue002'),

    BACK_SPACE('\ue003'),

    TAB('\ue004'),

    CLEAR('\ue005'),

    RETURN('\ue006'),

    ENTER('\ue007'),

    SHIFT('\ue008'),

    LEFT_SHIFT(SHIFT),

    CONTROL('\ue009'),

    LEFT_CONTROL(CONTROL),

    ALT('\ue00a'),

    LEFT_ALT(ALT),

    PAUSE('\ue00b'),

    ESCAPE('\ue00c'),

    SPACE('\ue00d'),

    PAGE_UP('\ue00e'),

    PAGE_DOWN('\ue00f'),

    END('\ue010'),

    HOME('\ue011'),

    LEFT('\ue012'),

    ARROW_LEFT(LEFT),

    UP('\ue013'),

    ARROW_UP(UP),

    RIGHT('\ue014'),

    ARROW_RIGHT(RIGHT),

    DOWN('\ue015'),

    ARROW_DOWN(DOWN),

    INSERT('\ue016'),

    DELETE('\ue017'),

    SEMICOLON('\ue018'),

    EQUALS('\ue019'),

    NUMPAD0('\ue01a'),

    NUMPAD1('\ue01b'),

    NUMPAD2('\ue01c'),

    NUMPAD3('\ue01d'),

    NUMPAD4('\ue01e'),

    NUMPAD5('\ue01f'),

    NUMPAD6('\ue020'),

    NUMPAD7('\ue021'),

    NUMPAD8('\ue022'),

    NUMPAD9('\ue023'),

    MULTIPLY('\ue024'),

    ADD('\ue025'),

    SEPARATOR('\ue026'),

    SUBTRACT('\ue027'),

    DECIMAL('\ue028'),

    DIVIDE('\ue029'),

    F1('\ue031'),

    F2('\ue032'),

    F3('\ue033'),

    F4('\ue034'),

    F5('\ue035'),

    F6('\ue036'),

    F7('\ue037'),

    F8('\ue038'),

    F9('\ue039'),

    F10('\ue03a'),

    F11('\ue03b'),

    F12('\ue03c'),

    META('\ue03d'),

    COMMAND(META),

    ZENKAKU_HANKAKU('\ue040');

    private final char keyCode;

...

}

一个完整的示例

public class SeleniumTest {

    public static void main(String[] args) throws Exception {

        System.setProperty("webdriver.chrome.driver", "D:/tool/chromedriver.exe");

        WebDriver webDriver = new ChromeDriver();

        webDriver.get("https://m.weibo.cn/");

        Thread.sleep(1000);

        for (int i = 0; i < 10; i++) {

            System.out.println("sleep 1s");

            Thread.sleep(1000);

            ((JavascriptExecutor) webDriver).executeScript("window.scrollTo(0,"+(i * 500)+")");

        }

    }

}

作者：LI木水
链接：https://www.jianshu.com/p/3c6840ccf17d
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

selenium操作下拉滚动条的几种方法的更多相关文章

python中selenium操作下拉滚动条方法汇总
UI自动化中经常会遇到元素识别不到,找不到的问题,原因有很多,比如不在iframe里,xpath或id写错了等等:但有一种是在当前显示的页面元素不可见,拖动下拉条后元素就出来了. 比如下面这样一个网页 ...
python中selenium操作下拉滚动条方法
场景:在当前显示的页面元素不可见,拖动下拉条后元素就出来了. 解决方法: 在python中有几种方法解决这种问题,简单介绍下,给需要的人: 方法一)使用js脚本直接操作,方法如下: #将页面滚动条拖到 ...
[Selenium2+python2.7][Scrap]爬虫和selenium方式下拉滚动条获取简书作者目录并且生成Markdown格式目录
预计阅读时间: 15分钟环境: win7 + Selenium2.53.6+python2.7 +Firefox 45.2 (具体配置参考 http://www.cnblogs.com/yoyok ...
selenium 操作下拉处理
操作下拉框处理在网页中,有时候会遇到下拉框处理,这时候使用Webdriver提供的select类来处理. ##操作下拉框处理 #coding = utf-8 from selenium import ...
『心善渊』Selenium3.0基础 — 13、Selenium操作下拉菜单
目录 1.使用Selenium中的Select类来处理下拉菜单(推荐) 2.下拉菜单对象的其他操作(了解) 3.通过元素二次定位方式操作下拉菜单(重点) (1)了解元素二次定位 (2)示例: 页面中的 ...
吾八哥学Selenium(四)：操作下拉框select标签的方法
我们在做web页面自动化测试的时候会经常遇到<select></select>标签的下拉框,那么在Python里如何实现去操作这种控件呢?今天就给大家分享一下这个玩法.为了让大 ...
selenium操作下拉选和网页提示框
import time from selenium import webdriver from selenium.webdriver.support.select import Select#处理下拉 ...
Excel设置数据有效性实现单元格下拉菜单的3种方法(转）
http://blog.csdn.net/cdefu/article/details/4129136 一.直接输入: 1.选择要设置的单元格,譬如A1单元格: 2.选择菜单栏的“数据”→“有效性”→出 ...
CSS实现下拉菜单的几种方法
PS:转自https://www.cnblogs.com/yewenxiang/p/6064117.html 第一种:display:none和display:block切换 1 <!DOCTY ...

随机推荐

Linux磁盘管理——BIOS和UEFI
参考:BIOS and UEFI - CompTIA A+ 220-901 - 1.1 BIOS and UEFI As Fast As Possible 严格上来说BIOS和UEFI除了在搜索boo ...
使用Cloudera Manager搭建Impala环境
使用Cloudera Manager搭建Impala服务作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用CM安装Imapala 1>.进入CM的服务安装向导 2> ...
mysql 登录报错
执行命令:mysql -u root -p 错误:error while loading shared libraries: libncurses.so.5: cannot open shared o ...
2013.5.21 - KDD第三十三天
实验室例会,上到一半之后发现今天下午第二节课是Android,上次两节Android都没跟中秋碰头,这次又不能碰头了,然后就赶紧给中秋发了个短信,说我在开会,晚上约个时间再谈.正好也称这一下午加一晚 ...
Sharding-JDBC（二）2.0.3版本实践
目录一.Sharding-JDBC依赖二.分片策略 1. 标准分片策略 2. 复合分片策略 3. Inline表达式分片策略 4. 通过Hint而非SQL解析的方式分片的策略 5. 不分片的策略 ...
《hello-world》第九次团队作业：【Beta】Scrum meeting 1
项目内容这个作业属于哪个课程 2016级计算机科学与工程学院软件工程(西北师范大学) 这个作业的要求在哪里实验十三团队作业9:Beta冲刺与团队项目验收团队名称 <hello--wor ...
《代码敲不队》第九次团队作业：Beta冲刺第3天
项目内容这个作业属于哪个课程任课教师博客主页链接这个作业的要求在哪里作业链接地址团队名称代码敲不队作业学习目标 (1)项目文档的完善与整理:(2)团队项目总结陈述PPT编制:(3)符合 ...
js计算两个时间差
时间格式 time:'2018-04-26 15:49:00'需要转换为time:'2018/04/26 15:49:00' 使用time.replace(/\-/g, "/") ...
.net框架-栈（Stack）
栈(Stack) 栈代表一个后进先出的集合栈元素为Object类型 .net框架提供Stack<T>泛型栈类压栈(Push)和出栈(Pop)是栈的基本操作,压栈入栈顶,出栈也出栈顶. ...
Linux 系统 Composer 安装
Composer 是个包管理工具在项目中使用它会很方便本文中用 PHP 安装 1.下载安装执行命令 curl -sS https://getcomposer.org/installer | ph ...