selenium相关：通过location 和 size 获取元素所在像素位置和尺寸，截取图片ROI

1.实验

    #https://captcha.luosimao.com/demo/

    chrome

        default：

                location 不滚动，直接返回相对整个html的坐标  {'x': 15.0, 'y': 129.0}

                location_once_scrolled_into_view 返回相对可视区域的坐标（改变浏览器高度，可以观察到底部元素底部对齐后y的变化）

                                                        顶部/底部元素 完全可见不滚动，{u'x': 15, u'y': 60}

                                                        顶部元素部分可见或完全不可见都会滚动到 顶部对齐  {u'x': 15, u'y': 0}  account-wall

                                                        底部元素部分可见或完全不可见都会滚动到 底部对齐  {u'x': 15, u'y': 594} theme-list

        frame：

            location 不滚动，直接返回相对frame即当前相应内层html的坐标{'x': 255.0, 'y': 167.0}  captcha_frame 的 lc-refresh

            location_once_scrolled_into_view 返回相对可视区域的坐标

                                                        完全可见不滚动{u'x': 273, u'y': 105}

                                                        部分可见或完全不可见滚动到 顶部对齐  {u'x': 273, u'y': 0}

    firefox

        default:

            顶部元素 底部元素

                location 不滚动，直接返回相对整个html的坐标 {'x': 15.0, 'y': 130.0}  {'x': 15.0, 'y': 707.0}

                location_once_scrolled_into_view 返回相对可视区域的坐标（y=1足以说明）

                                    可见不可见 都滚动到顶部对齐 {'x': 15.0, 'y': 1.0} {'x': 15.0, 'y': 1.0}

                                        如果下拉条直到底部，底部元素仍然无法顶部对齐 {'x': 15.0, 'y': 82.0}

        frame：

            location 不滚动，都是相对frame即当前相应html的坐标{'x': 255.0, 'y': 166.0}

            location_once_scrolled_into_view 可见不可见都会滚动到顶部对齐，（'y'依旧是166.0）

                                                结果也是相对frame即当前相应html的坐标{'x': 255.0, 'y': 166.0}

2.总结

location
    始终不滚动，返回相对整个html或者对应frame的坐标
location_once_scrolled_into_view
    chrome完全可见不滚动，firefox始终会滚动；而且chrome底部元素会底部对齐，其余情况两者都是顶部对齐。
    一般返回相对可视区域坐标，但是firefox的frame依旧返回相对frame的坐标

3.应用

对浏览器可视区域截图后，截取某一frame的pic roi

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

from PIL import Image
import numpy as np

WebDriverWait(driver, 5).until(lambda x: x.find_element_by_id('captcha_frame'))

driver.switch_to.frame('captcha_frame')

WebDriverWait(driver, 5).until(lambda x: x.find_element_by_xpath('//div[@class="captcha-list"]/div[last()]').is_displayed())  # 通过拼图的最后一块确认图片roi加载完毕

driver.switch_to.default_content()     #处于frame截图，chrome为可视区域，firefox为当前frame，所以统一到default

driver.execute_script("window.scrollTo(0,0)")

driver.save_screenshot(pic1_path) 

# 无论元素是否在可视区域，滚动条始终不动，返回相对整个html或者对应frame的坐标 {u'y': 225, u'x': 13}

captcha_frame_abs_xy = driver.find_element_by_id('captcha_frame').location

# 通过size确认roi的尺寸 {'height': 160, 'width': 300} 
elem_roi_full = driver.find_element_by_class_name('captcha-list')
roi_size_wh = elem_roi_full.size

# 读取图形，灰度处理，转为numpy array
pic = Image.open(pic1_path)
pic_gray = pic.convert('L')    
pic_array = np.array(pic_gray)

# 截取pic roi，注意pic_array.shape为(h,w)，firefox取得的location和size为小数 
pic_array = pic_array[int(captcha_frame_abs_xy['y']) : int(captcha_frame_abs_xy['y']+roi_size_wh['height']), 
                            int(captcha_frame_abs_xy['x']) : int(captcha_frame_abs_xy['x']+roi_size_wh['width'])]

# 通过阈值二值化
pic_array = np.where(pic_array==255,255,0)
Image.fromarray(pic_array).save(pic_bilevel_path)

selenium相关：通过location 和 size 获取元素所在像素位置和尺寸，截取图片ROI的更多相关文章

Python+Appium自动化测试(11)-location与size获取元素坐标
appium做app自动化测试过程中,有时需要获取控件元素的坐标进行滑动操作.appium中提供了location方法获取控件元素左上角的坐标,再通过size方法获取控件元素的宽高,就可以得到控件元素 ...
原生js获取元素的各种位置(大全）
加给元素: offsetLeft (距离定位父级的距离) offsetTop (距离定位父级的距离) offsetWidth (可视宽度) offsetHeight (可视高度) clientLeft ...
详细解析 JavaScript 获取元素的坐标
引言最近突然看到了有关图片懒加载的问题,大致意思就是初始状态下页面只加载浏览器可视区域的图片,剩余图片在当浏览器可视区域滚动到其位置时才开始加载.貌似现在许多大型网站都有实现懒加载,所以我便就此问题 ...
selenium自动化之js处理滚动条和元素聚焦
selenium并不是万能的,有时候页面上操作无法实现的,这时候就需要借助JS来完成了. 当我们页面上的元素超过一屏后,想操作屏幕下方的元素,是不能直接操作的,会报元素不可见异常的.这时候需要借助滚动 ...
jquery获取元素在文档中的位置信息以及滚动条位置（转）
jquery获取元素在文档中的位置信息以及滚动条位置 http://blog.csdn.net/qq_34095777/article/details/78750886 原文链接原创 201 ...
获取元素位置信息和所占空间大小(via:js&jquery)
工作中有一个很常见的需求,hover或者click某元素后,在该元素旁边出现弹框,主要就是获取该元素的位置坐标以及元素所占区块的大小.最近工作中就遇到了,发现js和jquery的实现方法有很大的区别, ...
获取元素在页面中位置 getBoundingClientRect()
DOM 原生方法getBoundingClientRect()获取元素相对视口位置 DOMRect 对象包含了一组用于描述边框的只读属性--left.top.right和bottom,单位为像素.除了 ...
如何在 Windows Phone 8 中获取手机的当前位置
原文如何在 Windows Phone 8 中获取手机的当前位置适用于:仅限于 Windows Phone 8. 本主题演示如何使用 Windows Phone 位置 API 确定手机的当前位置. ...
selenium获取元素
1.获取窗口titledriver.title2.获取urldriver.current_url3.获取窗口截图driver.get_screenshot_as_file('window.png')4 ...

随机推荐

Openssl源代码整理学习---含P7/P10/P12说明
声明:建议结合Openssl源代码学习: 一.基础知识 1.Openssl 简史 OpenSSL项目是加拿大人Eric A.Yang 和Tim J.Hudson开发,现在有Openssl项目小组负责改 ...
mysql 5.6 windows 启动脚本
2018-4-25 17:02:08 星期三下载mysql 5.6 zip(免安装版)到本机一台电脑上可能装有多个版本的mysql, 启动时为了不影响: 1. 解压后文件夹根目录改名为 mysql ...
T-SQL删除存储过程
使用T-SQL脚本删除存储过程语法: --声明数据库引用use 数据库名称;go --判断是否存在存储过程,如果存在则删除if exists(select * from sys.procedures ...
awk简单用法-（1）
一.awk基本操作 awk指定多个分割符,分隔符中有:和空格,还有:和空格的组合,这个时候需要指定多个分隔符 -F'[ :]+',[ :]表示分隔符为:和空格,一个或者多个+号表示空格和:的组合也为一 ...
android系统下消息推送机制
一.推送方式简介: 当前随着移动互联网的不断加速,消息推送的功能越来越普遍,不仅仅是应用在邮件推送上了,更多的体现在手机的APP上.当我们开发需要和服务器交互的应用程序时,基本上都需要获取服务器端的数 ...
css3 自定义滚动条样式
::-webkit-scrollbar :滚动条整体部分 ::-webkit-scrollbar-thumb :滚动条里面的小方块样式 ::-webkit-scrollbar-track 滚动条的轨道 ...
一篇文章让你了解Android各个版本的历程
2008年--至今 Android 1.5(Cupcake纸杯蛋糕): 智能虚拟键盘:使用widgets实现桌面个性化:在线文件夹(Live Folder)快速浏览在线数据:视频录制和分享:图片上传: ...
Confluence 6 查看一个任务的执行历史
希望查看一个计划任务最后运行的时间和这个计划任务最后一次运行花费了多长时间.单击计划任务边上的历史(History )连接. 如果一个计划任务从来没有运行的胡啊,那么这个历史的链接是不会显示的. 屏 ...
Confluence 6 从站点首页集中访问面板
如果你选择设置一个页面为你的站点主页面,但是你还是希望你的用户能够访问 Confluence 的主面板,你可以将主面板的连接添加到应用导航(Application Navigator)中. 希望添加 ...
python - 发送html格式的邮件
import smtplibfrom email.mime.multipart import MIMEMultipartfrom email.mime.text import MIMETextfrom ...