Python + Selenium 实现对页面的指定元素截图(可截长图元素)【转载】

先在首页上执行一段 JavaScript 脚本，将页面的滚动条拖到最下方，然后再拖回顶部，最后才截图。这样可以解决那种按需加载图片的情况

以下代码为转载别处博客改造后的，有chrome和ff两种浏览器。

由于webdriver.chrom只能截取当前页面图片，不能截取整个网页图片，因此额外使用webdriver.PhantomJS，需要下载PhantomJS，将PhantomJS.exe放到python的script目录下

from selenium import webdriver

import time

def capture(browser_name,url,save_fn):

  #save_fn = save_fn + ".png"

  save_fn = url.split("://")[1].replace('/',' ') + ".png"

  #print save_fn

  if browser_name == 'firefox' or browser_name == 'Firefox' or browser_name == 'ff':

    driver = webdriver.Firefox()

    driver.maximize_window()

  elif browser_name == 'chrome' or browser_name == 'Chrome':

    #options = webdriver.chrome.options.Options()

    #options.add_argument("--start-maximized")

    #driver = webdriver.Chrome(chrome_options=options)

    driver = webdriver.PhantomJS()

    driver.maximize_window()

  else:

    raise AssertionError("browser name is error,firefox/Firefox/ff/chrome/Chrome")

  driver.get(url) # Load page

  driver.execute_script("""

    (function () {

      var y = 0;

      var step = 100;

      window.scroll(0, 0);

      function f() {

        if (y < document.body.scrollHeight) {

          y += step;

          window.scroll(0, y);

          setTimeout(f, 50);

        } else {

          window.scroll(0, 0);

          document.title += "scroll-done";

        }

      }

      setTimeout(f, 1000);

    })();

  """)

  for i in xrange(30):

    if "scroll-done" in driver.title:

      break

    time.sleep(1)

  driver.save_screenshot(save_fn)

  driver.close()

if __name__ == "__main__":

  capture("ff","https://www.cnblogs.com/yes123/p/5279843.html")

Python + Selenium 实现对页面的指定元素截图(可截长图元素)【转载】的更多相关文章

利用 Python + Selenium 实现对页面的指定元素截图(可截长图元素)
对WebElement截图 WebDriver.Chrome自带的方法只能对当前窗口截屏,且不能指定特定元素.若是需要截取特定元素或是窗口超过了一屏,就只能另辟蹊径了. WebDriver.Phant ...
Python+Selenium自动化-定位页面元素的八种方法
Python+Selenium自动化-定位页面元素的八种方法本篇文字主要学习selenium定位页面元素的集中方法,以百度首页为例子. 0.元素定位方法主要有: id定位:find_elemen ...
Python+Selenium自动化-获取页面信息
Python+Selenium自动化-获取页面信息 1.获取页面title title:获取当前页面的标题显示的字段 from selenium import webdriver import t ...
selenium截屏操作(也支持截长图)
1.常用的可能是谷歌和火狐做自动化在抛异常的时候可以截屏保存 from selenium import webdriver br=webdriver.Chrome() br.maximize_wind ...
Python+Selenium中级篇之8-Python自定义封装一个简单的Log类《转载》
Python+Selenium中级篇之8-Python自定义封装一个简单的Log类: https://blog.csdn.net/u011541946/article/details/70198676
Python+selenium点击网页上指定坐标
from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains dr = ...
python selenium 多个页面对象类使用同一个webdriver（即只打开一个浏览器窗口）
1 class BasePage(): 2 """selenium基类""" 3 4 def __init__(self, driver=N ...
[Chrome Headless + Python] 截长图（Take Full-page Screenshot）
# -*- coding: utf-8 -*- import time import os from selenium import webdriver from selenium.webdriver ...
Python selenium根据class定位页面元素
在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的.但是实际工作中,很多前端开发人员并未给每个元素都编写id属性.通常一段html代码如下: <div cl ...

随机推荐

解决Windows远程桌面连接每次都提示输入密码的问题，远程桌面记不住密码
FROM:http://www.veryhuo.com/a/view/80444.html Windows 远程桌面连接几乎每天都用,所以使用的方便性非常重要.如果你经常用,也许会发现在某些系统中,每 ...
Docker+Nginx部署Angular
在部署Angular生产环境之前,需要电脑已经安装docker. 添加Dockerfile在已经完成的Angular项目的项目根目录下添加Dockerfile文件. Dockerfile文件内容: F ...
java多线程找素数实例
package ltb20180106; public class FindPrime implements Runnable{ private int prime; private int q; p ...
spring AOP的学习
1.Spring常用的概念 Joinpoint(连接点): 所谓连接点是指那些被拦截到的点.在spring中,这些点指的是方法,因为spring只支持方法类型的连接点. Pointcut(切入点): ...
python+selenium自动化软件测试（第3章）：unittes
From: https://blog.csdn.net/site008/article/details/77622472 3.1 unittest简介前言 (python基础比较弱的,建议大家多花点 ...
解决socket交互的10048和10055错误的总结
问题:60多路轮训的情况下,5分钟之后,现场报链接不上子进程的错误.绝大部分为海康设备分析: 子进程的日志中存在输入海康的解码库的错误,在子进程的对外dll中加日志发现,socket链接的时候 ...
bzoj4980: 第一题
Description 神犇xzyo听说sl很弱,于是出了一题来虐一虐sl.一个长度为2n(可能有前缀0)的非负整数x是good的,当且仅当存在两个长度为n(可能有前缀0)的非负整数a.b满足a+b ...
Android开发教程之【环境搭建及HelloWorld】（转载）
引言本系列适合0基础的人员,因为我就是从0开始的,此系列记录我步入Android开发的一些经验分享,望与君共勉!作为Android队伍中的一个新人的我,如果有什么不对的地方,还望不吝赐教. 在开始A ...
java设计模式-工厂系列
一.简单工厂 1.背景: 任意定制交通工具的类型和生产过程代码: Moveable.java package com.cy.dp.factory; public interface Moveable ...
廖雪峰Java4反射与泛型-3范型-4擦拭法
1.擦拭法是Java泛型的实现方式. 编译器把类型视为Object. * 泛型代码编译的时候,编译器实际上把所有的泛型类型T统一视为Object类型.换句话说,虚拟机对泛型一无所知,所有的工作都是编译 ...

Python + Selenium 实现对页面的指定元素截图(可截长图元素)【转载】

Python + Selenium 实现对页面的指定元素截图(可截长图元素)【转载】的更多相关文章

随机推荐

热门专题