在网页上下载文件时,通常需要人为设定下载文件并选择保持路径,这样就无法实现完全自动的下载过程。下面实现基于firefox浏览器的全自动化文件下载操作:

#encoding=utf-8
from selenium import webdriver
import unittest, time class TestDemo(unittest.TestCase): def setUp(self):
# 创建一个FirefoxProfile实例,用于存放自定义配置
profile = webdriver.FirefoxProfile() #chrome是另外的设置方法
# 指定下载路径,默认只会自动创建一级目录,如果指定了
# 多级不存在的目录,将会下载到默认路径
profile.set_preference('browser.download.dir', 'd:\\iDownload')
# 将browser.download.folderList设置为2,表示将文件下载到指定路径
# 设置成2表示使用自定义下载路径;
# 设置成0表示下载到桌面;设置成1表示下载到默认路径
profile.set_preference('browser.download.folderList', 2)
# browser.helperApps.alwaysAsk.force对于未知的 MIME 类型文件会弹出窗口
# 让用户处理,默认值为true,设定为False表示不会记录打开未知 MIME 类型
# 文件的方式
profile.set_preference("browser.helperApps.alwaysAsk.force", False)
# 在开始下载时是否显示下载管理器
profile.set_preference('browser.download.manager.showWhenStarting',\
False)
# 设定为 False 会把下载框进行隐藏
profile.set_preference("browser.download.manager.useWindow", False)
# 默认值为 true,设定为 False 表示不获取焦点
profile.set_preference("browser.download.manager. focusWhenStarting",\
False)
# 下载.exe文件弹出警告,默认值是 true,设定为False 则不会弹出警告框
profile.set_preference("browser.download.manager.alertOnEXEOpen",\
False)
# browser.helperApps.neverAsk.openFile表示直接打开下载文件,不显示确认框
# 默认值为空字符串,下行代码行设定了多种文件的 MIME类型,
# 例如application/exe,表示.exe类型的文件,
# application/excel表示 Excel 类型的文件
profile.set_preference("browser.helperApps.neverAsk.openFile", \
"application/pdf")
# 对所给出文件类型不再弹出框进行询问,直接保存到本地磁盘
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', \
'application/zip, application/octet-stream')
# browser.download.manager.showAlertOnComplete设定下载文件结束后是否显示下
#载完成提示框,默认为true,设定为False表示下载完成后不显示下载完成提示框
profile.set_preference("browser.download.manager. showAlertOnComplete",\
False);
# browser.download.manager.closeWhenDone设定下载结束后是否自动
# 关闭下载框,默认值为true,设定为False 表示不关闭下载管理器
profile.set_preference("browser.download.manager.closeWhenDone",\
False) # self.driver = webdriver.Ie(executable_path="c:\\IEDriverServer")
# 启动浏览器时,通过firefox_profile参数
# 将自动以配置添加到FirefoxProfile对象中
self.driver = webdriver.Firefox(executable_path="e:\\geckodriver",\
firefox_profile = profile) def test_dataPicker(self):
# 访问WebDriver驱动Firefox的驱动文件下载网址
url1 = "https://github.com/mozilla/geckodriver/releases"
self.driver.get(url1)
# 选择下载zip类型文件,使用application/zip指代此类型文件
self.driver.find_element_by_xpath\
('//strong[.="geckodriver-v0.19.1-arm7hf.tar.gz"]').click()
# 等待加载下载文件
time.sleep(10) # 访问Python2.7.12文件下载页面,下载扩展名为msi文件
# 使用application/octet-stream来指明此类文件类型
url = "https://www.python.org/downloads/release/python-2712/"
self.driver.get(url)
# 找到Python2.7.12下载页面中链接文字为“Windows x86-64 MSI installer”
# 的链接页面元素,点击进行无人工干预的下载Python2.7.12解释器文件
self.driver.find_element_by_link_text\
("Windows x86-64 MSI installer").click()
# 等待文件下载完成,根据各自的网络带宽情况设定等待相应的时间
time.sleep(100) def tearDown(self):
self.driver.quit() if __name__ == '__main__':
unittest.main()

webdriver高级应用- 无人工干预地自动下载某个文件的更多相关文章

  1. selenium3 无人工干预地自动下载某个文件

    一:主要内容 下载效果展示 代码内容展示 saveToDisk不生效说明,即文件没有下载下来解决办法 二:展示效果 1.下载效果展示 用selenium3无人工干预的自动下载该文件到指定路径下,如:D ...

  2. webdriver高级应用- 无人工干预地自动上传附件

    方法一:使用webdriver的send_keys方法上传文件,代码如下: #encoding=utf-8 from selenium import webdriver import unittest ...

  3. IDM下载器添加支持自动下载的文件类型

    不知道各位读者老爷有没有试过IDM下载器的自动下载功能,对于经常需要下载素材资源的朋友来说,一个个的选择图片或者其他什么素材来下载也是够烦的,IDM的自动下载功能可谓是十分好用,而且自动下载+批量下载 ...

  4. webdriver高级应用- 使用Chrome浏览器自动将文件下载到指定路径

    #encoding=utf-8 from selenium import webdriver import unittest, time class TestDemo(unittest.TestCas ...

  5. 【转】Python编程: 多个PDF文件合并以及网页上自动下载PDF文件

    1. 多个PDF文件合并1.1 需求描述有时候,我们下载了多个PDF文件, 但希望能把它们合并成一个PDF文件.例如:你下载的数个PDF文件资料或者电子发票,你可以使用python程序合并成一个PDF ...

  6. C# 利用FTP自动下载xml文件后利用 FileSystemWatcher 监控目录下文件变化并自动更新数据库

    using FtpLib; using System; using System.Collections.Generic; using System.ComponentModel; using Sys ...

  7. yandex 图片自动下载

    yandex 图片自动下载命令行程序 一个在 yandex 上搜索图片并下载到本地的 node cli 程序. 使用帮助: $0 <搜索关键词> [-t=超时(默认 1000)] [-r ...

  8. 【转】Java生成plist下载ipa文件

    我们在上传ipa想要安装的时候必须要通过plist文件去下载,并且还要遵循 itms-services协议. 意思就是,第一步我们要生成一个plist文件, 第二步生成一个html文件,用来指向pli ...

  9. python使用selenium,webdriver自动下载百度网盘内容

    想实现一个自动下载微信公众号分享百度网盘图片链接的爬虫,使用selenium和火狐的webdriver进行完成 1.首先根据自己的浏览器下载相应的webdriver驱动器,python中导入selen ...

随机推荐

  1. 【简记】HTML + CSS 的一些要点(不定时更新)

    1.td占据多行 / 列时,其挤开的 td 不写(但是包裹 td 的 tr 要写) 2. display:td 的元素中的文本默认垂直不居中(table中的td中的文本是垂直居中的) 3.th虽然定义 ...

  2. python读xml文件

    # -*- coding:utf-8 -*- import jsonimport requestsimport os curpath=os.path.dirname(os.path.realpath( ...

  3. winform 配置文件增删改查

    winform 配置文件是  App.config webform   的配置文件 是web.config 其实基本操作都一样    设置个配置文件  全局文件 访问者个配置文件  对这个配置文件增删 ...

  4. JavaScript模板引擎的使用

    为了将数据库中的一组记录转换成HTML输出到界面上,大家都采用哪些做法呢? 在WebForm时代我们经常使用datagrid.repeater,当MVC问世后我们开始直接在视图上编写C#循环语句,而现 ...

  5. UVALive 3983 Robotruck (单调队列,dp)

    如果状态定义为序号和重量的话,决策就是下一个垃圾捡或者不减,但是状态数太多了. 如果只定义序号作为状态的话,决策就变成从前面的某个j一直捡到i才送回垃圾. 这就变成了一个区间选最小值的问题,用单调队列 ...

  6. Codeforces Round #319 (Div. 2) B Modulo Sum (dp,鸽巢)

    直接O(n*m)的dp也可以直接跑过. 因为上最多跑到m就终止了,因为前缀sum[i]取余数,i = 0,1,2,3...,m,有m+1个余数,m的余数只有m种必然有两个相同. #include< ...

  7. python之函数名的应用

    1. 函数名是一个特殊的变量 例题 例题1: a = 1 b = 2 c = a + b print(c) # 输出结果 3 # 总结 # 变量是否可以进行相加或者拼接操作是又后面指向的值来决定的,指 ...

  8. java基础—GUI编程(一)

    一.AWT介绍

  9. Java基础面试操作题: 线程问题,写一个死锁(原理:只有互相都等待对方放弃资源才会产生死锁)

    package com.swift; public class DeadLock implements Runnable { private boolean flag; DeadLock(boolea ...

  10. android 通过adb 和 ndk调试堆栈

    打开终端 , 输入以下命令, armeabi是应用编译好的.so库的路径 adb logcat|ndk-stack -sym ./armeabi/ 如果堆栈报错,会弹出报错内容. 如下: C:\Use ...