简单的自动化使用--使用selenium实现学习通网站的刷慕课程序。注释空格加代码大概200行不到
简单的自动化使用--使用selenium实现学习通网站的刷慕课程序。注释空格加代码大概200行不到
相见恨晚啊
github地址
环境Python3.6 + pycharm + chrom浏览器 + chromdriver
依赖库selenium,time,random
- selenium实现自动化控制浏览器
- time和random设置随机的停留时间,使程序更像是人类在控制。
基本思想:使用Python中的selenium库来控制chrom浏览器来刷慕课,而且是模拟人类点击物理,相当于物理外挂。
1.实现模拟登录,选择省份,学校,输入账号,密码,以及验证码。
- 使用selenium库来定义一个chrom实例driver。
- 使用driver来进入登录网址
- 使用driver的findelementby_xpath方法来选取省份,学校(这个因个人而不同的,程序里面是需要更改的。
1.1点击选择单位按钮,会出现各省份和个学校的列表
1.2.右击你所在的省份,点击检查(这里以河南的洛阳理工为例),右侧光标会定位在你所在省份的标签列,
1.3.右击标签-->copy--->copy xpath
1.4.把copy之后的代码复制到从github下载下来的第十四行代码中,即
# 点击河南
henan = driver.find_element_by_xpath('要复制的地方')
henan.click()
1.5.选择学校,点击左侧列表中的河南,在右侧找到你所在的学校,右击学校点击检查
1.6.在右侧会光标会显示在你所在学校的标签中,右击--->copy-->copy xpath
1.7把复制的代码粘贴到从github下载下来的第22行
# 点击洛阳理工
louyang = driver.find_element_by_xpath('要复制的地方')
louyang.click()
1.8接下来还要修改的代码部分是你要刷的那个慕课的网址,请确保是下面这个图中的url链接
1.9把整个url复制下来之后要替换的是从github下载下来的代码中的第45行代码,把url复制到下面要替换的位置
# 得到慕课网址
get_url = '要替换的地方网址'
driver.get(get_url)
time.sleep(5)
2.接下来就是运行程序,输入自己的账号密码和网页中的验证码。程序就可以跑起来了,就可以实现物理外挂来刷课。
如果只是想使用这个程序的话,上面的就已经够用了。下载github代码,修改省份,学校,和慕课网址运行程序就可以开启物理外挂来刷慕课了。如果想和我一起来维护这个程序的话,可以看下面的讲解,进一步了解这一程序的运行原理。
3.接下来就是重点,程序实现的原理。首先获取一共有多少个章节,遍历章节,处理网络不稳定,换公网,点击播放按钮,处理答题细节,处理打完题的情况。
3.0 播放器的html代码是在页面下面的ifram中的ifram中的hml代码里面要使用driver的switch_to.frame方法来切换到ifram中去。
- 代码处理
# 切换到下面的iframe里
try:
driver.switch_to.frame(driver.find_element_by_xpath('//body/div/div/p/div/iframe'))
except:
driver.switch_to.frame(driver.find_element_by_xpath('//body/div/div/p/span/div/iframe'))
3.1找到所有的章节标签遍历。
所有的章节都在//*[@id="coursetree"]/div里面,使用driver的findelementsby_xpath方法来找到所有标签,获取标签数量,并遍历
3.1从html代码中发现每一个大章节的第一个标签和其他标签不一样,第一章节是在//[@id="coursetree"]/div/div中,而下面的章节是在//[@id="coursetree"]/div中比第一章节少了一个div。可以使用try-except语句来处理先获取点击第一章节或第二章节的标签,出现异常再点击另一个按钮,这个方法可以完美的处理遍历章节中使每一个都可以遍历到
下面是章节不一样的图
下面是处理的代码
# 点击章节
try:
driver.find_element_by_xpath('//*[@id="coursetree"]/div[' + str(i + 1) + ']').click()
except:
driver.find_element_by_xpath('//*[@id="coursetree"]/div[' + str(i + 1) + ']/div').click()
3.2点击播放按钮,播放按钮到目前位置发现有两种一种是直接在视频框里面的,另一种要先点击视频切换到视频框,在点击播放按钮。
- 下面是第一种情况直接就可以点击播放按钮
- 下面是第二种情况,要先点视频,再点击播放按钮
- 下面是处理这两种情况的处理逻辑
# 找到播放按钮并点击
try:
button = driver.find_element_by_xpath('//*[@id="reader"]')
button.click()
except:
driver.find_element_by_xpath('//*[@id="dct2"]').click()
driver.find_element_by_xpath('//*[@id="reader"]').click()
3.3处理网络问题,有时候使用本校的网是不行的,会出现网络不佳的问题,所有要使用代码来直接切换到公网按钮,使用代码先点击本校按钮,再点击公网2按钮(直接点击公网2按钮是不行的,实验过了,这些点击的按钮的位置都是通过findelementby_xpath来获取的,和上面方法一样不在多说。)
- 下面是实现代码
# 找到公网
try:
driver.find_element_by_xpath('//*[@id="video"]/div[4]/div[8]/span').click()
driver.find_element_by_xpath('//*[@id="video"]/div[4]/div[8]/div/ul/li[3]/span[1]').click()
except:
pass
3.4像找到快进按钮啊,静音按钮都是一个办法的。通过findelementby_xpath方法得到并点击。
4.下面处理答题,完成视频,和网络不佳的情况。这些逻辑但是在try-except里面处理的
4.1出现网络不佳时,使用右击--->检查---->右击copy---->copy xpath来获取公网2的标签位置并点击。
# 当网络不可用时 点击公网
try:
driver.find_element_by_xpath('//*[@id="vjserrdisplay-1035"]/ul/li[2]/label').click()
except:
pass
4.2出现答题时找到,视频中答题位置,找到选择题选项位置,遍历每一个选项点击,总有一个是正确的(而且这个答案是不影响总成绩的) -代码实现
# 找到视频中出现的答题位置
if driver.find_element_by_xpath('//body/div[4]/div/div[7]/span/div/div'):
# 找到选择题
button3 = driver.find_elements_by_xpath('//body/div[4]/div/div[7]/span/div/div/ul/li')
# print("button3{}", button3)
while driver.find_element_by_xpath('//body/div[4]/div/div[7]/span/div/div'):
# print(1)
# 对选项进行遍历
for button1 in button3:
button1 = button1.find_element_by_xpath('label')
# print("button1{}", button1)
button1.click()
time.sleep(random.random() * 3)
# 点击提交按钮
button5 = driver.find_element_by_xpath('//body/div[4]/div/div[7]/span/div/div/div[2]')
# print("button5{}", button5)
button5.click()
time.sleep(random.random() * 3)
if driver.switch_to.alert():
al = driver.switch_to.alert()
al.accept()
time.sleep(random.random())
if not driver.find_element_by_xpath('//body/div[4]/div/div[7]/span/div/div'):
# print("答题完成")
break
except Exception as e:
# print("未找到答题位置")
time.sleep(random.random() * 3)
4.3判断视频是否看完,找到播放标签,如果播放标签的文本是‘重播’那么证明这个视频已经完成。跳出循环就好。
- 代码实现
try:
# 找到重播按钮
rename = driver.find_element_by_xpath('//*[@id="video"]/div[4]/button[1]').get_attribute('title')
if rename == '重播':
break
except Exception as e:
time.sleep(random.random() * 3)
5返回上一层ifram的上一层ifram继续下一层 循环。
代码的不足之处:
-暂时不会判断视频是否播放过。
- 有一条输出语句中时间标签获取不出来。
- 播放时必须有一台电脑在运行程序,而且鼠标从页面出去,或者不进入到页面中,不然会造成暂停异常。(如果你有一台云主机的话,那就完美了)
运行结果:部分截图
如果有不会之处,或有代码异常,运行错误等,请联系下面公众号,你的反馈会使代码更加健壮。
简单的自动化使用--使用selenium实现学习通网站的刷慕课程序。注释空格加代码大概200行不到的更多相关文章
- (java)selenium webdriver学习---实现简单的翻页,将页面内容的标题和标题链接取出
selenium webdriver学习---实现简单的翻页,将页面内容的标题和标题链接取出: 该情况适合能能循环page=1~n,并且每个网页随着循环可以打开的情况, 注意一定是自己拼接的url可以 ...
- selenium webdriver学习(二)————对浏览器的简单操作(转载JARVI)
selenium webdriver学习(二)————对浏览器的简单操作 博客分类: Selenium-webdriver selenium webdriver对浏览器的简单操作 打开一个测试浏览 ...
- selenium自动化测试学习(一)
在学习selenium自动化测试前,我们需要先了解一点自动化测试的相关知识. (一)什么是自动化测试 (二)为什么要做自动化测试 (三)自动化测试优缺点 (1)什么是自动化测试 自动化测试是把以人为驱 ...
- Python+excel实现的简单接口自动化 V0.1
好久没写博客了..最近忙着工作以及新工作的事.. 看了下以前写的简单接口自动化,拿出来总结下,也算记录下学习成果 先来贴一下最后的结果,结果是写在原来的excel中 执行完毕后,会将结果写入到“状态” ...
- 自动化运维工具ansible学习+使用ansible批量推送公钥到远程主机
目录: 一.ansible简介 1.1.ansible是什么 1.2.ansible如何工作 1.3.ansible优缺点 1.4.ansible安装方式 1.5.ansible文件简单介绍 1.6. ...
- 自动化测试 python2.7 与 selenium 2 学习
windows环境搭建 # 下载 python[python 开发环境] http://python.org/getit/ # 下载 setuptools [python 的基础包工具]setupto ...
- selenium webdriver学习(六)------------如何得到弹出窗口
selenium webdriver学习(六)------------如何得到弹出窗口 在selenium 1.X里面得到弹出窗口是一件比较麻烦的事,特别是新开窗口没有id.name的时候.当时还整理 ...
- selenium webdriver学习(十)------------如何把一个元素拖放到另一个元素里面(转)
selenium webdriver学习(十)------------如何把一个元素拖放到另一个元素里面 博客分类: Selenium-webdriver 元素拖放drag and drop Q群里 ...
- selenium webdriver学习(八)------------如何操作select下拉框(转)
selenium webdriver学习(八)------------如何操作select下拉框 博客分类: Selenium-webdriver 下面我们来看一下selenium webdriv ...
随机推荐
- [USACO10FEB]购买巧克力Chocolate Buying 【假背包真贪心】 By cellur925
题目传送门 继续dp刷题计划,看到这道题,第一眼感觉不就是显然的完全背包嘛.把背包打完要开始填充数组大小的时候成为了mengbier,发现数据极大,达到了1e18.显然这不是一道平凡的背包题目. 于是 ...
- jQuery笔记之位置图形
位置图形: 位置坐标图形大小相关方法: .offset() .position() .scrollTop()..scrollLeft() .width().height() .innerWidth() ...
- 后缀数组 DC3构造法 —— 详解
学习了后缀数组,顺便把DC3算法也看了一下,传说中可以O(n)复杂度求出文本串的height,先比较一下倍增算法和DC3算法好辣. DC3 倍增法 时间复杂度 O(n)(但是常数很大) O(nlo ...
- HTML入门与基础 —— 标签《一》
一.标签概述 1.HTML(英文Hyper Text Markup Language的缩写)中文译为“超文本标签语言”,主要是通过HTML标签对网页中的文本.图片.声音等内容进行描述. 2.标签分为嵌 ...
- h5-35-ajax轮询实现推送效果
data.txt { "number1":1200, } index.html <!DOCTYPE html> <html> <head> &l ...
- oracle 查看未关闭连接
查看连接状态.问题电脑等信息: select sid,serial#,username,program,machine,status from v$session; 2.查看sql; select ...
- PV,UV,IP概念
PV是网站分析的一个术语,用以衡量网站用户访问的网页的数量.对于广告主,PV值可预期它可以带来多少广告收入.一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,如同一个来访者 ...
- PowerShell~执行策略的介绍
首先看一下无法加载ps1脚本的解决方法 事实上也是由于策略导致的 解决方法主是开启对应的策略 set-ExecutionPolicy RemoteSigned 执行策略更改 执行策略可以防止您执行不 ...
- AJPFX关于读取properties 配置文件 返回属性值
:Properties的概述 * Properties 类表示了一个持久的属性集. * Properties 可保存在流中或从流中加载. * 属性列表中每个键 ...
- spark性能调优--jvm调优(转)
一.问题切入 调用spark 程序的时候,在获取数据库连接的时候总是报 内存溢出 错误 (在ideal上运行的时候设置jvm参数 -Xms512m -Xmx1024m -XX:PermSize=51 ...