selenium实战脚本集(1)——新浪微博发送QQ每日焦点,乙醇用谷歌实现的,下边是用火狐实现的. 代码如下: # coding = utf-8 from selenium import webdriver import time profiles = webdriver.FirefoxProfile("C:/Documents and Settings/Administrator/Application Data/Mozilla/Firefox/Profiles/rhw9fq7m.defau…
Selenium实战脚本集-新浪微博发送QQ每日焦点 http://www.spasvo.com/ceshi/open/kygncsgj/Selenium/201549150822.html 背景 很多同学在工作中是没有selenium的实战环境的,因此自学的同学会感到有力无处使,想学习但又不知道怎么练习.其实学习新东西的道理都是想通的,那就是反复练习.这里乙醇会给出一些有用的,也富有挑战的练习,帮助大家去快速掌握和使用selenium webdriver.多用才会有感触. 练习 首先去www.…
描述 去开发者头条抓取本日的top 10内容,也就是排在前面的10个,需要抓取标题和url 将这些内容保存在数据库,推荐使用sqlite 写个简单的客户端,要求可以展示每日的内容,点击标题后可以打开浏览器浏览该内容 要求 用同一种语言实现 使用phantomjs去抓取内容…
背景 很多同学在工作中是没有selenium的实战环境的,因此自学的同学会感到有力无处使,想学习但又不知道怎么练习.其实学习新东西的道理都是想通的,那就是反复练习.这里乙醇会给出一些有用的,也富有挑战的练习,帮助大家去快速掌握和使用selenium webdriver.多用才会有感触. 练习 到http://www.zhihu.com/explore这个页面,用selenium获取今日最热和本月最热的文章标题和内容. 用到的知识点 爬虫知识.用webdriver去也页面上爬一些内容.用到的核心a…
背景 很多同学在工作中是没有selenium的实战环境的,因此自学的同学会感到有力无处使,想学习但又不知道怎么练习.其实学习新东西的道理都是想通的,那就是反复练习.这里乙醇会给出一些有用的,也富有挑战的练习,帮助大家去快速掌握和使用selenium webdriver.多用才会有感触. 练习 首先去www.qq.com的首页把今日话题的标题和url拿到 然后去weibo.com登陆,登陆后发一条微博,内容就是今题话题的标题和url 用到的知识点 自动登录.微博登录的时候有可能会有验证码,所以自动…
描述 打开infoq页面,抓取最新的一些测试文章 需要抓取文章的标题和内容 如果你有个人blog的话,可以将这些文章转载到自己的blog 要求 不要在新窗口打开文章 自行了解最新的测试思潮与实践…
第五章-简单搜索 众里寻他千百度 搜索是ES的核心,本节讲解一些基本的简单的搜索. 掌握ES搜索查询的RESTful的API犹如掌握关系型数据库的SQL语句,尽管Java客户端API为我们不需要我们去实际编写RESTful的API,但在生产环境中,免不了在线上执行查询语句做数据统计供产品经理等使用. 数据准备 首先创建一个名为user的Index,并创建一个student的Type,Mapping映射一共有如下几个字段: 创建名为user的Index PUT http://localhost:9…
iScript 是Github上 PeterDing 大神写的一个脚本集,由多数的 python 脚本和少数GM脚本组成. 含有以下几个脚本: xiami.py - 下载或播放高品质虾米音乐(xiami.com) pan.baidu.com.py - 百度网盘的下载.离线下载.上传.播放.转存.文件操作 bt.py - magnet torrent 互转.及 过滤敏.感.词 115.py - 115网盘的下载和播放 yunpan.360.cn.py - 360网盘的下载 music.baidu.…
Jenkins执行python写的selenium自动化脚本,通常会遇到,执行打不开浏览器,查看jenkins构建Console Output控制台输出信息,发现脚本是执行了的,但是出错了,打开浏览器出现问题,原因呢,是因为我们window安装的jenkins默认会产生一个window服务:那怎么解决这个问题呢. 1.先在控制面板-->管理工具-->服务:中找到Jenkins服务,-->属性,停止和禁用该服务. 有人会说了,你把服务停止了jenkins怎么用啊,别急,听笔者一一道来. 2…
python+selenium之自定义封装一个简单的Log类 一. 问题分析: 我们需要封装一个简单的日志类,主要有以下内容: 1. 生成的日志文件格式是 年月日时分秒.log 2. 生成的xxx.log文件存储在项目Logs文件夹下 3. 这个日志类,支持INFO,ERROR两种日志级别 4. 日志里,每行日志输出,时间日期+执行类名称+日志级别+日志描述 二.解决问题思路: 1. 在根目录下新建一个Logs的文件夹,如何获取这个Log的相对路径. 2. 日志的保存命名,需要系统时间,前面也介…