#!/usr/bin/python read = file('thread-1554-1-1.html','r') wr = file('list','w') while 1: line=read.readline() if 'href' in line and '.mobi' in line: wr.write(line) print(line) elif '</html>' in line: break wr.write('symons_end') read.close() wr.clos…
思考:我们进行自动化测试时,如果把代码都写在一个脚本中,代码的可读性会变差,且后期代码维护也麻烦,最好的想法就是测试对象和测试用例可以分离,可以很快定位问题,代码可读性高,也比较容易理解.这里推荐大家在自动化框架中加入PO模型思想,那什么是PO模型呢? 所谓的PO就是page object,通俗解释一下就是每个页面当成一个对象,给这些页面写一个类,主要就是完成元素定位和业务操作:至于测试脚本要和ta区别开来,需要什么去这些页面类去调用即可. 上面流程图意思就是测试用例类调用不同的页面类,页面类调…
1. Background Though it's always difficult to give child a perfect name, parent never give up trying. One of my friends met a problem. his baby girl just came to the world, he want to make a perfect name for her. he found a web page, in which he can…
Selenium是当前主流的web自动化工具,提供了多种浏览器的支持(Chrome,Firefox, IE等等),当然大家也可以用自己喜欢的语言(Java,C#,Python等)来写用例,很容易上手.当大家写完第一个自动化用例的时候肯定感觉”哇...好牛x“,但是大家用余光扫了一下代码后,内心也许是崩溃的,因为太乱了!像这样: __author__ = 'xua' from selenium import webdriver from selenium.webdriver.common.keys…
最近工作里遇到一个需求要把之前用Java写的一个http接口替换成用Python写的,出参是带了mybatis pageHelper中PageInfo信息的一个JSON串,而Python这边分页不会涉及到数据库查询,属于直接对list进行分页..然后就有了下面的对开源Python分页模块的一个改写(模块地址:至于改动~~emmm~具体来说,就是加了个元类,给原先的Page类动态加了个返回JSON字符串的方法,至于为什么这里用…
前面有一篇对于常见元素的识别和操作的python自动化脚本,这一篇就接着聊下python的类继承,已经它的第三款unittest框架,和报告收集包HTMLtestRunner的应用. 还是直接上代码吧. unittest和HTMLtestrunner的应用: # coding = utf-8 import time import unittest import HTMLTestRunner import os import sys from selenium import webdriver #…
1 page title </head>    contains information about the page </title> the title of the document…
原地址: 网络客户端: 1. 理解socket: socket是操作系统I/O系统的延伸部分,它扩展了操作系统的基本I/O到网络通信,使进程和机器之间的通信成为可能.建立 socket 需要通过调用 socket() 函数,并且还需要另外的调用来连接和激活它们( recv() 和 send() ) . 2. 建立socket:首先需要建立一个实际的socket对…
1.urllib.urlopen(url[,data[,proxies]]) urllib.urlopen(url[, data[, proxies]]) :创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据.参数url表示远程数据的路径,一般是网址:参数data表示以post方式提交到url的数据(玩过web的人应该知道提交数据的两种方式:post与get.如果你不清楚,也不必太在意,一般情况下很少用到这个参数):参数proxies用于设置代理. 打开一个u…
第一:命名空间与作用域 命名空间: 局部命名空间: def foo(): x=1 def func(): pass 全局命名空间: import time class ClassName:pass def foo():pass 内键命名空间: sum,max,min 等 python加载三个命名空间的顺序: 1.内键命名空间 2.全局命名空间:文件级别的或叫做模块级别的 3.局部命名空间:只有调用函数的时候才会加载,函数调用结束就被释放掉 作用域: 全局作用域: 同时x=1为全局变量 x=1 d…
# encoding: utf-8 # module sys # from (built-in) # by generator 1.145 """ This module provides access to some objects used or maintained by the interpreter and to functions that interact strongly with the interpreter. Dynamic objects: argv…
本文转自: If I understand correctly, you have create a report display all row in one p…
2013/11/01 | Comments 大约一年前,我接触了 Java 中的 Btrace 能够不停机查看线上 JVM 运行情况的特性让我艳羡不已. 另外还有强悍的 jStack 和 jConsole 来进行运行期侦测,JVM 的工业级强度果然不是盖的. 当时公司技术方面也遇到了一些瓶颈,一部分原因是 CPython 本身的 IO 模型问题, 另一方面也和早期代码写的极不工整脱不了关系.万般无奈之下,我们用 Jython 推翻重做了主要业务,效果立竿见影,但同时也把真实问题给规避掉了. 在这…
本人最近在学习python,今天想使用python来抓取糗事百科网站上的一些笑话故事的,由于糗事百科的网站url采取的是https协议,所以当我按照常规的方式抓取的时候,发现不行,报错了,找了很多方法都不好使,这对于一个初学者来说真是很捉鸡的一件事情,最后google了好久,终于找到了解决的办法,接下来一起看一下 一.针对https协议的网站需要验证证书 错误信息:'[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.…
Urllib实战 1.爬取糗事百科中段子和用户名: 代码实例: # 爬取网站页面内容 import re import urllib.request url = '' headers =('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029…
接触过的工具有pyinstaller,或者py2exe.感觉pyinstaller更简单易用. 真正将依赖的dll打包称一个安装包还需要借助windows打包工具 Inno Setup 或 NSIS 1.pyinstaller 官网 两大步 (1)Install PyInstaller from PyPI: pip install pyinstaller (2)Go to your program’s directory and run: pyinstal…
前言 Python的pandas包提供的数据聚合与分组运算功能很强大,也很灵活.<Python for Data Analysis>这本书第9章详细的介绍了这方面的用法,但是有些细节不常用就容易忘记,遂打算把书中这部分内容总结在博客里,以便复习查看.根据书中的章节,这部分知识包括以下四部分: 1.GroupBy Mechanics(groupby技术) 2.Data Aggregation(数据聚合) 3.Group-wise Operation and Transformation(分组级运…
Guide to Python introspection Guide to Python introspection How to spy on your Python objects   Published on December 01, 2002   What is introspection? In everyday life, introspection is the act of…
新创建项目   自己写个url映射到自定义的视图函数 在url中传递参数 from flask import Flask app = Flask(__name__) @app.route('/') def hello_world(): return 'Hello World!' #自定义访问返回结果 @app.route('/list/') def article_list(): return 'article list' #带参数传递 @app.route('/article/<…
Tag Diagram You may have noticed that HTML tags come in pairs; HTML has both an opening tag (<tag name>) and a closing tag (</tag name>). The only difference between the opening and closing tags is that the closing tag contains an extra forwar…
python flask url参数 常见 url 传参中都是 xxx?xxx=xxx 问题来了 flask中我没有找到 关于xx? 问号的使用方式 是不是flask就不支持这种方式 如果有 route配置的时候该如何写? ?后面的部分不参与url匹配,route时不必考虑. url_for是可以干这个事情的 路由定义: @app.route('/') @app.route('/page/<int:page>/') def index(page=1): pass 演示: In [6]: url…
用webdriver模仿浏览器 爬取豆瓣python书单 其中运用到os 模块 作用是生成文件夹 存储爬取的信息 etree 用于xpath解析内容 详细代码如下 可用我的上一篇博客存取到excel当中 import os import time from selenium import webdriver from lxml import etree #创建文件夹 没有指定的文件夹则创建 有则跳过 root_dir = 'douban/img' if not os.path.exists(ro…
Pipenv is a tool that aims to bring the best of all packaging worlds (bundler, composer, npm, cargo, yarn, etc.) to the Python world. Windows is a first-class citizen, in our world. pipenv 是Kenneth Reitz大神的作品,能够有效管理Python多个环境,各种包.过去我们一般用virtualenv搭建虚…
本章将会讲解python常用系统工具的介绍 python中大多数系统级接口都集中在两个模块: sys 和 os 但仍有部分其他标准模块也属于这个领域 如: 常见: glob   用于文件名扩展 socket  用于网络连接和进程间通信 threading, _thread,queue  用于运行和同步化并发线程 time,timeit 用于获取系统时间相关细节 subprocess,multiprocessing 用于启动和控制并行进程 signal,select,shutil,tempfile…
Day1:项目分析 一:需求分析 二:CRM角色功能介绍 三:业务场景分析 销售: .销售A 从百度推广获取了一个客户,录入了CRM系统,咨询了Python课程,但是没有报名 .销售B 从qq群获取一个客户,成功使他报名Python班,然后给他发送了报名连接,等待用户填写完毕后,将他添加到Python具体的学习班级中 .销售C 打电话给之前的一个客户,说服他报名Python课程,但是没有成功,更新了跟踪记录 .销售D 获取了一个客户,录入信息时,发现此客户已经存在,不允许重复录入,随后通知相应的…