import pytesseract from PIL import Image import requests import time # 获取只会验证码图片并保存为本地 def get_data_request(): headers = { "User-Agent": "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0" } captcha_url = 'https://www.zhih…
python中configparser模块读取ini文件 ConfigParser模块在python中用来读取配置文件,配置文件的格式跟windows下的ini配置文件相似,可以包含一个或多个节(section), 每个节可以有多个参数(键=值).使用的配置文件的好处就是不用在程序员写死,可以使程序更灵活. 三种创建方法 程序示例: import configparser #实例化出来一个类,相当于生成一个空字典 config = configparser.ConfigParser() #创建也…
[linecache] 过往在读取文件的时候,我们通常使用的是这种模式: with open('file.txt','r') as f: line = f.readline() while line: print line # 一些行级别的处理 line = f.readline() 这么做的好处在于通过一行一行读取内容,不会一下子把整个文件内容读到内存中去. 在长时间的实践中可以发现,这种读取文件的代码是一种相对比较固定的模式.既然是固定的模式,那么肯定就有轮子了.事实上python自带了一个…
前言 使用配置文件来灵活的配置一些参数是一件很常见的事情,配置文件的解析并不复杂,在python里更是如此,在官方发布的库中就包含有做这件事情的库,那就是configParser.configParser解析的配置文件的格式比较象ini的配置文件格式,就是文件中由多个section构成,每个section下又有多个配置项.括号"[ ]"内包含的为section.紧接着section 为类似于key-value 的options 的配置内容. 比如,我的目录如下,在test_config…
在给PC端应用做自动化测试时,某些情况下无法定位界面上的控件,但我们又想获得界面上的文字,则可以通过截图后从图片上去获取该文字信息.那么,Python中有没有对应的工具来实现OCR呢?答案是有的,它叫pytesseract.官方给它的定义如下,一起来了解和使用吧. Python-tesseract is an optical character recognition (OCR) tool for python. That is, it will recognize and "read"…
1.ConfigParser.MissingSection什么的错误巴拉巴拉一堆,其实根本上就是没有读到配置文件,然后我去检查了一遍路径,发现没有问题,我是将文件的路径作为一个字符串拼接好传到另一个专门读取配置文件的方法中去,但是依然报错,最后我是直接将read这个配置文件的时候直接赋予绝对路径,当然其他的方法肯定也有,但是先把这个解决办法记下来.…
安装 pip3 install xlrd 用法 Sheet编号从0开始 rows,colnum编号均从0开始 合并的单元格仅返回第一格内容 Sheets只能被调用一次,可获取所有sheet取idx 无论表格内数据类型是int还是str,纯数字内容会返回float 示例 import xlrd file = "name_list.xls" data = xlrd.open_workbook(file) table = data.sheets()#Read all sheet by idx…
python的logging模块是用来记录应用程序的日志的.关于logging模块的介绍,我这里不赘述,请参见其他资料.这里主要讲讲如何来读取yaml配置文件进行定制化的日志输出. python要读取yaml文件,就必须安装扩展的模块. 那么我们就安装相应模块. pip install pyyaml yaml文件的格式有点类似于字典,但是它没有括号.接下来就定制一个logging的yaml配置文件. version: 1 disable_existing_loggers: False forma…
python的random模块(生成验证码) random模块常用方法 random.random() #生成0到1之间的随机数,没有参数,float类型 random.randint(1, 3) #生成参数1到参数2之间的随机数,输出为int类型,[1,3] random.randrange(1, 3) #生成参数1到参数2之间的随机数,输出为int类型,[1,3),这个方法还有一种用法,就是下面介绍的这种 random.randrange(0,100,2) #从指定范围内,按指定基数递增的集…
转自: python linecache模块读取文件 在Python中,有个好用的模块linecache,该模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单个文件读取多行. linecache.getlines(filename) 从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储 linecache.getline(filename,lineno) 从名为filename的文件中得到第…