我们在做接口自动化的时候，处理接口依赖的相关数据时，通常会使用正则表达式来进行提取相关的数据。

正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(Regular Expression，在代码中常简写为regex、regexp或RE) 。它是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。而Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。

正则表达式语法

表示单字符

单字符：即表示一个单独的字符，比如匹配数字用\d，匹配非数字用\D。

除以下语法，也可以匹配指定的具体字符，可以是1个也可以是多个。

字符	功能说明
.	匹配任意1个字符（除了\n）
[2a]	匹配[]中括号中列举的字符，如这里就是匹配2或者a这两个字符其中的一个
\d	匹配数字，即0-9
\D	匹配非数字
\s	匹配空白，即空格、tab键（tab键为两个空格）
\S	匹配非空白
\w	匹配单词字符，即a-z、A-Z、0-9、_（数字、字母、下划线）
\W	匹配非单词字符

实例如下，这里先说明一下findall(匹配规则，要匹配的字符串)这个方法是查找所有匹配的数据，以列表的形式返回，后面会在re模块进行详解：

import re

# .：匹配任意1个字符

re1 = r'.'

res1 = re.findall(re1, '\nj8?0\nbth\nihb')

print(res1)	# 运行结果：['j', '8', '?', '0', 'b', 't', 'h', 'i', 'h', 'b']

# []：匹配列举中的其中一个

re2 = r"[abc]"

res2 = re.findall(re2, '1iugfiSHOIFUOFGIDHFGFD2345a6a78b99cc')

print(res2)	# 运行结果：['a', 'a', 'b', 'c', 'c']

# \d:匹配一个数字

re3 = r"\d"

res3 = re.findall(re3, "dfghjkl32212dfghjk")

print(res3)	# 运行结果：['3', '2', '2', '1', '2']

# \D:匹配一个非数字

re4 = r"\D"

res4 = re.findall(re4, "d212dk？\n$%3;]a")

print(res4)	# 运行结果：['d', 'd', 'k', '？', '\n', '$', '%', ';', ']', 'a']

# \s：匹配一个空白键或tab键（tab键实际就是两个空白键）

re5 = r"\s"

res5 = re.findall(re5,"a s d a  9999")

print(res5)	# 运行结果：[' ', ' ', ' ', ' ', ' ']

# \S: 匹配非空白键

re6 = r"\S"

res6 = re.findall(re6, "a s d a  9999")

print(res6)	# 运行结果：['a', 's', 'd', 'a', '9', '9', '9', '9']

# \w：匹配一个单词字符(数字、字母、下划线)

re7 = r"\w"

res7 = re.findall(re7, "ce12sd@#a as_#$")

print(res7)	# 运行结果：['c', 'e', '1', '2', 's', 'd', 'a', 'a', 's', '_']

# \W：匹配一个非单词字符(不是数字、字母、下划线)

re8 = r"\W"

res8 = re.findall(re8, "ce12sd@#a as_#$")

print(res8)	# 运行结果：['@', '#', ' ', '#', '$']

# 匹配指定字符

re9 = r"python"

res9 = re.findall(re9, "cepy1thon12spython123@@python")

print(res9)	# 运行结果：['python', 'python']

表示数量

如果要匹配某个字符多次，就可以在字符后面加上数量进行表示，具体规则如下：

字符	功能说明
*	匹配前一个字符出现0次或者无限次，即可有可无
+	匹配前一个字符出现1次或无限次，即至少1次
?	匹配前一个字符出现0次或1次，即要么没有，要么只有1次
{m}	匹配前一个字符出现m次
{m,}	匹配前一个字符至少出现m次
{m,n}	匹配前一个字符出现从m到n次

实例如下：

import re

# *：表示前一个字符出现0次以上(包括0次)

re21 = r"\d*"   # 这里匹配的规则，前一个字符是数字

res21 = re.findall(re21, "343aa1112df345g1h6699")  # 如匹配到a时，属于符合0次，但因为没有值所以会为空

print(res21)	# 运行结果：['343', '', '', '1112', '', '', '345', '', '1', '', '6699', '']

# ? : 表示0次或者一次

re22 = r"\d?"

res22 = re.findall(re22, "3@43*a111")

print(res22)	# 运行结果：['3', '', '4', '3', '', '', '1', '1', '1', '']

# {m}:表示匹配一个字符m次

re23 = r"1[3456789]\d{9}" # 手机号：第1位为1，第2位匹配列举的其中1个数字，第3位开始是数字，且匹配9次

res23 = re.findall(re23,"sas13566778899fgh256912345678jkghj12788990000aaa113588889999")

print(res23)	# 运行结果：['13566778899', '13588889999']

# {m,}:表示匹配一个字符至少m次

re24 = r"\d{7,}"

res24 = re.findall(re24, "sas12356fgh1234567jkghj12788990000aaa113588889999")

print(res24)	# 运行结果：['1234567', '12788990000', '113588889999']

# {m,n}：表示匹配一个字符出现m次到n次

re25 = r"\d{3,5}"

res25 = re.findall(re25, "aaaaa123456ghj333yyy77iii88jj909768876")

print(res25)	# 运行结果：['12345', '333', '90976', '8876']

匹配分组

字符	功能说明
\|	匹配左右任意一个表达式
(ab)	将括号中字符作为一个分组

实例如下：

import re

# 同时定义多个规则，只要满足其中一个

re31 = r"13566778899|13534563456|14788990000"

res31 = re.findall(re31, "sas13566778899fgh13534563456jkghj14788990000")

print(res31)	# 运行结果：['13566778899', '13534563456', '14788990000']

# ()：匹配分组:在匹配规则的数据中提取括号里的数据

re32 = r"aa(\d{3})bb"	# 如何数据符合规则，结果只会取括号中的数据，即\d{3}

res32 = re.findall(re32, "ggghjkaa123bbhhaa672bbjhjjaa@45bb")

print(res32)	# 运行结果：['123', '672']

表示边界

字符	功能说明
^	匹配字符串开头，只能匹配开头
$	匹配字符串结尾，只能匹配结尾
\b	匹配一个单词的边界（单词：字母、数字、下划线）
\B	匹配非单词的边界

实例如下：

import re

# ^:匹配字符串的开头

re41 = r"^python"   # 字符串开头为python

res41 = re.findall(re41, "python999python")  # 只会匹配这个字符串的开头

res411 = re.findall(re41, "1python999python")  # 因为开头是1,第1位就不符合了

print(res41)	# 运行结果：['python']

print(res411)	# 运行结果：[]

# $:匹配字符串的结尾

re42=r"python$"	# 字符串以python结尾

res42 = re.findall(re42, "python999python")

print(res42)	# 运行结果：['python']

# \b:匹配单词的边界，单词即:字母、数字、下划线

re43 = r"\bpython"  # 即匹配python，且python的前一位是不是单词

res43 = re.findall(re43, "1python 999 python")  # 这里第1个python的前1位是单词，因此第1个是不符合的

print(res43)	# 运行结果：['python']

# \B:匹配非单词的边界

re44 = r"\Bpython"  # 即匹配python，且python的前一位是单词

res44 = re.findall(re44, "1python999python")

print(res44)	# 运行结果：['python', 'python']

贪婪模式

python里数量词默认是贪婪的，总是尝试匹配尽可能多的字符，而非贪婪模式则是尝试匹配尽可能少的字符，在表示数量的表达式后加上问号(?)就可以关闭贪婪模式。

如下例子，匹配2个以上的数字，如果符合条件它会一直匹配到不符合才停止，如其中的34656fya，34656符合2个数字以上，那么它会一直匹配到6为止，如果关闭贪婪模式，那么在满足2个数字时就会停止，最后可以匹配到34、65。

import re

# 默认的贪婪模式下

test = 'aa123aaaa34656fyaa12a123d'

res = re.findall(r'\d{2,}', test)

print(res)	# 运行结果：['123', '34656', '12', '123']

# 关闭贪婪模式

res2 = re.findall(r'\d{2,}?', test)

print(res2)	# 运行结果：['12', '34', '65', '12', '12']

re模块

在python中使用正则表达式，就会用到re模块来进行操作，提供的方法一般需要传入两个参数：

参数1：匹配的规则
参数2：要进行匹配的字符串

re.findall()

查找所有符合规范的字符串，以列表的形式返回。

import re

test = 'aa123aaaa34656fyaa12a123d'

res = re.findall(r'\d{2,}', test)

print(res)	# 运行结果：['123', '34656', '12', '123']

re.search()

查找第一个符合规范的字符串，返回的是一个匹配对象，可以通过group()将匹配到的数据直接提取出来。

import re

s = "123abc123aaa123bbb888ccc"

res2 = re.search(r'123', s)

print(res2)  # 运行结果：<re.Match object; span=(0, 3), match='123'>

# 通过group将匹配到的数据提取出来，返回类型为str

print(res2.group())   # 运行结果：123

返回的匹配对象中，span为匹配到的数据的下标范围，match则是匹配到的值。

group()参数说明：

不传参数：获取的是匹配到的所有内容
【python接口自动化】- 正则用例参数化的更多相关文章
1. python接口自动化-参数化
  原文地址https://www.cnblogs.com/yoyoketang/p/6891710.html python接口自动化 -参数关联(一)https://www.cnblogs.com/11 ...
2. python接口自动化8-参数化
  前言前面一篇实现了参数的关联,那种只是记流水账的完成功能,不便于维护,也没什么可读性,接下来这篇可以把每一个动作写成一个函数,这样更方便了. 参数化的思维只需记住一点:不要写死 (由于博客园登录机制 ...
3. Python接口自动化——soap协议传参的类型是ns0类型的要创建工厂方法纪要
  1:在Python接口自动化中,对于soap协议的xml的请求我们可以使用Suds Client来实现,其soap协议传参的类型基本上是有2种: 第一种是传参,不需要再创建啥, 第二种就是ns0类型的 ...
4. python接口自动化 -参数关联（一）
  原文地址https://www.cnblogs.com/yoyoketang/p/6886610.html 原文地址https://www.cnblogs.com/yoyoketang/ 原文地址ht ...
5. python接口自动化24-有token的接口项目使用unittest框架设计
  获取token 在做接口自动化的时候,经常会遇到多个用例需要用同一个参数token,并且这些测试用例跨.py脚本了. 一般token只需要获取一次就行了,然后其它使用unittest框架的测试用例全部 ...
6. python接口自动化5-Json数据处理
  前言有些post的请求参数是json格式的,这个前面第二篇post请求里面提到过,需要导入json模块处理. 一般常见的接口返回数据也是json格式的,我们在做判断时候,往往只需要提取其中几个关键的 ...
7. python接口自动化16-multipart/form-data上传图片
  前言在提交表单操作的时候,经常会遇到图片上传的操作,图片上传是一个单独的接口,本篇以禅道为例,介绍如何上传图片上传接口 1.以禅道上提交bug为例,在选择图片时,点确定按钮,就是上传图片了 2.用 ...
8. python接口自动化7-参数关联
  前言我们用自动化发帖之后,要想接着对这篇帖子操作,那就需要用参数关联了,发帖之后会有一个帖子的id,获取到这个id,继续操作传这个帖子id就可以了 (博客园的登录机制已经变了,不能用账号和密码登录了 ...
9. python接口自动化18-multipart/form-data上传多个附件
  前言 reuqests上传一张图片到服务器,前面已经介绍过了,那么如何在提交BUG的时候,上传附件呢? 上传附件的时候,文件的name参数名称是一样的,python里面key是不可以重复的,又如何处理 ...
10. python接口自动化（十）--post请求四种传送正文方式（详解）
  简介 post请求我在python接口自动化(八)--发送post请求的接口(详解)已经讲过一部分了,主要是发送一些较长的数据,还有就是数据比较安全等.我们要知道post请求四种传送正文方式首先需要先 ...
随机推荐
1. 子网划分、变长子网掩码和TCP/IP排错__IP寻址排错
  1.Cisco推荐使用的排错四步曲: ping环回地址:ping NIC:ping默认网关和ping远端设备. 1. 打开DOS窗口并ping127.0.0.1.这是一个诊断或环回地址,如果你得到一个 ...
2. shell脚本将字符串按指定分隔符切分成数组
  Shell 数组用括号来表示,元素用"空格"符号分割开,语法格式如下: array_name=(value1 value2 ... valuen) keyword=1,sdg,dd ...
3. Color Changing Sofa Gym - 101962B、Renan and Cirque du Soleil Gym - 101962C、Hat-Xor Gym - 101962E 、Rei do Cangaço Gym - 101962K 、Sorting Machine Gym - 101962M
  Color Changing Sofa Gym - 101962B 题意:给你一个由字母构成的字符串a,再给你一个由0.1构成的字符串b.你需要在a字符串中找到一个可以放下b的位置,要保证b字符串中0 ...
4. python+requests爬取百度文库ppt
  实验网站:https://wenku.baidu.com/view/c7752014f18583d04964594d.html 在下面这种类型文件中的请求头的url打开后会得到一个页面你会得到如下图 ...
5. Codeforces Round #540 (Div. 3) C. Palindromic Matrix (大模拟)
  题意:给你$n$个数,判断是否能构成一个$n$X$n$的回文矩阵,若可以,输出$YES$和矩阵,否则输出$NO$. 题解:如果这个矩阵的行/列元素是偶数的话,很好办,所有出现的数一 ...
6. .net webapi 中使用session是出错 HttpContext.Current.Session==null
  最近在写.net webapi时发现 HttpContext.Current.Session==null ,导致报错,后来查资料发现webapi中使用session时首先需要开启session功能, ...
7. 轻松理解 Java开发中的依赖注入(DI)和控制反转(IOC)
  前言关于这个话题, 网上有很多文章,这里, 我希望通过最简单的话语与大家分享. 依赖注入和控制反转两个概念让很多初学这迷惑, 觉得玄之又玄,高深莫测. 这里想先说明两点: 依赖注入和控制反转不是高级 ...
8. Python3.5 配置MySql数据库连接
  #!coding:utf-8 import pymysql ''' Python3之后不再支持MySQLdb的方式进行访问mysql数据库: 可以采用pymysql的方式连接方式: 1.导包 imp ...
9. windows常用快捷键和dos命令
  windows常用快捷键 Ctrl+C (复制) Ctrl+V (粘贴) Ctrl+S (保存) Ctrl+A (全选) Ctrl+Z (撤销) Alt+F4 (关闭当前窗口) shift+Delet ...
10. Hexo准备---Node.js、Vue
  Hexo准备---Node.js.Vue 安装node.js 1.下载node 配置node.js环境官网下载,一直next就好,非常方便. 下载官网: http://nodejs.cn/downlo ...

【python接口自动化】- 正则用例参数化

正则表达式语法

表示单字符

表示数量

匹配分组

表示边界

贪婪模式

re模块

re.findall()

re.search()

【python接口自动化】- 正则用例参数化的更多相关文章

随机推荐

热门专题