一:学习内容

  • 匹配单个字符与数字:.、[]、^、\d、\D、\w、\W、\s、\S
  • 匹配锚字符(边界字符):^、$、\A、\Z、\b、\B
  • 匹配多个字符:(xyz) 、x?、x*、.*、x+、x{n}、x{n,}、x{n,m}、x|y
  • 非贪婪匹配:*?、+?、??、{n,m}?

二:匹配单个字符与数字

1.点.:匹配除换行符以外的任意字符

2.[]:是字符集合,表示匹配方括号中所包含的任意一个字符

   [0123456789]   表示匹配任意一个数字
        [0-9]   表示匹配任意一个数字
        [yml]   表示匹配'y','m','l'中任意一个字符
        [a-z]   表示匹配任意一个小写字符
        [A-Z]   表示匹配任意一个大写字符
        [0-9a-zA-Z]    表示匹配任意一个数字和字母
        [0-9a-zA-Z_]    表示匹配任意一个数字、字母和下划线

3.^:是脱字符,表示不匹配集合中的字符,注意^在[]中才表示不匹配,在其他位置意义不一样

[^test]  表示匹配除了test这几个字母以外的所有字符
        [^0-9]  表示匹配所有的非数字字符

4.\d:匹配数字,效果同[0-9]

\d       表示匹配任意一个数字,这里可以不写[],直接使用\d
        [^\d]   表示匹配所有的非数字字符,效果同[^0-9]

5.\D:匹配非数字字符,效果同[^0-9]

6.\w:匹配数字、字母和下划线,效果同[0-9a-zA-Z]

7.\W:匹配非数字、字母和下划线,效果同[^0-9a-zA-Z]

8.\s:匹配任意的空白符(空格、换行、回车、换页、制表符),效果同[ \f\n\r\t]

9.\S:匹配任意的非空白符(空格、换行、回车、换页、制表符),效果同[^ \f\n\r\t]

10.举例:

print(re.search(".","tester is a good girl!"))  #.可以代表任意字符,所以匹配t,结果匹配一个t
print(re.search("[0123456789]","yml is a good gril 7"))          #匹配结果为数字7
print(re.search("[tester]","tester is a good gril 7"))                 #匹配结果为一个t
print(re.search("[^tester]","tester is a good gril 7"))               #匹配除tester之外的任意一个字符结果为空" "
print(re.search("[^0-9]","tester is a good gril 7"))                   #匹配一个非数字字符结果为t
print(re.search("\d","tester is a good gril 7"))                         #匹配结果为数字7
print(re.search("[^\d]","tester is a good gril 7"))                     #匹配结果为一个t
print(re.search("\D","tester is a good gril 7"))                        #匹配一个非数字字符结果为t
print(re.search("\w","tester is a good gril 7"))                        #匹配任意一个数字字母或下划线,结果为t

print(re.findall(".","_tester is test\nd girl 3"))                          #匹配除换行符以外的任意字符
print(re.findall(".","_tester is test\nd girl 3",flags=re.S))         #匹配包括换行符在内的任意字符

三:匹配锚字符(边界字符)

1.^:行首匹配,注意^在[]中才表示不匹配集合中的字符

2.$:行尾匹配

3.\A:匹配字符串开始,它和^区别是:

  \A只匹配整个字符串的开头即使在re.M模式下,也不会匹配其他行的行首
       ^匹配的是每行的行首

4.\Z:匹配字符串结束,它和$区别是:

  \Z只匹配整个字符串的结束即使在re.M模式下,也不会匹配其他行的行尾
       $匹配的是每行的行尾

5.\b:匹配一个单词的边界,也就是指单词和空格间的位置

6.\B:匹配非单词的边界,也就是指单词和空格间的位置

7.举例:

print(re.search("^test","test is a good girl")) #表示行首必须要是test开头
print(re.search("girl$","test is a good girl")) #表示行尾必须要是girl结尾

print(re.search("\Atest","test is a good girl"))

print(re.findall("^test","test is a good girl\ntest is a good girl",flags=re.M))
print(re.findall("\Atest","test is a good girl\ntest is a good girl",flags=re.M))

print(re.findall("girl$","test is a good girl\ntest is a good girl",flags=re.M))
print(re.findall("girl\Z","test is a good girl\ntest is a good girl",flags=re.M))

print(re.findall(r"er\b","never"))
print(re.findall(r"er\B","never"))
print(re.findall(r"er\b","nerve"))
print(re.findall(r"er\B","nerve"))

四:匹配多个字符

说明:下方的x、y、z均为假设的普通字符,n、m为非负整数,不是正则表达式的元字符

1.(xyz):匹配小括号内的内容,()内的内容xyz作为一个整体去匹配

2.x?:匹配0个或者1个x,非贪婪匹配(尽可能少的匹配)

3.x*:匹配0个或者任意多个x,贪婪匹配(尽可能多的匹配)

  .*:表示匹配0个或任意多个字符(换行符除外)

4.x+:匹配至少一个x,贪婪匹配(尽可能多的匹配)

5.x{n}:匹配确定的n个x,n是一个非负整数

6.x{n,}:匹配至少n个x,n是一个非负整数

7.x{n,m}:匹配至少n个最多m个x,注意:n <= m

8.x|y:|表示或,匹配的是x或y

9.举例:

print(re.findall(r"(test)","test"))
print(re.findall(r"y?","ytesttest"))  #匹配0个或1个
print(re.findall(r"y*","ytesttest"))  #匹配0个或任意多个,贪婪匹配
print(re.findall(r"y+","ytesttest"))  #匹配至少1个,贪婪匹配

print(re.findall(r"y{3}","ytestyyytest"))  #匹配3个y
print(re.findall(r"y{3,}","yytestyyytest"))  #匹配至少3个y
print(re.findall(r"y{3,6}","yytestyyytest"))  #匹配至少3个y,最多6个y

print(re.findall(r"(t|T)est","tttestttttest"))  #匹配t或T
print(re.findall(r"t|Test","tttestttttest"))
print(re.findall(r"((t|T)est)","tttestttttest"))

#需求:提取tester......girl
str = "tester is a good girl!tester is a nice girl!tester is a very dddd girl"
print(re.findall(r"tester.*girl",str))
print(re.findall(r"tester.*?girl",str))  #非贪婪

五:非贪婪匹配

1.  *?:前一个字符0次或无限次扩展,最小匹配

print(re.findall(r"tes*","tessssssssssssss"))
print(re.findall(r"tes*?","tessssssssssssss"))
print(re.findall(r"tess*","tessssssssssssss"))
print(re.findall(r"tess*?","tessssssssssssss"))

2.  +?:前一个字符1次或无限次扩展,最小匹配

print(re.findall(r"tes+","tessssssssssssss"))
print(re.findall(r"tes+?","tessssssssssssss"))
print(re.findall(r"tess+","tessssssssssssss"))
print(re.findall(r"tess+?","tessssssssssssss"))

3.  ??:前一个字符0次或1次扩展,最小匹配

print(re.findall(r"tes?","tessssssssssssss"))
print(re.findall(r"tes??","tessssssssssssss"))
print(re.findall(r"tess?","tessssssssssssss"))
print(re.findall(r"tess??","tessssssssssssss"))

4.  {n,m}?:扩展前一个字符n到m次,含m,最小匹配

print(re.findall(r"tes{1,2}","tessssssssssssss"))
print(re.findall(r"tesss{1,2}","tessssssssssssss"))
print(re.findall(r"tes{1,2}?","tessssssssssssss"))
print(re.findall(r"tesss{1,2}?","tessssssssssssss"))

python3笔记二十三:正则表达式之元字符的更多相关文章

  1. python3笔记二十三:正则表达式之其他函数

    一:学习内容 re.split函数 re.finditer函数 re.sub函数 group()分组 re.compile函数 二:字符串切割---re.split函数 需要导入包:import re ...

  2. python3.4学习笔记(二十三) Python调用淘宝IP库获取IP归属地返回省市运营商实例代码

    python3.4学习笔记(二十三) Python调用淘宝IP库获取IP归属地返回省市运营商实例代码 淘宝IP地址库 http://ip.taobao.com/目前提供的服务包括:1. 根据用户提供的 ...

  3. (C/C++学习笔记) 二十三. 运行时类型识别

    二十三. 运行时类型识别 ● 定义 运行时类型识别(Run-time Type Identification, RTTI) 通过RTTI, 程序能够使用基类的指针或引用来检查(check)这些指针或引 ...

  4. python3笔记二十二:正则表达式之函数

    一:学习内容 re.match函数 re.search函数 re.findall函数 二:re.match函数 需要导入包:import re 1.格式:match(pattern,string,fl ...

  5. 【Python3 爬虫】08_正则表达式(元字符与语法)

    元字符表 符号 说明 示例 . 表示任意字符 'abc'  >>>'a.c'   >>>结果为:'abc' ^ 表示字符开头 'abc'  >>> ...

  6. Java基础学习笔记二十三 Java核心语法之反射

    类加载器 类的加载 当程序要使用某个类时,如果该类还未被加载到内存中,则系统会通过加载,链接,初始化三步来实现对这个类进行初始化. 加载就是指将class文件读入内存,并为之创建一个Class对象.任 ...

  7. angular学习笔记(二十三)-$http(1)-api

    之前说到的$http.get和$http.post,都是基于$http的快捷方式.下面来说说完整的$http: $http(config) $http接受一个json格式的参数config: conf ...

  8. python3笔记二十四:Mysql数据库操作命令

    一:学习内容 Mysql操作命令:启动服务.停止服务.连接数据库.退出数据库.查看版本.显示当前时间.远程连接 数据库操作命令:创建数据库.删除数据库.切换数据库.查看当前选择的数据库 表操作命令:查 ...

  9. python3笔记二十一:时间操作datetime和calendar

    一:学习内容 datetime calendar 二:datetime 1.模块说明:可以理解为datetime基于time进行了封装,提供了各种使用的函数,datetime模块的接口更直接,更容易调 ...

随机推荐

  1. O036、Snapshot Instance 操作详解

    参考https://www.cnblogs.com/CloudMan6/p/5510296.html   有时候系统损坏的很严重,通过 Rescue 操作无法修复,那么我们就得重新考虑通过备份恢复了. ...

  2. Guava动态调用方法

    前言 大家在Coding的时候,经常会遇到这样一个情况,根据不同的条件去执行对应的代码.我们通常的处理方式是利用if-else判断,或者直接switch-case,特别是jdk1.6之后,swith开 ...

  3. HTML学习记录和总结

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明. 作者:struct_mooc 博客地址:https://www.cnblogs.com/stru ...

  4. 帝国cms 通过栏目获取某个栏目的详情

    当是某个栏目的时候,获取另外一个栏目下第一篇文章的详情,否则获取当前栏目下第一篇文章的详情 <?php $classid = $GLOBALS['navclassid']; if($classi ...

  5. 命令行工具--curl

    目录 命令:curl 一.简介 二.使用案例 1.基本用法 2.保存访问的网页 3.测试网页返回值 4.指定proxy服务器以及其端口 5.cookie 6.模仿浏览器 7.伪造referer(盗链) ...

  6. Linux awk命令 --三剑客老大

    Linux awk命令 --三剑客老大 基本用法: awk  [参数]  ['找谁{干啥}']  文件 参数: -F 分隔符 -v 创建或修改awk变量 OFS 输出分割符 awk显示每一列的时候分隔 ...

  7. 十大排序C语言实现

    #include<stdio.h> #include<stdlib.h> void bubbleSort(int arr[],int size); void Selection ...

  8. 3.Https服务器的配置

    1.前言: 所谓区块链,简而言之就是一种数据结构,每一个区块都像账本的每一页纸记录了该网络上的交易信息,而众多区块在时间的基础上按照顺序连接起 来就形成了区块链.区块链能够以数字方式识别和跟踪交易,并 ...

  9. 访问网络资源的方式--application/json和x-www-form-urlencoded

    以Jsoup为例,x-www-form-urlencoded方式 Map<String,Object> map = new HashMap<>(); map.put(" ...

  10. li每三个换行

      背景:鉴于有时候调取数据用table不方便,所以用的li,但是li又没有table的样式,就需要自己写了 思路:先将所有的li浮动,然后清除第3n+1的浮动(如果是四个则是4n+1) 例子: &l ...