python的内置模块re模块方法详解以及使用
正则表达式
一、普通字符
. 通配符一个.只匹配一个字符
匹配任意除换行符"\n"外的字符(在DOTALL模式中也能匹配换行符
>>> import re
>>> re.findall("abcd","abcdrbnmjfsdsaeedsss")
['abcd']
>>> re.findall("a..d","abcdrbnmjfsdsaeedsss")
['abcd', 'aeed']
^ 以什么开头
>>> re.findall("^a..d","abcdrbnmjfsdsaeedsss")
['abcd']
$ 以什么结尾
>>> re.findall("a..d$","abcdajhd")
['ajhd']
* 代表匹配*前面的字符 重复0到无穷次
>>> re.findall("^g*","ggggggggsdfsdf")
['gggggggg']
>>> re.findall("^g*","gggdfsdf")
['ggg']
>>> re.findall("gou*","gossee")
['go']
>>> re.findall("gou*","gosseegouuusssdd")
['go', 'gouuu']
+ 代表匹配+前面的字符 重复1到无穷次
>>> re.findall("gou+","gossee")
[]
>>> re.findall("gou+","gosseegouuusssdd")
['gouuu']
*和+属于贪婪匹配
? 代表匹配?前面的字符的0次或者是1次
>>> re.findall("gou?","gossee")
['go']
>>> re.findall("gou?","gosseegouuusssdd")
['go', 'gou']
{}可以指定重复几次
{0,} 代表重复{}前面字符的0到无穷次,相当于*
{1,} 代表重复{}前面字符的1到无穷次,相当于+
{0,1}代表重复{}前面字符的0到1次,相当于?
{6}代表重复{}前面字符的6次
{1,3}代表重复{}前面字符的1次到3次
>>> re.findall("gou{3}","gosseegouuusssdd")
['gouuu']
>>> re.findall("gou{0,3}","gosseegouuusssdd")
['go', 'gouuu']
>>> re.findall("gou{0,4}","gosseegouuusssdd")
['go', 'gouuu']
>>> re.findall("gou{4}","gosseegouuusssdd")
[]
>>> re.findall("gou{0}","gosseegouuusssdd")
['go', 'go']
>>> re.findall("gou{1}","gosseegouuusssdd")
['gou']
惰性匹配*? 只要匹配出*前面的字符的0次就不匹配了
>>> re.findall("gou*","gosseegouuusssdd")
['go', 'gouuu']
>>> re.findall("gou*?","gosseegouuusssdd")
['go', 'go']
惰性匹配+? 只要匹配出+前面的字符的1次就不匹配了
>>> re.findall("gou+","gosseegouuusssdd")
['gouuu']
>>> re.findall("gou+?","gosseegouuusssdd")
['gou']
二、字符集[]
1、或的功能
>>> re.findall("x[yz]","xyzzzxyzxssdzx")
['xy', 'xy']
>>> re.findall("x[yz]","xyzzzxzsdxzzy")
['xy', 'xz', 'xz']
>>> re.findall("x[yz]p","xypzzzxzsdxzpzy")
['xyp', 'xzp']
2、[]中的特殊符号- 匹配字母
取小写字母
>>> re.findall("[a-z]","sd67lMNVv17jB5")
['s', 'd', 'l', 'v', 'j']
取大写字母
>>> re.findall("[A-Z]","sd67lMNVv17jB5")
['M', 'N', 'V', 'B']
取大小写字母
>>> re.findall("[A-Za-z]","sd67lMNVv17jB5")
['s', 'd', 'l', 'M', 'N', 'V', 'v', 'j', 'B']
取ab后面跟一个字母 取ab后面跟0个字母或者1个字母
>>> re.findall("ab[a-z]","abclkmnbab")
['abc']
>>> re.findall("ab[a-z]?","abclkmnbab")
['abc', 'ab']
取出字符串中的小写字母连着的字母为一个整体
>>> re.findall("[a-z]+","abc56Pabm902")
['abc', 'abm']
取出字符串中的大写字母,连着为一个整体
>>> re.findall("[A-Z]+","abc56PMabRm902")
['PM', 'R']
取出字符串中的大小写字母,连着的为一体
>>> re.findall("[A-Za-z]+","abc56Pabm902")
['abc', 'Pabm']
>>> re.findall("q[a-z]*","abc56q")
['q']
>>> re.findall("q[a-z]*","abc56qr")
['qr']
>>> re.findall("q[a-z]*","abc56qrg")
['qrg']
>>> re.findall("q[a-z]+","abc56qrg")
['qrg']
>>> re.findall("q[a-z]?","abc56qrg")
3、[]里面的特殊符号^ 是取反的意思
第一个字符是q 第二个字符只要不是a-z的就可以匹配出来
>>> re.findall("q[^a-z]","abc56qrg")
[]
>>> re.findall("q[^a-z]","abc56qrq6g")
['q6']
>>> re.findall("q[^a-z]","abc56qrq6gq677")
['q6', 'q6']
4、[]里面的特殊符号\ 叫转义符 最牛的一个斜杠
\d 匹配任意十进制数,相当于[0-9]
\D 匹配任意非数字字符,相当于[^0-9]
\s 匹配任何空白字符,相当于[\t\n\r\f\v]
\S 匹配任何非空白字符,相当于[^\t\n\r\f\v]
\w 匹配任何字符数字字符,相当于[a-zA-Z0-9_]
\W 匹配任何非字母数字字符,相当于[^a-zA-Z0-9_]
\b 匹配一个特殊字符边界,比如空格 & # 等
匹配下数字
>>> re.findall("\d","12+(34*6+2-5*(2-1+6))")
['', '', '', '', '', '', '', '', '', '']
>>> re.findall("\d+","12+(34*6+2-5*(2-1+6))")
['', '', '', '', '', '', '', '']
匹配下除了数字之外的
>>> re.findall("\D+","12+(34*6+2-5*(2-1+6))")
['+(', '*', '+', '-', '*(', '-', '+', '))']
匹配任何非空字符
>>> re.findall("\S+","hello gouguoqi")
['hello', 'gouguoqi']
匹配空白字符
>>> re.findall("\s+","hello gouguoqi")
[' ']
匹配任意字符和数字字符也包括_
>>> re.findall("\w","hel()*&%34dcsdg_")
['h', 'e', 'l', '', '', 'd', 'c', 's', 'd', 'g', '_']
>>> re.findall("\w+","hel()*&%34dcsdg_")
['hel', '34dcsdg_']
转义功能
>>> re.findall("www*baidu","www*baidu.com")
[]
>>> re.findall("www\*baidu","www*baidu.com")
['www*baidu']
>>> re.findall("www.baidu","wwwkbaidu.com") 这里代表是通配符
['wwwkbaidu']
>>> re.findall("www\.baidu","wwwkbaidu.com")
[]
>>> re.findall("www\.baidu","www.baidu.com")
['www.baidu']
\b匹配特殊边界
>>> re.findall("I","I am LIST")
['I', 'I']
>>> re.findall("^I","I am LIST")
['I']
>>> re.findall("^I","hello I am LIST")
[]
取出中间的大写的I
>>> re.findall(r"I\b","hello I am LIST")
['I']
>>> re.findall("I\\b","hello I am LIST")
['I']
5、取出最里面这个括号里面的元素
>>> re.findall("\([^()]*\)","12+(34*6+2-5*(2-1))")
['(2-1)']
\( 以(开头
\) 以)结尾
[^()] 中间不是括号就行
* 重复前面的0次到无穷次,就是只要里面不是括号可以是其他的无数次
>>> re.findall("\([^()]*\)","12+(34*6+2-5*(2-1+6mk))")
['(2-1+6mk)']
6、| 管道符 或的概念,是匹配2个整体
>>> re.findall("ka|a","abcka|kb")
['a', 'ka']
>>> re.findall("ka|kb","abcka|kbc")
['ka', 'kb']
>>> re.findall("ka|kc","abcka|kbc")
['ka']
7、() 分组
重复c这个字母来匹配
>>> re.findall("abc+","abcccrtfabcasdcabcc")
['abccc', 'abc', 'abcc']
把abc作为一个整体来匹配
>>> re.findall("(abc)+","abccccc")
['abc']
把abc作为一个整体来匹配,重复一次或者多次?:就是去掉括号中的优先级的
>>> re.findall("(?:abc)+","abcccrtfabcabcabcc")
['abc', 'abcabcabc']
8、re的search方法
匹配到第一个之后就不继续往下匹配了
>>> re.search("(abc)","abccccc")
<_sre.SRE_Match object; span=(0, 3), match='abc'>
>>> re.search("\d{2}","abccccc")#匹配不到则返回空
>>> re.search("\d{2}","abcccc9879")#取出来是一个对象,想要值,用group方法
<_sre.SRE_Match object; span=(6, 8), match=''>
>>> re.search("\d{2}","abcccc9879").group()
''
>>> re.search("\d{2}","abcccc9879").group()
''
通过?P<name> 进行分组<>内为组名,在用group方法打印对应的组名
>>> re.search("(?P<name>[a-z]+)\d+","gouguoqi28miaoye29beiye60").group()
'gouguoqi28'
>>> re.search("(?P<name>[a-z]+)\d+","gouguoqi28miaoye29beiye60").group("name")
'gouguoqi'
>>> re.search("(?P<name>[a-z]+)(?P<age>\d+)","gouguoqi28miaoye29beiye60").group(
"age")
''
三、re模块中的常用方法
1、re.findall("a","a bb") 返回所有满足条件的结果,放在列表里面
>>> re.findall("abc","abccccc")
['abc']
2、re.rearch("a","a bb c").group()取出来是一个对象
匹配不到则返回空, 匹配到第一个之后就不继续往下匹配了
>>> re.search("\d{2}","abcccc9879").group()
''
3、re.match("a","abc").group()通search相同,只不过仅在字符串开始出进行匹配
>>> re.match("abc","aaabccccc")
>>> re.match("abc","abccccc")
<_sre.SRE_Match object; span=(0, 3), match='abc'>
>>> re.match("abc","abccccc").group()
'abc'
4、re.split()
>>> re.split(" ","abc cc hello")
['abc', 'cc', 'hello']
>>> re.split("[ |]","abc|cc hello")
['abc', 'cc', 'hello']
>>> re.split("[ab]","asdabcd")
['', 'sd', '', 'cd']
>>> re.split("[ab]","abc")
['', '', 'c']
5、re.sub替换
>>> re.sub("\d+","A","sdfdsfgc56712MMns980")
'sdfdsfgcAMMnsA'
>>> re.sub("\d","A","sdfdsfgc56712MMns980")
'sdfdsfgcAAAAAMMnsAAA'
只匹配前4次
>>> re.sub("\d","A","sdfdsfgc56712MMns980",4)
'sdfdsfgcAAAA2MMns980'
显示出匹配出来的次数
>>> re.subn("\d","A","sdfdsfgc56712MMns980")
('sdfdsfgcAAAAAMMnsAAA', 8)
6、re.compile 编译,提前把匹配规则定义好,直接调用就行了,好处就是可以用多次
>>> com=re.compile("\d+")
>>> com.findall("sdcvf456dfg67")
['', '']
7、re.finditer 把数据存到迭代器里面,用一条拿一条,不浪费内存
>>> re.findall("\d","sdcvf456dfg67")
['', '', '', '', '']
>>> re.finditer("\d","sdcvf456dfg67")
<callable_iterator object at 0x0000000000D92160>
>>> ret=re.finditer("\d","sdcvf456dfg67")
>>> next(ret).group()
''
>>> next(ret).group()
''
>>> next(ret).group()
''
>>> next(ret).group()
''
特例:当有分组的时候findall优先匹配组里面的内容
>>> ret=re.findall("www\.(baidu|163)\.com","www.baidu.com")
>>> re.findall("www\.(baidu|163)\.com","www.baidu.com")
['baidu']
也可以加个?:去掉优先级
>>> re.findall("www\.(?:baidu|163)\.com","www.baidu.comaawww.163.combv")
['www.baidu.com', 'www.163.com']
python的内置模块re模块方法详解以及使用的更多相关文章
- Python操作SQLite数据库的方法详解
Python操作SQLite数据库的方法详解 本文实例讲述了Python操作SQLite数据库的方法.分享给大家供大家参考,具体如下: SQLite简单介绍 SQLite数据库是一款非常小巧的嵌入式开 ...
- python中requests库使用方法详解
目录 python中requests库使用方法详解 官方文档 什么是Requests 安装Requests库 基本的GET请求 带参数的GET请求 解析json 添加headers 基本POST请求 ...
- python的内置模块xml模块方法 xml解析 详解以及使用
一.XML介绍 xml是实现不同语言或程序直接进行数据交换的协议,跟json差不多,单json使用起来更简单,不过现在还有很多传统公司的接口主要还是xml xml跟html都属于是标签语言 我们主要学 ...
- Python实战之logging模块使用详解
用Python写代码的时候,在想看的地方写个print xx 就能在控制台上显示打印信息,这样子就能知道它是什么了,但是当我需要看大量的地方或者在一个文件中查看的时候,这时候print就不大方便了,所 ...
- Python内置OS模块用法详解
大家好,从今天起早起Python将持续更新由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手易理解的代码与注释及动态演示.刚入门的读者千万不要错过! 很多人学习python,不知 ...
- python的内置模块random随机模块方法详解以及使用案例(五位数随机验证码的实现)
1.random(self): Get the next random number in the range [0.0, 1.0) 取0到1直接的随机浮点数 import random print( ...
- python的内置模块之os模块方法详解以及使用
1.getcwd() 获取当前工作路径 import os print(os.getcwd()) C:\python35\python3.exe D:/pyproject/day21模块/os模块.p ...
- python os模块方法详解
os.access() 方法使用当前的uid/gid尝试访问路径.大部分操作使用有效的 uid/gid, 因此运行环境可以在 suid/sgid 环境尝试. 实例: os.chdir() 方法用于改变 ...
- Python学习笔记:魔术方法详解
准备工作 为了确保类是新型类,应该把 _metaclass_=type 入到你的模块的最开始. class NewType(Object): mor_code_here class OldType: ...
随机推荐
- mfc c++字符串类与 流输出
一.命名空间 所谓命名空间(namespace),是指标识符的各种可见范围.C++标准程序库中的所有标识符都被定义于一个名为std的命名空间(namespace)中.而我们要使用的string类也是一 ...
- RabbitMQ 汇总
<RabbitMQ Tutorial>译文 第 1 章 简介 <RabbitMQ Tutorial>译文 第 2 章 工作队列 <RabbitMQ Tutorial> ...
- CSS技巧收集——毛玻璃效果
先上 demo和 源码 其实毛玻璃的模糊效果技术上比较简单,只是用到了 css 滤镜(filter)中的 blur 属性.但是要做一个好的毛玻璃效果,需要注意很多细节. 比如我们需要将上图中页面中间的 ...
- [PLC]ST语言四:INV_MEP_MEF_PLS_PLF_MC_MCR
一:INV_MEP_MEF_PLS_PLF_MC_MCR 说明:简单的顺控指令不做其他说明. 控制要求:无 编程梯形图: 结构化编程ST语言: (*运算结果的反转INV(EN);*) M415:=in ...
- unity ray和line射线检测
RaycastHit 光线投射碰撞 Struct Structure used to get information back from a raycast. 用来获取从raycast函数中得到的信息 ...
- 树莓派Raspberry Pi微改款,Model B 3+规格探析
18年3月树莓派基金会推出了ModelB 3+版的新款树莓派单板计算机.从编号数字上看,3+仅是3的再提升,在规格上有小幅异动,究竟改进或提升了哪些部分,本文将对此进行探讨. 树莓派版本观察 从过往的 ...
- 树形DP ---- Codeforces Global Round 2 F. Niyaz and Small Degrees引发的一场血案
Aspirations:没有结果,没有成绩,acm是否有意义?它最大的意义就是让我培养快速理解和应用一个个未知知识点的能力. ————————————————————————————————————— ...
- Mac下搭建lamp
Mac下搭建lamp Mac 自带了Apache,并默认支持PHP环境,只需要配置Apache和PHP即可使用.需要单独安装mysql服务端. Apache 基础配置 Apache支持PHP配置 Ap ...
- 一些常用SQL语句大全
一.基础 1.说明:创建数据库 CREATE DATABASE database-name 2.说明:删除数据库 drop database dbname 3.说明:备份sql server --- ...
- 软件工程学习之小学四则混合运算出题软件 Version 1.00 设计思路及感想
对于小学四则混合运算出题软件的设计,通过分析设计要求,我觉得为了这个软件在今后便于功能上的扩充,可以利用上学期所学习的<编译原理>一课中的LL1语法分析及制导翻译的算法来实现.这样做的好处 ...