python的re正则表达式模块
元字符 . * + ? ^ $ { } [ ] - \
. 匹配除了/n之外的任意一个字符
* 匹配*前面的单个字符任意次,即[0,+∞]
+ 匹配+前面的单个字符一次或多次,即[1,+∞]
? 匹配?前面的单个字符0次或一次,即[0,1]
^ 匹配以^后字符串整体开头的
$ 匹配以$前字符串整体结尾的
{ }匹配前面单个字符多次,{0,}相当于*,{1,}相当于+,{0,1}相当于?,{n}表示匹配n次,{m,n}表示最少匹配m次最多匹配n次(m<n)
(*、+、?、{ }单独使用都是贪婪匹配,即最可能多的匹配,在后面再加上?会变成惰性匹配,即尽可能少的匹配)
[ ]匹配字符集中的任意一个元素,在字符集中,除了-(表示两者之间)、^(表示非)和\(转义)有特殊含义 ,其他字符都表示普通字符,例如逗号就表示一个字符
| 匹配|前面或后面字符串整体
\d 匹配任何十进制数,相当于[0-9]
\D 匹配任何非0-9字符,相当于[^0-9]
\s 匹配任何空白字符,相当于[\t\n\r\f\v]
\S 匹配任何非空白字符,相当于[^\t\n\r\f\v]
\w 匹配任何字母和数字字符,相当于[a-zA-Z0-9]
\W 匹配任何非字母和数字字符,相当于[^a-zA-Z0-9]
\b 匹配一个特殊字符
\.、\*、\^、\$ 使\后面的字符表示本来的意义,不再表示元字符所代表的的特殊意义
import re
print(re.findall('al.x','12alexh'))
print(re.findall('alex*','12aleh'))
print(re.findall('alex+','12aleh'))
print(re.findall('alex?','12aleh'))
print(re.findall('^alex','alhjw'),re.findall('^alex','alexhjw'))
print(re.findall('alex$','wertalex'))
print(re.findall('alex{2,5}','alexxxxh'),re.findall('alex{2,5}?','alexxxxh'))
print(re.findall('al[e*g]x','alexlal*xg'))
print(re.findall('al[a-g]x','alexalwx'),re.findall('al[^a-g]x','alexalwx'),re.findall('al[^ag]x','alexalwx'))
print(re.findall('\d+','2+3*4-(26-7)'),re.findall('\D+','2+3*4-(26-7)'))
print(re.findall('\s+','hello world'),re.findall('\S+','hello world'))
print(re.findall('\w+','12@f\nlh58'),re.findall('\W+','12@f\nlh58'))
print(re.findall('www\.baidu','www.baidu'),re.findall('www\*baidu','www*baidu'))
print(re.findall('d\\\\k','12d\kc2f')) #d\\\\k通过python解释器解释之后,传给re模块的是\\k,re将第一个\解释为转义,余下的\k用作匹配
输出
['alex']
['ale']
[]
['ale']
[] ['alex']
['alex']
['alexxxx'] ['alexx']
['alex', 'al*x']
['alex'] ['alwx'] ['alex', 'alwx']
['', '', '', '', ''] ['+', '*', '-(', '-', ')']
[' '] ['hello', 'world']
['', 'f', 'lh58'] ['@', '\n']
['www.baidu'] ['www*baidu']
() 进行分组
print(re.findall('www.(baidu|163).com','www.baidu.com')) #['baidu']
print(re.findall('www.(?:baidu|163).com','www.baidu.com')) #['www.baidu.com']
使用()进行分组匹配时,优先显示匹配到的内容
在括号内要匹配的字符串之前加?:,表示去掉优先显示,即显示所有的结果
findall将所有符合条件的匹配结果放在一个列表内
search匹配到一个就停止,且结果为一个对象,需要通过对象的group( )方法取值
match类似search,但是match只匹配在开头出现的
三个的使用方法都类似re.findall('匹配规则','匹配字符串')
(?P<name>'匹配规则'):表示将匹配规则命名为name,后续可通过group(name)取结果
print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group()) #输出alex35,group不加参数默认输出第一个即group(0)
print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group('name')) #输出alex
print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group('age')) #输出35
print(re.match('a+ex','aaex12').group(),re.match('a+ex','1aaex12')) #输出aaex None
split字符串分割,分割结果不包含用来分割的字符,使用方法re.split('分割符','处理字符串')
print(re.split('[ ,]','hi,nice to meet you')) #输出['hi', 'nice', 'to', 'meet', 'you']
print(re.split('[ab]','8an8ab9jfahb'))# ['8','n8','','9jf','h',''] #输出['8', 'n8', '', '9jf', 'h', '']
第一个表示以空格或逗号分割
第二个表示以a或b分割,分割过程如下
原字符串中第2位的a将原字符串分割为8和n8ab9jfahb,取得第一个分割结果8
n8ab9jfahb中第3位的a将字符串分割为n8和b9jfahb,取得第二个分割结果n8
b9jfahb中第一位的b将字符串分割为''(由于b左边为空)和9jfahb,取得第三个分割结果''
9jfahb中第四位的a将字符串分割为9jh和hb,取得第四个分割结果9jh
hb中第二位的b将字符串分割为h和''(由于b右边为空),取得第五、六个分割结果h、''
sub替换,使用方法re.sub('被替换字符','替换字符','处理字符串'[,替换次数]),如果没有替换次数默认替换所有
subn替换和替换次数,使用方法re.subn('被替换字符','替换字符','处理字符串'),返回一个元组,第一个元素为替换后的结果,第二个元素为替换次数,
print(re.sub('\d+','A','h3e34ff7'),re.sub('\d+','A','h3e34ff7',2)) #hAeAffA hAeAff7
print(re.subn('\d+','A','h3e34ff7')) #('hAeAffA', 3)
compile事先编译匹配规则
com=re.compile('a+b')
print(com.findall('2aabcde')) #输出['aab']
print(com.match('abcde').group()) #输出ab
print(com.sub('F','2abc78aabcd')) #输出2Fc78Fcd
finditer 将匹配结果放入一个迭代器,再通过迭代器的next方法取值
s=re.finditer('s+','1ss34sssdaes')
print(s) #输出<callable_iterator object at 0x0000000001E320F0>,表示结果为一个迭代器
print(next(s)) #输出<re.Match object; span=(1, 3), match='ss'>,表示结果为一个对象,且匹配到的为ss
print(next(s).group()) #输出sss,通过对象的group()方法取到第二次next的值sss
python的re正则表达式模块的更多相关文章
- python的re正则表达式模块学习
python中re模块的用法 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析.复杂字符串分析和信息提取时是一个非常有用的工 ...
- Python中re(正则表达式)模块学习
re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. import re text = "JGood is a handsome boy, he ...
- Python中re(正则表达式)模块使用方法
Python中常用的正则表达式处理函数: re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. import re text = "JGood ...
- Python数据分析学习-re正则表达式模块
正则表达式 为高级的文本模式匹配.抽取.与/或文本形式的搜索和替换功能提供了基础.简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了模式的重复或者表述多个字符,于 ...
- Python 正则表达式模块 (re) 简介
Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用这一内嵌于 Python 的语言工具,尽管不能 ...
- Python::re 模块 -- 在Python中使用正则表达式
前言 这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细 ...
- Python正则表达式模块(re模块)
Python是我接触到的第一门编程语言,虽然它足够简单,但是对于当时刚刚接触编程语言的我来说还是有些难度的,于是只是了解了一些Python的基本语法,稍微深入一点的地方都没怎么了解.不过,到现在为止, ...
- Python中的re模块--正则表达式
Python中的re模块--正则表达式 使用match从字符串开头匹配 以匹配国内手机号为例,通常手机号为11位,以1开头.大概是这样13509094747,(这个号码是我随便写的,请不要拨打),我们 ...
- python中的正则表达式--re模块
参考博客:https://www.cnblogs.com/tina-python/p/5508402.html 这里说一下python的re模块即正则表达式模块,先列出其中涉及到的各种字符和模式等: ...
随机推荐
- mysql 数据库简介
1. 什么是数据库 数据库(Database)是按照数据结构来组织.存储和管理数据的仓库, 每个数据库都有一个或多个不同的API用于创建,访问,管理,搜索和复制所保存的数据. 我们也可以将数据存储在文 ...
- 微信都在用的移动敏捷测试方法和工具|视频+PPT
本文是腾讯优测总监雷彬在MPD2016 北京站上的演讲视频.他详细讲述了腾讯多年来在实践敏捷研发过程中测试的优化之路,为测试角色(包括测试工程师和开发自测)提供敏捷作业的思路.点击此处观看视频.时长5 ...
- C++中引用与取地址
所谓引用就是为对象起一个别名.例如变量b = &a,b就是a的一个引用.对b的任何操作等同于对a的操作,也就是说,如果你改变了b的值,同时a的值也会发生改变.b就是a的另外一个名字,他们实质是 ...
- oracle中动态SQL使用详细介绍
Oracle编译PL/SQL程序块分为两个种:通常静态SQL采用前一种编译方式,而动态SQL采用后一种编译方式,需要了解的朋友可以参考下 1.静态SQLSQL与动态SQL Oracle编译PL ...
- python3学习笔记(7)_listComprehensions-列表生成式
#python3 学习笔记17/07/11 # !/usr/bin/env python3 # -*- conding:utf-8 -*- #通过列表生成式可以生成格式各样的list,这种list 一 ...
- PAC 自动代理
最近看了 HTTP权威指南 里面有关于 代理的介绍,代理有很多种,今天主要来说说 自动代理PAC PAC(Proxy Auto Config) 是一个 Script:经由编写这个 Script,我们 ...
- MySQL left join right join inner join
好记性不如烂笔头 sql连接共三种:内连接,外连接,交叉连接. 内连接包含:等值连接,不等值连接,自然连接 外连接包含:左连接(左外连接),右连接(右外连接) 具体理论见我的博文http://blog ...
- Spark-自定义排序
一.自定义排序规则-封装类 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} /** ...
- CF750F New Year and Finding Roots 构造+树论
正解:构造 解题报告: 传送门! 交互题交互题!哇好新鲜啊QwQ 首先考虑最傻逼的做法,应该是每个人都能想到的 首先看一下它给的条件,考虑到完全二叉树的性质,就可以发现,如果给的邻居只有一个,说明是叶 ...
- 洛谷P1083 借教室 NOIP2012D2T2 线段树
正解:线段树 解题报告: ...真的不难啊只是开了这个坑就填下? 就是先读入每天的教室数建个线段树然后每次读入就update一下,线段树存的就这一段的最小值啊,然后如果有次更新完之后tr[1]小于0了 ...