python的re正则表达式模块

元字符 . * + ? ^ $ { } [ ] - \

. 匹配除了/n之外的任意一个字符

* 匹配*前面的单个字符任意次，即[0,+∞]

+ 匹配+前面的单个字符一次或多次，即[1,+∞]

? 匹配?前面的单个字符0次或一次，即[0,1]

^ 匹配以^后字符串整体开头的

$ 匹配以$前字符串整体结尾的

{ }匹配前面单个字符多次，{0,}相当于*，{1,}相当于+，{0,1}相当于?，{n}表示匹配n次，{m,n}表示最少匹配m次最多匹配n次(m<n)

（*、+、?、{ }单独使用都是贪婪匹配，即最可能多的匹配，在后面再加上?会变成惰性匹配，即尽可能少的匹配）

[ ]匹配字符集中的任意一个元素，在字符集中，除了-(表示两者之间)、^(表示非)和\(转义)有特殊含义，其他字符都表示普通字符，例如逗号就表示一个字符

| 匹配|前面或后面字符串整体

\d 匹配任何十进制数，相当于[0-9]

\D 匹配任何非0-9字符，相当于[^0-9]

\s 匹配任何空白字符，相当于[\t\n\r\f\v]

\S 匹配任何非空白字符，相当于[^\t\n\r\f\v]

\w 匹配任何字母和数字字符，相当于[a-zA-Z0-9]

\W 匹配任何非字母和数字字符，相当于[^a-zA-Z0-9]

\b 匹配一个特殊字符

\.、\*、\^、\$ 使\后面的字符表示本来的意义，不再表示元字符所代表的的特殊意义

import re

print(re.findall('al.x','12alexh'))

print(re.findall('alex*','12aleh'))

print(re.findall('alex+','12aleh'))

print(re.findall('alex?','12aleh'))

print(re.findall('^alex','alhjw'),re.findall('^alex','alexhjw'))

print(re.findall('alex$','wertalex'))

print(re.findall('alex{2,5}','alexxxxh'),re.findall('alex{2,5}?','alexxxxh'))

print(re.findall('al[e*g]x','alexlal*xg'))

print(re.findall('al[a-g]x','alexalwx'),re.findall('al[^a-g]x','alexalwx'),re.findall('al[^ag]x','alexalwx'))

print(re.findall('\d+','2+3*4-(26-7)'),re.findall('\D+','2+3*4-(26-7)'))

print(re.findall('\s+','hello world'),re.findall('\S+','hello world'))

print(re.findall('\w+','12@f\nlh58'),re.findall('\W+','12@f\nlh58'))

print(re.findall('www\.baidu','www.baidu'),re.findall('www\*baidu','www*baidu'))
print(re.findall('d\\\\k','12d\kc2f'))   #d\\\\k通过python解释器解释之后，传给re模块的是\\k，re将第一个\解释为转义，余下的\k用作匹配

输出

['alex']

['ale']

[]

['ale']

[] ['alex']

['alex']

['alexxxx'] ['alexx']

['alex', 'al*x']

['alex'] ['alwx'] ['alex', 'alwx']

['', '', '', '', ''] ['+', '*', '-(', '-', ')']

[' '] ['hello', 'world']

['', 'f', 'lh58'] ['@', '\n']

['www.baidu'] ['www*baidu']

() 进行分组

print(re.findall('www.(baidu|163).com','www.baidu.com'))  #['baidu']

print(re.findall('www.(?:baidu|163).com','www.baidu.com'))  #['www.baidu.com']

使用()进行分组匹配时，优先显示匹配到的内容

在括号内要匹配的字符串之前加?:，表示去掉优先显示，即显示所有的结果

findall将所有符合条件的匹配结果放在一个列表内

search匹配到一个就停止，且结果为一个对象，需要通过对象的group( )方法取值

match类似search，但是match只匹配在开头出现的

三个的使用方法都类似re.findall('匹配规则','匹配字符串')

(?P<name>'匹配规则')：表示将匹配规则命名为name，后续可通过group(name)取结果

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group())  #输出alex35，group不加参数默认输出第一个即group(0)

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group('name'))  #输出alex

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)','alex35Alice28Bob30').group('age'))  #输出35

print(re.match('a+ex','aaex12').group(),re.match('a+ex','1aaex12'))  #输出aaex None

split字符串分割，分割结果不包含用来分割的字符，使用方法re.split('分割符','处理字符串')

print(re.split('[ ,]','hi,nice to meet you'))  #输出['hi', 'nice', 'to', 'meet', 'you']

print(re.split('[ab]','8an8ab9jfahb'))# ['8','n8','','9jf','h','']  #输出['8', 'n8', '', '9jf', 'h', '']

第一个表示以空格或逗号分割

第二个表示以a或b分割，分割过程如下

原字符串中第2位的a将原字符串分割为8和n8ab9jfahb，取得第一个分割结果8

n8ab9jfahb中第3位的a将字符串分割为n8和b9jfahb，取得第二个分割结果n8

b9jfahb中第一位的b将字符串分割为''(由于b左边为空)和9jfahb，取得第三个分割结果''

9jfahb中第四位的a将字符串分割为9jh和hb，取得第四个分割结果9jh

hb中第二位的b将字符串分割为h和''(由于b右边为空)，取得第五、六个分割结果h、''

sub替换，使用方法re.sub('被替换字符','替换字符','处理字符串'[,替换次数])，如果没有替换次数默认替换所有

subn替换和替换次数，使用方法re.subn('被替换字符','替换字符','处理字符串')，返回一个元组，第一个元素为替换后的结果，第二个元素为替换次数，

print(re.sub('\d+','A','h3e34ff7'),re.sub('\d+','A','h3e34ff7',2))  #hAeAffA hAeAff7

print(re.subn('\d+','A','h3e34ff7'))  #('hAeAffA', 3)

compile事先编译匹配规则

com=re.compile('a+b')

print(com.findall('2aabcde'))  #输出['aab']

print(com.match('abcde').group())  #输出ab

print(com.sub('F','2abc78aabcd'))  #输出2Fc78Fcd

finditer 将匹配结果放入一个迭代器，再通过迭代器的next方法取值

s=re.finditer('s+','1ss34sssdaes')

print(s)  #输出<callable_iterator object at 0x0000000001E320F0>，表示结果为一个迭代器

print(next(s))  #输出<re.Match object; span=(1, 3), match='ss'>，表示结果为一个对象，且匹配到的为ss

print(next(s).group())  #输出sss，通过对象的group()方法取到第二次next的值sss

python的re正则表达式模块的更多相关文章

python的re正则表达式模块学习
python中re模块的用法 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析.复杂字符串分析和信息提取时是一个非常有用的工 ...
Python中re(正则表达式)模块学习
re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. import re text = "JGood is a handsome boy, he ...
Python中re(正则表达式)模块使用方法
Python中常用的正则表达式处理函数: re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. import re text = "JGood ...
Python数据分析学习-re正则表达式模块
正则表达式为高级的文本模式匹配.抽取.与/或文本形式的搜索和替换功能提供了基础.简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了模式的重复或者表述多个字符,于 ...
Python 正则表达式模块 (re) 简介
Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用这一内嵌于 Python 的语言工具,尽管不能 ...
Python::re 模块 -- 在Python中使用正则表达式
前言这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细 ...
Python正则表达式模块（re模块）
Python是我接触到的第一门编程语言,虽然它足够简单,但是对于当时刚刚接触编程语言的我来说还是有些难度的,于是只是了解了一些Python的基本语法,稍微深入一点的地方都没怎么了解.不过,到现在为止, ...
Python中的re模块--正则表达式
Python中的re模块--正则表达式使用match从字符串开头匹配以匹配国内手机号为例,通常手机号为11位,以1开头.大概是这样13509094747,(这个号码是我随便写的,请不要拨打),我们 ...
python中的正则表达式--re模块
参考博客:https://www.cnblogs.com/tina-python/p/5508402.html 这里说一下python的re模块即正则表达式模块,先列出其中涉及到的各种字符和模式等: ...

随机推荐

找到多个与名为“xxx”的控制器匹配的类型。如果为此请求(“{controller}/{action}/{id}”)提供服务的路由没有指定命名空间以搜索与此请求相匹配的控制器，则会发生这种情况。
一次在建MVC 项目的进行开发的时候,因为后来想到了一个更好的项目名称,就把 Web项目的名称重命名改了, 然后程序集名称,默认命名空间,都改成新的了,刚建立的项目本身也不大,运行起来,总是报 & ...
PAT-GPLT L2-027 - 名人堂与代金券 - [简单模拟]
题目链接:https://www.patest.cn/contests/gplt/L2-027 对于在中国大学MOOC(http://www.icourse163.org/)学习“数据结构”课程的学生 ...
ECNU 3247 - 铁路修复计划
Time limit per test: 2.0 seconds Time limit all tests: 15.0 seconds Memory limit: 256 megabytes 在 A ...
apparmor 引起自定义mysql 日志问题
今天手贱,看到mysql 的日志在/var/log/mysql下面.总是觉得别扭,于是就想改变日志的位置, 本人开发环境 vagrant + ubuntu12.04 ,在/etc/mysql/mys ...
2018/03/11 每日一个Linux命令之 top
每日一个Linux命令之 top 今天在公司测试服务器上跑了一个我写的功能[本地测试过的],但是不知道怎么跑了个无限死循环出来,一个文件的体积在不停的变大,如果不管的话这能行? 上去一看,PHP ...
Django ORM之QuerySet
Django ORM用到三个类:Manager.QuerySet.Model.Manager定义表级方法(表级方法就是影响一条或多条记录的方法),我们可以以models.Manager为父类,定义自己 ...
IO流（5）判断功能
判断功能: * public boolean isDirectory():判断是否是目录 * public boolean isFile():判断是否是文件 * public boolean exis ...
VUE 使用之：nextTick
<div class="app"> <div ref="msgDiv">{{msg}}</div> <div v-if ...
ubuntu 下执行定时任务
Window shell文件在linux系统下执行不了的解决办法一些人喜欢用vim来写linux shell script, 但是, 有的人喜欢在Windows下用一些方便的编辑器(比如鼎鼎大名的N ...
The Die Is Cast(poj 1481简单的双dfs)
http://poj.org/problem?id=1481 The Die Is Cast Time Limit: 1000MS Memory Limit: 10000K Total Submi ...

python的re正则表达式模块

python的re正则表达式模块的更多相关文章

随机推荐

热门专题