知识储备:

\w 匹配任何字母/数字,下划线

正则表达式进阶:

re.match('com', 'comwww.runcomoob')
re.search('\dcom', 'www.4comrunoob.5com')
一旦匹配成功,就返回一个match object 对象,对象拥有下列方法;
group() 返回被re 匹配的字符串
start() 返回匹配开始的位置
end() 返回匹配结束的位置(返回结果是索引加1,和分片一样,不包括组的结束位置)
span() 返回一个元组包含匹配(开始,结束)的位置

match() 只匹配起始位置

s = re.match('com', 'www.runcoomoob')
print(s) #None
print(s.span()) #注意位置,不是0-3 Traceback (most recent call last):
File "C:/Users/Administrator/PycharmProjects/laonanhai/day6_test/s9.py", line 15, in <module>
print(s.span()) #注意位置,不是0-3
AttributeError: 'NoneType' object has no attribute 'span'
search() 注意前面的找到则不再往后找
s2 = re.search('com', 'www.runcomoocomb')
print(s2)
#<_sre.SRE_Match object; span=(7, 10), match='com'> 注意前面的找到则不再往后找

sub/subn 替换  re.sub(pattern, repl, string, max)   max 最大替换次数

s3 = re.sub("g.t", "have", "I get A, I got B, I gut C", 2)
print(s3) #I have A, I have B, I gut C s4 = re.subn("g.t", "have", "I get A, I got B, I gut C")
print(s4) #('I have A, I have B, I gut C', 2) 多了替换次数

 re.split()  分割

s5 = re.split('\d+', 'one1two2three3four4')
print(s5) #['one', 'two', 'three', 'four', ''] 注意最后是''

  把那些经常使用的正则表达式编译成正则表达式对象,可以提高一定的效率!

text = 'JGood is a handsome boy, he is cool, clever, and so on...'
regex = re.compile(r'\w*oo\w*') #regex 是对象
print(regex.findall(text)) #['JGood', 'cool']

正则分组

正则分组:去已经匹配到的数据中再匹配数据(这句话超超重要!!)
举例:

# 无分组
origin = "has fkdghggfhh"
r = re.match("h\w+", origin)
print(r.group()) # 获取匹配到的所有结果
print(r.groups()) # 获取模型中匹配到的分组结果
print(r.groupdict()) # 获取模型中匹配到的分组结果 # has
# ()
# {}
import re

m = re.search("(?P<year>[0-9]{4})", "test 2017abc")
print(m)
print(m.group())
print(m.groups())
print(m.group("year"))

输出:

<_sre.SRE_Match object; span=(5, 9), match=''>
2017
('',)
2017
search()  分组和match()一样,只是找的方式不同
# search()  分组也一样,只是找的方式不同
origin = "has fkdghggfhh"
r = re.match("h(?P<name>\w+)", origin) #给字典添加key,注意括号!!
print(r.group()) # 获取匹配到的所有结果
print(r.groups()) # 获取模型中匹配到的分组结果
print(r.groupdict()) # 获取模型中匹配到的分组中所有执行了key的组 # has
# ('as',)
# {'name': 'as'}

下面是示例,自己看看肯定看得懂的啦


origin = "has fkdghggfhh hal"
#r = re.findall("(h\w+)", origin) #无用分组 ['has', 'hggfhh', 'hal']
#r = re.findall("h(\w+)", origin) #只拿分组里面的东西 ['as', 'ggfhh', 'al']

origin = "hasbbcc fkdghggbbccfhhbbcc halbbcc"
r = re.findall("h(\w+)bbc", origin) #['as', 'ggbbcfhh', 'al']
r = re.findall("h(\w+)b(bc)c", origin)
print(r) #[('as', 'bc'), ('ggbbccfhh', 'bc'), ('al', 'bc')]
 

接下来讲一个蛮重要的点

split() 与正则分组

# 无分组
origin = "hello alex bcd alex lge alex acd 19"
r = re.split("alex", origin, 1)
print(r) #['hello ', ' bcd alex lge alex acd 19']
# 有分组
origin = "hello alex bcd alex lge alex acd 19"
r1 = re.split("(alex)", origin, 1)
print(r1) #['hello ', 'alex', ' bcd alex lge alex acd 19']
r2 = re.split("al(ex)", origin, 1) #重要
print(r2) #['hello ', 'ex', ' bcd alex lge alex acd 19']

欢迎转发!
This is zcl‘s article! Thanks for your support!
文章出处:http://www.cnblogs.com/0zcl
作者:zcl

python之(re)正则表达式下的更多相关文章

  1. python基础之正则表达式

    正则表达式语法 正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则 ...

  2. python之(re)正则表达式上

    python正则表达式知识预备 正则表达式使用反斜杠" \ "来代表特殊形式或用作转义字符,这里跟Python的语法冲突,因此,Python用" \\\\ "表 ...

  3. Python::re 模块 -- 在Python中使用正则表达式

    前言 这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细 ...

  4. python的re正则表达式模块学习

    python中re模块的用法   Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析.复杂字符串分析和信息提取时是一个非常有用的工 ...

  5. Python基础之 正则表达式指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程 ...

  6. Python系列之正则表达式详解

    Python 正则表达式模块 (re) 简介 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用 ...

  7. 【转载】Python中的正则表达式教程

    本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...

  8. Python中的正则表达式教程

    本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...

  9. [Python]网络爬虫(七):Python中的正则表达式教程

    转自:http://blog.csdn.net/pleasecallmewhy/article/details/8929576#t4 接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一 ...

随机推荐

  1. 恢复MySQL主从数据一致性的总结

    今日上午,同事告知,MySQL主从数据库的数据不一致,猜测备库在同步过程中出现了问题,于是,登上备库,使用 mysql> show slave status\G查看,果然,备库在insert语句 ...

  2. Pointer is missing a nullability type specifier (__nonnull or __nullable)

    我们都知道在swift中,可以使用!和?来表示一个对象是optional的还是non-optional,如view?和view!.而在Objective-C中则没有这一区分,view即可表示这个对象是 ...

  3. UIScrollView的delaysContentTouches与canCencelContentTouches属性

    UIScrollView有一个BOOL类型的tracking属性,用来返回用户是否已经触及内容并打算开始滚动,我们从这个属性开始探究UIScrollView的工作原理: 当手指触摸到UIScrollV ...

  4. 1Z0-053 争议题目解析690

    1Z0-053 争议题目解析690 考试科目:1Z0-053 题库版本:V13.02 题库中原题为: 690.The database users regularly complain about t ...

  5. MonoGame 3.2 下,截屏与 Texture2D 的保存

    10月20日注:后来发现了这篇博文(英文),XNA 中的 Color 实际上是与 Alpha 值自左乘(premultiplied)的,这也解释了直接用 0xARGB 转译而颜色异常的原因. 注意,由 ...

  6. JSP自定义tag

    前端需要调用后端的配置,想起velocity-tools.然而jsp的话,目前只能想到tag和EL表达式了. Tag相当好写,jsp2.0提供了简化写法: 编写一个java类: public clas ...

  7. iOS 商品倒计时 限时特价 限时优惠 功能的封装

    最近项目中多个页面用到了 商品特价倒计时的功能  为了偷懒 于是自己封装了一个限时抢购 倒计时的view 代码实现如下: 定向价 限时特价 模型代码实现: #pragma mark 商品定向价模型 @ ...

  8. 分享一个基于HTML5实现的视频播放器

    什么是hivideo? 最近一段时间在使用PhoneGap开发一个App应用,App需要播放视频,本想直接使用html5的video,但使用它在全屏播放时不支持横屏播放,只能放弃.最终决定还是自己封装 ...

  9. 【翻译】设计模式学习系列1---【Design Patterns Simplified: Part 1【设计模式简述:第一部分】】

    原文链接:http://www.c-sharpcorner.com/UploadFile/19b1bd/design-patterns-simplified-part1/ Design Pattern ...

  10. authentication与网站安全验证

    1.Forms 身份验证提供程序 通过 Forms 身份验证,可以使用所创建的登录窗体验证用户的用户名和密码.未经过身份验证的请求被重定向到登录页,用户在该页上提供凭据和提交窗体.如果应用程序对请求进 ...