Learning Python 008 正则表达式-002 findall()方法
Python 正则表达式 — findall()
方法
重点 findall()
方法的使用 — 程序讲解
简单的符号的使用
正则表达式的库文件是re
,先导入库文件:
import re
.
的使用举例
# -?- coding: utf-8 -?-
import re
a = 'abca123'
b = re.findall('a.', a)
print(b)
输出
['ab', 'a1']
.
是一个占位符,我们将程序改成下面这个样子,再试试看:
# -?- coding: utf-8 -?-
import re
a = 'abca123'
b = re.findall('a..', a)
print(b)
输出
['abc', 'a12']
所以,几个.
,就表示会面保留几位。
*
的使用举例
# -?- coding: utf-8 -?-
import re
a = 'abca123'
b = re.findall('a*', a)
print(b)
运行
['a', '', '', 'a', '', '', '', '']
?
的使用举例
# -?- coding: utf-8 -?-
import re
a = 'abca123'
b = re.findall('a?', a)
print(b)
运行
['a', '', '', 'a', '', '', '', '']
组合的符号的使用
.*
的使用举例
# -?- coding: utf-8 -?-
import re
secret_code = 'sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl'
b = re.findall('ooxx.*xxoo', secret_code )
print(b)
运行
['ooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoo']
.*
得到最多的匹配结果。我先解释一下上面为什么会得到这样的结果。程序将第一个ooxx
和最后一个xxoo
视为一组ooxx.*xxoo
。.*
使用贪心算法,能找多少找多少,只要能满足条件,反正就是越多越好。
.*?
的使用举例
# -?- coding: utf-8 -?-
import re
secret_code = 'sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl'
b = re.findall('ooxx.*?xxoo', secret_code )
print(b)
运行
['ooxxIxxoo', 'ooxxamxxoo', 'ooxxAoboxxoo', 'ooxxSirxxoo']
.*?
使用非贪心算法,和上面.*
形成对比。
()
的使用举例
# -?- coding: utf-8 -?-
import re
secret_code = 'sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl'
b = re.findall('ooxx(.*?)xxoo', secret_code )
print(b)
运行
['I', 'am', 'Aobo', 'Sir']
当我们需要的内容,我们就使用()
给括上。
我先来讲一个关于\n
换行符的正则表达式的知识点:
# -?- coding: utf-8 -?-
import re
secret_code = '''sdajksdhdlsjlooxxhello
xxoodsdsdooxxworldxxoodfsdf''
b = re.findall('ooxx(.*?)xxoo', secret_code )
print(b)
运行
['world']
我们希望得到的结果是['hello', 'world']
代码应该这样改:
# -?- coding: utf-8 -?-
import re
secret_code = '''sdajksdhdlsjlooxxhello
xxoodsdsdooxxworldxxoodfsdf''
b = re.findall('ooxx(.*?)xxoo', secret_code, re.S )
print(b)
运行
['hello\n', 'world']
再来看看下面这个:
# -?- coding: utf-8 -?-
import re
secret_code = 'dsdxx1xxdsdfxx2xxdfsdxx3xxdlrelxx4xxeuwuxx5xxnjkjh'
b = re.findall('xx(.*?)xxdsdfxx(.*?)xx', secret_code )
print(b)
print(b[0][0])
运行
[('1', '2')]
1
看到没有,找到的结果是列表([]
)里面包着元组(()
)。如果你想单独打印'1'
这个结果,你需要这样指定:b[0][0]
。
Learning Python 008 正则表达式-002 findall()方法的更多相关文章
- Learning Python 008 正则表达式-003 search()方法
Python 正则表达式 - search()方法 findall()方法在找到第一个匹配之后,还会继续找下去,findall吗,就是找到所有的匹配的意思.如果你只是想找到第一个匹配的信息后,就不在继 ...
- Learning Python 008 正则表达式-003 sub()方法
Python 正则表达式 - sub()方法 sub()方法 sub()方法:替换符合规律的内容,返回替换的值 # -?- coding: utf-8 -?- import re secret_cod ...
- Learning Python 008 正则表达式-001
Python 正则表达式 总结 这节课讲讲正真使用的技术 - 正真表达式. 文本爬虫 什么是正则表达式 正则表达式这个名词听起来就有一种很官方的感觉,但是它是一个很很很有用的技术.我用语言是不能形容它 ...
- python中正则表达式 re.findall 用法
在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配. 其中,re.findall() 函数可以遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表. 在python源代码中 ...
- Python day20正则表达式和re方法
元字符6个函数以及几个元字符1.'.'通配符2.'^'以什么开头3.'$'以什么结尾4.'*'紧挨着的字符0~∞次5.'+'紧挨着的字符1~∞次6.'?'紧挨的字符0次或1次7.'{}' {0,}== ...
- 正则表达式 re.findall 用法
正则 re.findall 的简单用法(返回string中所有与pattern相匹配的全部字串,返回形式为数组)语法: findall(pattern, string, flags=0) import ...
- python正则表达式(5)--findall、finditer方法
findall方法 相比其他方法,findall方法有些特殊.它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 finda ...
- Python正则表达式re.findall("[A-Za-z]([A-Za-z0-9])*[.]txt",'Abc2019.txt')的结果为什么是['9']
在<Python妙用re.sub分析正则表达式匹配过程>中老猿分析了findall函数的返回情况,老猿前一阵子在执行这个语句时: >>> re.findall(" ...
- Python基于正则表达式实现文件内容替换的方法
Python基于正则表达式实现文件内容替换的方法 本文实例讲述了Python基于正则表达式实现文件内容替换的方法.分享给大家供大家参考,具体如下: 最近因为有一个项目需要从普通的服务器移植到SAE,而 ...
随机推荐
- IOS蓝牙开发模块
一.引言 蓝牙是设备近距离通信的一种方便手段,在iPhone引入蓝牙4.0后,设备之间的通讯变得更加简单.相关的蓝牙操作由专门的 CoreBluetooth.framework进行统一管理.通过蓝牙进 ...
- Python 3 面向对象进阶
Python 3 面向对象进阶 一. isinstance(obj,cls)和issubclass(sub,super) isinstance(obj,cls)检查是否obj是否是类 cls 的 ...
- [算法]K-SUM problem
一.Two Sum Given an array of integers, find two numbers such that they add up to a specific target nu ...
- poj 1032 Parliament 【思维题】
题目地址:http://poj.org/problem?id=1032 Parliament Time Limit: 1000MS Memory Limit: 10000K Total Submi ...
- 解决ul里最后一个li的margin问题
在html+css布局里ul>li挺常用的,在群里(WEB前端开发 458732443)总有新手问怎么解决li的最后一个margin值的问题.下面介绍一下,大神请不要拍砖. 先看两个demo,你 ...
- A股牛蹄板块轮动迹象
2018年10月熊市末期牛市初期 1.券商 2.中小银行 3.稀土永磁 4.铁路基建 5.人工智能 6.电器仪表 7.保险 8.非进金融.供热供气
- 大话设计模式--享元模式 Flyweight -- C++实现实例
1. 享元模式: 运用共享技术有效地支持大量细粒度的对象. 享元模式可以避免大量非常相似类的开销,在程序设计中,有时需要生成大量颗粒度的类实例来表示数据,如果能发现这些实例除了几个参数外基本都是相同的 ...
- html5新特性contenteditable 属性更容易实现动态表单
介绍html5新特性的一个属性:contenteditable 作用域全局.所有的块标签都可以,例如:span.p.div.td等标签.但是,不可以作用域<br/>类型的标签. conte ...
- QQ.PC管家进程
1.家里的笔记本 WIn7x64 C:\Program Files (x86)\Tencent\QQPCMgr\12.10.19266.225\QMDL.exeC:\Program Files (x8 ...
- matlab画折线
figure(721);hold on;x=1:1:5;%x轴上的数据,第一个值代表数据开始,第二个值代表间隔,第三个值代表终止 a=[203.024,113.857,256.259,244.888, ...