最短匹配应用于:假如有一段文本,你只想匹配最短的可能,而不是最长. 例子 比如有一段html片段,'\this is first label\\the second label\',如何匹配出每个a标签中的内容,下面来看下最短与最长的区别. 代码 >>> import re >>> str = '<a>this is first label</a><a>the second label</a>' >>>…
re.findall(pattern,string)会搜索所有匹配的字符,返回的是一个列表,获取首个匹配需要re.findall(pattern,string)[0]访问, 但是如果findall没匹配成功则返回空列表,这时用列表下标去访问元素时就会报IndexError: list index out of range. 如: >>>re.findall('abc','abd') [] >>>re.findall('abc','abd')[0] Traceback (…
可以用?P<name>的方法给正则匹配的部分命名. 例:要将<字母,数字>的部分命名为test x = "abc <haha,123> test @@" pattern = "(?P<test>\<\w+,\d+\>)" m = re.search(pattern, x) r = m.group("test") print r 输出: <haha,123>…
1. 使用find()方法 >>> text = 'yeah, but no, but yeah, but no, but yeah' >>> text.find('no')10 2. 使用re.match() 对于复杂的匹配需要使用正则表达式和re 模块.为了解释正则表达式的基本原理,假设想匹配数字格式的日期字符串比如11/27/2012 ,可以这样做:>>> text1 = '11/27/2012'>>> text2 = 'Nov…