python模块学习之re
正则表达式本质就是表示某种规则的一串字符。
匹配的规则叫做模式(pattern),模式作用于对象。
模式和对象可以是Unicode或者字节,但是,不能够混用,比如:模式为Unicode,对象为字节,像这样就是错误的!
当有替换需求时,替换字符串的类型也要注意和模式、对象的类型保持一致。(要么都是Unicode,要么都是字节)
下面来谈谈反斜杠(\),我们知道\+字符,可能表示一种特殊的含义,当然也可能表示\和字符2个普通字符。
比如:\d表示数字,\k表示\和k这2个普通字符。
在python中字符串分为2种:
原始字符串(raw string)和字符串
之所以搞个原始字符串,就是来应对转义字符这个大麻烦!
比如:我想表示\和b,如果我用惯性思维写成'\b',那么就傻逼了!因为\将b设置为有特殊含义的字符。
这时必须写成'\\b',但是这种写法太low了!于是搞个原始字符串的东西,前面的可以设置成r'\b'。
虽然加了个r但是相比'\\b'的写法,友好了不少!
所以:'\\\\'和r'\\'是等效的,表示普通字符\。
总结:如果字符中没有\,原始字符串就和字符串一样。
>>> re.findall('a','abkk')
['a']
>>> re.findall(r'a','abkk')
['a']
在正则表达式后面加个?,表示非贪婪匹配(最短匹配)。
re模块中常用的方法:
1、compile()
编译正则表达式的模式为对象模式,这样可以提高执行效率。
语法:
re.compile(r'pattern',[flags])
其中r的含义是不转义字符串,也就是说\t就是\和t。
例如:
import re
hello = "hello,i am tom,nice to konw u."
a = re.compile(r'to')
b = a.findall(hello) ['to','to']
2、match()
匹配的字符串必须按照pattern开头,否则匹配不到。
语法:
re.match(pattern,string,[flags])
例如:
>>> a = "hello"
>>> b = re.match(r'l',a)
>>> b
>>> c = re.match(r'he',a)
>>> c
<_sre.SRE_Match object; span=(0, 2), match='he'>
3、search()
匹配到第一个pattern就返回结果。
语法:
re.search(pattern,string,[flags])
例如:
>>> a = "hellohe"
>>> c = re.search(r'he',a).group()
>>> c
'he'
注:group()方法用来返回一个字符串,因为search()方法返回的是一个match对象。
如果正则中的pattern包含引号,那么需要注意使用\
>>> a = re.search(r'__version__ = [\'"]([^\'"]+)[\'"]',"__version__ = '3.7.0'").group(1)
>>> a
'3.7.0'
单引号中再次使用单引号,必然会造成错误,这个时候,需要在单引号前面加个转义字符(\)。
4、findall()
匹配所有的pattern并返回一个列表。
语法:
re.findall(pattern,string,[flags])
例如:
>>> a = "hello12kk32"
>>> b = re.findall(r'\d+',a)
>>> b
['12', '32']
5、sub()
匹配并替换。
语法:
re.sub(pattern,repl,string,count)
例子:
import re
text = "JGood is a handsome boy, he is cool, clever, and so on..."
print(re.sub(r'\s+', '-', text))
执行结果如下:
JGood-is-a-handsome-boy,-he-is-cool,-clever,-and-so-on... 其中第二个参数是替换后的字符串;本例中为'-' 第四个参数指替换个数。默认为0,表示每个匹配项都替换。
6.re.escape(pattern)
脱离除ascii英文、数字、下划线之外的字符串。
在处理正则时非常有效。
>>> re.escape('www.baidu.com')
'www\\.baidu\\.com'
python模块学习之re的更多相关文章
- 【转】Python模块学习 - fnmatch & glob
[转]Python模块学习 - fnmatch & glob 介绍 fnmatch 和 glob 模块都是用来做字符串匹配文件名的标准库. fnmatch模块 大部分情况下使用字符串匹配查找特 ...
- 【目录】Python模块学习系列
目录:Python模块学习笔记 1.Python模块学习 - Paramiko - 主机管理 2.Python模块学习 - Fileinput - 读取文件 3.Python模块学习 - Confi ...
- Python模块学习filecmp文件比较
Python模块学习filecmp文件比较 filecmp模块用于比较文件及文件夹的内容,它是一个轻量级的工具,使用非常简单.python标准库还提供了difflib模块用于比较文件的内容.关于dif ...
- python模块学习第 0000 题
将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果. 类似于图中效果: 好可爱>%<! 题目来源:https://github.com/Yixiao ...
- Python模块学习:logging 日志记录
原文出处: DarkBull 许多应用程序中都会有日志模块,用于记录系统在运行过程中的一些关键信息,以便于对系统的运行状况进行跟踪.在.NET平台中,有非常著名的第三方开源日志组件log4net ...
- 解惑Python模块学习,该如何着手操作...
Python模块 晚上和朋友聊天,说到公司要求精兵计划,全员都要有编程能力.然后C.Java.Python-对于零基础入门的,当然是选择Python的人较多了.可朋友说他只是看了简单的语法,可pyth ...
- Python模块学习
6. Modules If you quit from the Python interpreter and enter it again, the definitions you have made ...
- Python模块学习系列
python模块-time python模块-datetime python模块-OS模块详解
- Python模块学习遇到的问题
Python使用import导入模块时报ValueError: source code string cannot contain null bytes的解决方案 Python使用import导入模块 ...
- Python 模块学习:re模块
今天学习了Python中有关正则表达式的知识.关于正则表达式的语法,不作过多解释,网上有许多学习的资料.这里主要介绍Python中常用的正则表达式处理函数. 方法/属性 作用 match() 决定 R ...
随机推荐
- 【Treap】BZOJ1588-[HNOI2002]营业额统计
[题目大意][借用别人的概括]给出一个n个数的数列a,对于第i个元素ai定义fi=min(abs(ai-aj)),(1<=j<i),其中f1=a1.输出sum(fi) (1<=i&l ...
- Mysql中的JSON系列操作函数
前言 JSON是一种轻量级的数据交换格式,采用了独立于语言的文本格式,类似XML,但是比XML简单,易读并且易编写.对机器来说易于解析和生成,并且会减少网络带宽的传输. JSON的格式非常简单:名称/ ...
- 金融应用,计算将来的学费 Exercise05_07
/** * @author 冰樱梦 * 时间:2018年下半年 * 题目:金融应用,计算将来的学费 * */ public class Exercise05_07 { public static vo ...
- Java学习笔记(5)
补day4:如果一个函数的返回值类型是具体的数据类型,那么该函数就必须要保证在任意情况下都保证有返回值.(除了void类型) return关键字的作用: 1.返回数据给函数的调用者 2.函数一旦执行到 ...
- BUG:Yii登录时 101 net::ERR_CONNECTION_RESET
Bug描述:YII web入口登录,无法登录一直等待,最终重定向 原因:设置的默认路由DefauRoute中的控制器中有错误,导致无法跳转找指定的路由规则 解决方案:这就多亏了SourceTree了, ...
- 输入格式CombineFileInput
此输入格式的作用就是可以将来自多个不同文件的物理块作为一个split,然后由一个map进行处理. http://www.blogjava.net/shenh062326/archive/2012/07 ...
- [转]从此爱上iOS Autolayout
原文地址 这篇不是autolayout教程,只是autolayout动员文章和经验之谈,在本文第五节友情链接和推荐中,我将附上足够大家熟练使用autolayout的教程.这篇文章两个月前就想写下来,但 ...
- 解密所有APP运行过程中的内部逻辑(转)
转贴地址:http://www.freebuf.com/tools/54562.html 0×01前言 这年头,apk 全都是加密啊,加壳啊,反调试啊,小伙伴们表示已经不能愉快的玩耍了.静态分析越来越 ...
- SQL Server DBA 文章:116篇 --DBA_Huangzj
http://blog.csdn.net/DBA_Huangzj/article/category/1133081
- mongodb_profier
http://docs.mongodb.org/manual/reference/database-profiler/ 一.获取.设置profile(profile用collection存储数据) d ...