devi into python 笔记(六)正则表达式 原始字符串
字符串函数replace:
#string.replace:
#字符串的replace方法:替换子串,不改变原来的字符串
s = "broad road"
#打印出来会发现不单单是road被替换了,broad也变了
#这是因为broad也包含road,replace方法
print s.replace('road', 'rd.')
原始字符串 r'string':
#原始字符串:只要在普通字符串前加上 r 就可以
#这样做是表明这个字符串中的所有字符都不转义,避免反斜线灾难
print r'this is a \t\n string'
#原始字符串在正则表达式中很重要
Python正则表达式:
#Python的正则包
#$:匹配字符串末尾的,相对应的匹配字符串开头的是 ^
s = 'broad road'
#re.sub(pattern, str1, str2):将str2中符合pattern的串替换为str1
print re.sub('road$', 'rd.', s)
#但如果末尾是broad呢,很遗憾,也会被替换
s = 'broad broad'
print re.sub('road$', 'rd.', s) #\b:单词的边界必须在这里
#这样不论road出现在哪里,只要是整个的单词就会匹配
s = 'broad road room1'
print re.sub(r'\broad\b', 'rd.', s)
re.search(pattern, string): pattern正则表达式 string 要匹配的字符
import re
#re.search(pattern, string):re包重要的函数
#pattern:正则 string:要匹配的字符串
#返回值:不能匹配返回None 匹配成功返回一堆描述,反正不是None,根据一切皆对象姑且称之为'匹配成功对象'
#^匹配开始,$匹配结束 ?匹配0个或1个M
pattern = '^M?M?M?$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM') #|匹配前后两个表达式,先匹配左边的表达式,一旦成功匹配就不去匹配右边的表达式。
#记住(A|B|C)含义是:精确匹配ABC中的一个,匹配一个后便不再匹配其他的了
#如果不加括号,则其作用范围就是整个正则表达式
pattern = '^M?M?M?(CM|CD|D?C?C?C?)$'
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCMC') #{m}匹配前面字符m次
#{m, n}匹配前面的字符m次至n次,m n都可以为0
pattern = '^M{0,3}$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM')
松散正则表达式: re.VERBOSE 、 re.compile().search().groups()
#松散正则表达式re.VERBOSE
#1忽略空白:比如空格制表符回车等,也就是说可以在表达式的任意地方添加任意多的空白。
#2忽略注释:这样就可以在合适的位置加上注释提高可读性。
pattern = """
^ #在这里匹配开始
M{0,3} #匹配0-3个M
(CM|CD|D?C?C?C?) #匹配xxx
$ #在这里匹配结束
"""
#使用松散正则,要给search一个re.VERBOSE表明这是一个松散正则
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCM', re.VERBOSE)
print re.search(pattern, 'MCMC', re.VERBOSE)
#如果要在松散正则中匹配空白而不是被忽略掉,就要用转移字符来做
pattern = """
ab\ cd
"""
#这表示要在b和c之间匹配一个空格
print re.search(pattern, 'ab cd', re.VERBOSE) #compile 和 groups 简单使用
#re.compile():接受一个正则表达式返回一个正则对象
pattern = re.compile(r'^(\d{3})-(\d{3})-(\d{4})$')
#正则对象的search()方法匹配同re.search()类似,接受一个正则表达式,匹配失败返回None,成功返回'匹配成功对象'
#'匹配成功对象'.gourps()返回一个tuple,元素对应于前面正则表达式中的组。一个小括号即使一个组
#匹配成功返回的'匹配成功对象'才能调用groups,因为匹配失败返回None,是没有groups()函数的
print pattern.search('800-555-1212').groups()
devi into python 笔记(六)正则表达式 原始字符串的更多相关文章
- Python:笔记(6)——正则表达式
Python:笔记(6)——正则表达式 re模块 re模块用于在字符串中执行基于正则表达式模式的匹配和替换. 使用原始字符串 正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串 ‘pytho ...
- devi into python 笔记(七)locals与globals 字典格式化字符串 字符集
locals()与globals(): """ locals:局部命名空间 globals:全局命名空间 都是以dictionary的形式保存的,变量名是键,变量值是值 ...
- devi into python 笔记(四)python的类
import 与 from ... import ...: #types只是一个包,FunctionType只是这个包里的一个函数.这里用它来演示 import types #如果要用Function ...
- devi into python 笔记(三)callable getattr lambda表达式
常用的函数:callable():如果所给参数是可调用的,返回True 不可调用返回Fasle.这里指的是否能调用说的是方法.类方法等有doc string的东西,一个单纯的字符串等就不算了. imp ...
- devi into python 笔记(二)元组 变量声明 和列表解析
元组tuple: 类似list,只是tuple是不可变的list.类似java的String都是不可改变的.注意:tuple没有方法(有待考证),不可以像list那样那个list.pop 或者list ...
- python笔记03:使用字符串
3.1 基本字符串操作: 所有的标准序列操作(索引,分片,乘法,判断成员资格,求长度,取最小值,取最大值)对于字符串同样有效.但是,请记住:字符串都是不可变的 3.2 字符串格式化:精简版 字符串格式 ...
- 在Python中使用正则表达式去掉字符串里的html标签
有时候会获得一些带html标签的字符串,需要把html标签去掉,获得干净的字符串,这时候可以使用正则表达式. 代码如下: import re htmeString = '''<ul id=&qu ...
- python笔记(2)--字符串
一.创建字符串 使用 '' , "" , ''' 和 """ 来创建字符串 var1 = 'hello, world' var2 = "ja ...
- devi into python 笔记(五)异常 文件操作 sys os glob模块简单实用
异常: Java异常: try catch块处理异常,throw引发异常. Python异常: try except块处理异常,raise引发异常. 异常如果不主动处理,则会交给Python中的缺省处 ...
随机推荐
- Stay Hungry, Stay Foolish--2005斯坦福大学05年毕业演讲
转自http://www.cnblogs.com/daizhj/articles/1493813.html 斯蒂夫•保罗•乔布斯(Steve Paul Jobs,1955年2月24日出生-)是蘋果電腦 ...
- JavaWeb网上商城的反思
不知道从什么时候起,我爱上了写博客,对之前学得的只是进行反思.写了几天课程设计,代码量量8.9千左右. 然后下面文字是我在博客上复制过来的,说得很详细 MVC(Model View Controlle ...
- AJAX 简单上手
AJAX简介 没有AJAX会怎么样?普通的ASP.Net每次执行服务端方法的时候都要刷新当前页面,如实现显示服务器的时间每次都要刷新页面的坏处:页面刷新打断用户操作.速度慢.增加服务器的流量压力.如果 ...
- php 商务网站购物车联动地址
数据表如下: CREATE TABLE IF NOT EXISTS `china` (`region_id` smallint(5) unsigned NOT NULL, `parent_id` s ...
- CSS3之简易的3D模型构建[原创开源]
CSS3之简易的3D模型构建[开源分享] 先上一张图(成果图):这个是使用 3D建模空间[源码之一] 制作出来的模型之一 当然这是一部分模型特写, 之前还制作过枪的3D模型等等. 感兴趣的朋友可以自己 ...
- Python全栈开发之 Mysql (一)
一: 1.什么是数据库? 数据库(Database)是按照数据结构来组织.存储和管理数据的仓库别说我们在写程序的时候创建的database就是一个数据库 2.什么是 MySQL.Oracle.SQLi ...
- POJ 2635 The Embarrassed Cryptographer 大数模
题目: http://poj.org/problem?id=2635 利用同余模定理大数拆分取模,但是耗时,需要转化为高进制,这样位数少,循环少,这里转化为1000进制的,如果转化为10000进制,需 ...
- contos vsftp 530错误
只需要把/etc/pam.d/vsftpd文件中的 auth required pam_listfile.so item=user sense=deny file=/etc/vsft ...
- bzoj4038: 医疗援助
Description 一只带着先进设备和药物的医疗团队来到了埃博拉病毒疫区的某个非洲国家.这个国家有n个村庄,均坐落在该国唯一的一条公路旁,n个村庄依次标号为1,2,…n.第i个村庄有a_i个埃博拉 ...
- IEngineEditor与IWorkspaceEdit,以及相关的事件监听
转自原文 IEngineEditor与IWorkspaceEdit,以及相关的事件监听 IEngineEditor适用于直接在图层上的编辑,例如使用"要素编辑"工具菜单上的&quo ...