Python3学习笔记33-正则表达式
正则表达式是用来匹配字符串的。只要符合规则的字符串。就可以认为匹配了。否则,这个字符串不合法。
\d:可以匹配一个数字 ‘00\d’可以匹配001不能匹配00A
\w:可以匹配一个字母或数字 ‘00\w’可以匹配00A
.:可以匹配任何字符 ‘py.’可以匹配‘pyc’,‘py!‘,‘py1’
\s:可以匹配一个空格
长度
*:表示任意个字符(包括0个)
+:表示至少一个字符
?:表示0个或一个
{n}:表示n个字符
{n,m}:表示n到m个字符
\d{3}\s+\d{3,8} 从左到右表示 三个数字 一个空格 3到8个数字 也就是可以匹配用空格隔开的带区号的电话号码。比如021-123456这种。
看别的文章说使用‘-’隔开说要使用’\‘转义符,因为‘-’是特殊字符。但是在PyCharm的时候,加了\会有错误提示,不加\不会有提示,不过匹配结果都是对的。
我理解是在表达式中的符号,表达这个符号本身的意思,而不是表达式的匹配方式的时候,才需要加\。比如我想要匹配加号,因为+本身表示一个字符,需要用\+来匹配加号
范围
使用[]可以表示范围,比如:
[0-9a-zA-Z\_] 表示可以匹配一个数字、字母或者下划线
可以将范围和长度一起组合使用
[0-9a-zA-Z\_]+ 表示可以匹配至少由一个数字、字母或者下划线组成的字符串。比如‘010’,‘0_a’,'py_'等等
|表示或 A|B表示可以匹配A或B 比如(P|p)ython可以匹配‘python’或‘Python’
^表示行的开头,^\d就表示必须以数字开头
$表示行的结尾,\w$表示必须以数字结尾
re模块
match()方法判断是否匹配,匹配成功返回Match对象,否则返回None
import re
test = re.match('\d{3}-\d{3,8}','012-1234556')
print(test)
切分字符串
使用正则表达式切分字符串比用固定的字符更灵活。比如连续的空格
test1 = re.split(r'\s+','a b c')
print(test1)
在加上,试试
test1 = re.split(r'[\s,]+','a,b, ,c')
print(test1)
通过正则的切分,可以把不规范的输入转换为正确的。
分组
用()表示分组,可以用来提取正则中的子串
import re
test1 = re.match(r'^(\d{3})-(\d{3,8})$','021-123456')
print(test1)
print(test1.group(0))
print(test1.group(1))
print(test1.group(2))
group(0)是原始字符,group(1)才是第一个子串
groups()可以获得所有切分后的子串
贪婪匹配
正则默认是贪婪匹配,也就是尽可能的匹配更多的字符。比如匹配数字后的0:
test1 = re.match(r'^(\d+)(0*)$','')
print(test1.groups())
由于\d+是贪婪匹配,把后面的0都给匹配完了,所以第二个子串没有匹配到
必须让\d+采用非贪婪匹配,也及时尽可能少的匹配,才能把后面的0匹配出来,加上?就可以让\d+采用非贪婪匹配
test1 = re.match(r'^(\d+?)(0*)$','')
print(test1.groups())
编译
如果一个正则需要使用很多次,出于效率考虑,可以使用compile()预编译这个正则
re_tel = re.compile('^(\d{3})-(\d{3,8})$')
test = re_tel.match('021-1234556')
print(test)
print(test.groups())
练习
尝试写验证邮箱的正则。版本一应该可以验证类似邮箱。someone@gmail.com,bill.gates@microsoft.com
import re
def is_valid_email(addr):
if re.match(r'^\w*\.?\w*@\w*.\w*$',addr):
return True
else:
return False
assert is_valid_email('someone@gmail.com')
assert is_valid_email('bill.gates@microsoft.com')
assert not is_valid_email('bob#example.com')
assert not is_valid_email('mr-bob@example.com')
print('ok')
练习完了自己大致理解。主要有两个地方比较麻烦,一个是.本身在正则表达式是有含义的,表示可以匹配任意一个字符。所以当需要匹配成.符号的时候要加上\转义符。另外就是要在.后面加上?,表示非贪婪匹配,不然就直接匹配到最后的.com那里去的,@就匹配不到了。
版本二可以把邮箱前面的姓名提取出来
<Tom Paris> tom@voyager.org => Tom Paris
bob@example.com => bob
import re
def name_of_email(addr):
test = re.match(r'<?(\w*\s*\w*)>?\s*\w*@\w*\.\w*',addr)
print(test.group(1))
return test.group(1)
assert name_of_email('<Tom Paris> tom@voyager.org') == 'Tom Paris'
assert name_of_email('tom@voyager.org') == 'tom'
print('ok')
Python3学习笔记33-正则表达式的更多相关文章
- Python3学习笔记(urllib模块的使用)转http://www.cnblogs.com/Lands-ljk/p/5447127.html
Python3学习笔记(urllib模块的使用) 1.基本方法 urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, ...
- Python3学习笔记 - 准备环境
前言 最近乘着项目不忙想赶一波时髦学习一下Python3.由于正好学习了Docker,并深深迷上了Docker,所以必须趁热打铁的用它来创建我们的Python3的开发测试环境.Python3的中文教程 ...
- python3学习笔记(7)_listComprehensions-列表生成式
#python3 学习笔记17/07/11 # !/usr/bin/env python3 # -*- conding:utf-8 -*- #通过列表生成式可以生成格式各样的list,这种list 一 ...
- python3学习笔记(6)_iteration
#python3 学习笔记17/07/10 # !/usr/bin/env python3 # -*- coding:utf-8 -*- #类似 其他语言的for循环,但是比for抽象程度更高 # f ...
- python3学习笔记(5)_slice
#python3 学习笔记17/07/10 # !/usr/bin/env python3 # -*- coding:utf-8 -*- #切片slice 大大简化 对于指定索引的操作 fruits ...
- Python3学习笔记01-环境安装和运行环境
最近在学习Python3,想写一些自己的学习笔记.方便自己以后看,主要学习的资料来自菜鸟教程的Python3教程和廖雪峰官方网站的Python教程. 1.下载 1)打开https://www.pyth ...
- python3学习笔记(9)_closure
#python 学习笔记 2017/07/13 # !/usr/bin/env python3 # -*- conding:utf-8 -*- #从高阶函数的定义,我们可以知道,把函数作为参数的函数, ...
- python3学习笔记(8)_sorted
# python学习笔记 2017/07/13 # !/usr/bin/env python3 # -*- coding:utf-8 -*- #python 内置sorted()函数 可以对list进 ...
- python3学习笔记(4)_function-参数
#python学习笔记 17/07/10 # !/usr/bin/evn python3 # -*- coding:utf-8 -*- import math #函数 函数的 定义 #定义一个求绝对值 ...
- python3学习笔记(1)_string
#python学习笔记 17/07/07 # !/usr/bin/evn python3 # -*- coding:utf-8 -*- #r"" 引号当中的字符串不转义 #练习 # ...
随机推荐
- loadrunner / socket level data and wininet level data
s loadrunner录制脚本时,此网站证书无效/无法录制到脚本问题解决 http://www.51testing.com/html/64/497364-3569552.html lr录制后空白_l ...
- 5.Hystrix-服务降级
所谓降级,就是当某个服务出现异常之后,服务器将不再被调用,此时服务端可以自己准备一个本地的fallback回调,返回一个缺省值. 这样做,虽然服务水平下降,但好歹可用,比直接挂掉要强,当然这也要看适合 ...
- Linux记录-在线扩容8e
1.fdisk -l 2.增加分区 3.3:键入 p,主分区,并键入3(编号): 默认起始扇区和结束扇区即可(键入两次Enter) 键入t,修改分区类型为8e: 键入w,写分区表,然后重启: 卷扩容, ...
- golang goroutine
goroutine-介绍 1)进程就是程序程序在操作系统中的一次执行过程,是系统进行资源分配和调度的基本单位2)线程是进程的一个执行实例,是程序执行的最小单元,它是比进程更小的能独立运行的基本单位.3 ...
- apt-get使用命令
apt-get的卸载命令:remove/purge/autoremove/clean/autoclean apt-get purge / apt-get –purge remove 删除已安装包(不保 ...
- Python中json一点小知识
import json dic={ "name":"杨林" } ret=json.dumps(dic,ensure_ascii=False) #因为json.d ...
- php制作圆形用户头像——自定义封装类源代码
思路 使用图层的方法设计,共需要创建3个图像层 1.底层:最后生成的图像 2.真实用户头像:作为中间层,用户上传的真实头像图片 3.圆形蒙版:作为最上层,在蒙版中绘制圆形,并设置为透明 如图: 代码如 ...
- 1.2 认识python(了解)
一.Python发展背景 Python的作者,Guido von Rossum(吉多·范·罗苏姆,中国Python程序员都叫他 龟叔),荷兰人.1982年,龟叔从阿姆斯特丹大学获得了数学和计算机硕士学 ...
- 目前比较火的前端框架及UI组件
看到的一篇总结性的文章,收藏一下,感兴趣的可以自己看看,哪些是已经会的,哪些是没听说过的,哪些是一知半解的,都可以稍微看看. 一.前端框架库: 1.Zepto.js 地址:点击打开链接 描述:Zept ...
- MacOS安装Go2Shell
1 去官网下载安装MacOS最新版本 https://zipzapmac.com/Go2Shell 2 下一步下一步安装 3 设置 打开终端设置, open -a Go2Shell --args co ...