一前言

本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;

二 正则表达式的概念

正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作

举个例子zszxz666 这个字符串,现在知识追寻者想要获得子串zszxz, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*,然后经过python正则表达式匹配函数就可以获得子串zszxz;这种方式比平时的字符串函数操作更加简便,适用范围广泛;

三 常用的正则匹配模式

常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;

模式 含义
^ 匹配字符串的开头
$ 匹配字符串的末尾
. 匹配任意字符,除了换行符
+ 匹配前面的子表达式一次或多次
? 匹配前面的子表达式零次或一次,或表示一个非贪婪限定符
* 匹配前面的子表达式零次或多次
\ 转义特殊字符
\d 匹配任意数字,等价于 [0-9]。
\D 匹配任意非数字
\s 匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]
\S 匹配任何非空白字符。等价[^\f\n\r\t\v]
\w 匹配数字字母下划线
\W 匹配非数字字母下划线
[...] 用来表示一组字符;[amk] 匹配 'a','m'或'k'
[^...] 不匹配在[]中的字符;[^amk] 不匹配 'a','m'或'k'
{n} 匹配前面的子表达式n 次
{n,} 匹配前面的子表达式至少n 次
{n,m} 匹配前面的子表达式最少匹配 n 次且最多匹配 m 次
| 表示或;a| b,表示匹配a或者b
\b 匹配一个单词边界,即字与空格间的位置
\B 非单词边界匹配

四 python正则常用修斯符

re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解

五 python常用正则行数说明

  • pattern 表示正则表达式模式
  • string 表示传入待匹配字符串
  • flags 标志位,可以用第四节的修饰符限定
  • count 表示限定匹配的次数
  • repl 表示替换的字符串,也可为一个函数
  • pos 起始位置
  • endpos 结束位置
  • maxsplit 最大分割次数
函数名称 函数含义
re.findall(string, pos, endpos) 匹配所有子串,并返回一个列表,未匹配,则返回空列表
re.match(pattern, string, flags=0) 从字符串的起始位置匹配一个模式,如果匹配失败返回None
re.search(pattern, string, flags=0) 扫描整个字符串并返回第一个成功的匹配;匹配失败返回None
re.compile(pattern, flags=0) 编译正则表达式,生成一个正则表达式( Pattern )对象
re.sub(pattern, repl, string, count=0, flags=0) 查找和替换
re.finditer(pattern, string, flags=0) 与findall类似,返回的是迭代器
re.split(pattern, string, maxsplit=0, flags=0]) 将匹配的子串分割后返回列表

六 常用函数示例

6.1 match函数

group(num=0) 函数表示提取匹配的表达式,可以使用组号提取对应的匹配结果;知识追寻者想要获得字符串中第一个出现的数字串;

import re
# 指定模式 至少匹配一个数字
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.match("451zszxz666")
# 获得第一个匹配到的值
g = mat.group();
# 451
print(g)

6.2search函数

知识追寻者想要获得指定的字符串,第一个匹配的就好;

import re
# 想匹配nhzszxz 或者 nh666 或者 nhnh
pattern = re.compile(r'nh(zszxz|666|nh)')
ser = pattern.search('nhzszxzkkk nh666 llll nhnh')
g_0 = ser.group()
# zszxz
print(g_0)
g_1 = ser.group(1)
# nhzszxz
print(g_1)

6.3 findall函数

知识追寻者想要在字符串中获得所有的数字;

import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.fidall("451zszxz666")
# ['451', '666']
print(mat)
# 666
print(mat[1])

6.6 sub函数

知识追寻者想要获得所有非数字的子串;

import re
str = '8556gfggs5555dfg'
# 替换所有数字
result = re.sub(r'\d', '', str)
# gfggsdfg
print(result)

6.7 split函数

知识追寻者想要获得以,分割的字符串;

import re
str = '123,456,zszxz,666'
result = re.split(',',str)
# ['123', '456', 'zszxz', '666']
print(result)

6.8 finditer 函数

知识追寻者想要获得数字451,和666;

import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.finditer("451zszxz666")
for it in mat:
print(it.group())

七 初学者使用正则表达式正确的姿势

初学者在使用正则表达式的时候难免会得到的匹配的结果与自己预期的不符合,可以借助一些在线工具匹配完成后再进行代码编写,常用的在线正则匹配测试如下;

  1. 在线工具
  2. 站长工具

学会python正则表达式就是这么简单的更多相关文章

  1. Python正则表达式就是这么简单【新手必学】

    一前言本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式.看完这篇文章,读者们要理解什么是正则 ...

  2. Python正则表达式的简单应用和示例演示

    前一阵子小编给大家连续分享了十篇关于Python正则表达式基础的文章,感兴趣的小伙伴可以点击链接进去查看.今天小编给大家分享的是Python正则表达式的简单应用和示例演示,将前面学习的Python正则 ...

  3. Python正则表达式Regular Expression基本用法

    资料来源:http://blog.csdn.net/whycadi/article/details/2011046   直接从网上资料转载过来,作为自己的参考.这个写的很清楚.先拿来看看. 1.正则表 ...

  4. Python 正则表达式入门(中级篇)

    Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...

  5. Python 正则表达式入门(初级篇)

    Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...

  6. python正则表达式re

    Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...

  7. 比较详细Python正则表达式操作指南(re使用)

    比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...

  8. Python正则表达式学习摘要及资料

    摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...

  9. Python 正则表达式-OK

    Python正则表达式入门 一. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...

随机推荐

  1. a span做成按钮时,文字不被选中样式

    HTML: <a class="button"></a> <span class="button"></span> ...

  2. PHP 内存管理及垃圾回收机制

    PHP5的内存管理 对象传递 PHP5使用了Zend引擎II,对象被储存于独立的结构Object Store中,而不像其它一般变量那样储存于Zval中(在PHP4中对象和一般变量一样存储于Zval). ...

  3. HDU 2844 混合背包、

    题意:一个人想买手表,给你n个价值的硬币,然后给你n个价值硬币对应的个数.但是呢,这个人只知道这个手表的价格不超过m元.问他最多能买多少种价值的手表 思路:dp背包专题 但是- - 一直不知道该怎么d ...

  4. linux下C调用lua的第一个程序

    linux下C调用lua的第一个程序 linux的环境是Fedora 18,运行在VM workstation中,以开发模式安装,自带了lua 5.1.4,可以在命令行上直接用lua命令进入到lua环 ...

  5. java.lang.ClassCastException: com.sun.proxy.$Proxy6 cannot be cast to com.etc.service.serviceImpl.BankServiceImpl

    错误原因: java.lang.ClassCastException: com.sun.proxy.$Proxy6 cannot be cast to com.etc.service.serviceI ...

  6. JS与JSP分别是什么

    JS:JavaScript: JSP:Java Server Pages. jsp:只是servlet的一个变种,方便书写html内容才出现的,servlet是根本,所有jsp能做的,servlet全 ...

  7. C# 通过编程的方法在桌面创建回收站快捷方式

    基本所有的桌面都会存在回收站快捷方式,如果想要多创建几个快捷方式,点开就是回收站,请看本文的方法 在引用 Windows Script Host Object Model 这个 COM 方法之后可以使 ...

  8. (转)学习C语言基本思路与参考书籍

    计算机行业发展非常快,大学里的教育基本都跟不上实际的社会需求.如果你所在的学校还在指定大家使用谭浩强的教材,或使用VC6.0来教大家上机实验,那你不妨看看本文,这里有一些建议可以帮助你不会脱离社会太远 ...

  9. Centos7网络连接不上:Network is unreachable 解决方案

    有朋友的centos7装在虚拟机上挂起后在打开不能正常连接网络,我的也出现了这个问题,试着用dhclient重新分配一下地址,无奈系统提示dhclient正在运行,没办法只能试试其它办法,之后研究了一 ...

  10. ERROR StatusLogger Log4j2 could not find a logging implementation.

    今天在学习structs2  2.5.5的版本的时候碰到2个问题.第一个网上下的包里面差log4j-core这个包. 虽然程序可以运行,但控制台会报这个错误. ERROR StatusLogger L ...