re正则模块

本节内容:

  • 正则介绍
  • 元字符及元字符集
  • 元字符转义符
  • re模块下的常用方法
正则介绍(re)

正则表达式(或 RE)是一种小型的、高度专业化的编程语言.

在Python中,它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

元字符及元字符集

1、元字符之. ^ $ * + ? { }

 import re

 ret = re.findall('o...n', 'oksdaoceanaaaddf')

 print(ret)  # ['ocean']

 ret = re.findall('^o...n', 'oceanhelloowwwn') #以o开头的才能匹配上,这里的头是整个字符串的开头

 print(ret)  # ['ocean']

 ret = re.findall('o...n', 'ooceanhelloowwwn')

 print(ret)  # ['ocean','owwwn']

 ret = re.findall('o...n$', 'oceanhelloowwwn') #以n为结尾的匹配,整个字符串的结尾

 print(ret)  # ['owwwn']

 ret = re.findall('abc*', 'abcccc')  # 贪婪匹配[0,+∞]

 print(ret)  # ['abcccc']

 ret = re.findall('abc+', 'abccc')  # [1,+∞]

 print(ret)  # ['abccc']

 ret = re.findall('abc?', 'abccc')  # [0,1]

 print(ret)  # ['abc']

 ret = re.findall('abc{1,4}', 'abccc')

 print(ret)  # ['abccc'] 贪婪匹配

注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配

ret=re.findall('abc*?','abcccccc')
print(ret)#['ab']

字符集

 # --------------------------------------------字符集[]
 ret = re.findall('a[bc]d', 'acd')
 print(ret)  # ['acd']

 ret = re.findall('[a-z]', 'acd')
 print(ret)  # ['a', 'c', 'd']

 ret = re.findall('[.*+]', 'a.cd+')
 print(ret)  # ['.', '+']

 # 在字符集里有功能的符号: - ^ \

 ret = re.findall('[1-9]', '45dha3')  #‘-’在字符集是指范围
 print(ret)  # ['4', '5', '3']

 ret = re.findall('[^ab]', '45bdha3')  #^在字符集[]里是‘非’的意思
 print(ret)  # ['4', '5', 'd', 'h', '3']

 ret = re.findall('[\d]', '45bdha3')  #\在字符集中是转义,即有意义字符可以转换成普通字符,无意义字符可转化成特殊意义
 print(ret)  # ['4', '5', '3']

 ret = re.findall('\d+','45bda3')
 print(ret)  #['45', '3']
转义字符‘\’

反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等

ret=re.findall('I\b','I am LIST')
print(ret)#[]
ret=re.findall(r'I\b','I am LIST')
print(ret)#['I']

 #-----------------------------eg1:
 import re
 ret=re.findall('c\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\\\l','abc\le')
 print(ret)#['c\\l']
 ret=re.findall(r'c\\l','abc\le')
 print(ret)#['c\\l']

 #-----------------------------eg2:
 #之所以选择\b是因为\b在ASCII表中是有意义的
 m = re.findall('\bblow', 'blow')
 print(m)
 m = re.findall(r'\bblow', 'blow')
 print(m)

Python全栈开发【re正则模块】的更多相关文章

  1. Python 全栈开发六 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve configparser hashlib 一. ...

  2. Python 全栈开发九 日志模块

    日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.一个事件可以用一个可包含可选变量数据的消息来描述.此外,事件也有重要性的概念 ...

  3. python全栈开发day22-常用模块二(hashlib、configparse、logging)

    一.昨日内容回顾 1.钻石继承 #新式类,本身或父类显示继承object #找名字的时候是广度优先顺序 #有mro方法,super方法, # super并不是单纯的找父类,和mro顺序是完全对应的 # ...

  4. python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)

    1.昨日内容回顾 1.正则表达式     # 正则表达式 —— str           # 检测字符串是否符合要求     # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...

  5. Python全栈开发-Day5-常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil shelve xml处理 pyyaml处理 configparser hashlib re正则 ...

  6. Python全栈开发:configparser模块

    #!/usr/bin/env python # -*- coding;utf-8 -*- import configparser # 创建对象 conn = configparser.ConfigPa ...

  7. python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))

    python全栈开发笔记第二模块   第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用      有一个需求 : 从文件中读取所有联 ...

  8. python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

    python全栈开发笔记第二模块 第四章 :常用模块(第二部分)     一.os 模块的 详解 1.os.getcwd()    :得到当前工作目录,即当前python解释器所在目录路径 impor ...

  9. python全栈开发之正则表达式和python的re模块

    正则表达式和python的re模块 python全栈开发,正则表达式,re模块 一 正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的 ...

  10. Python全栈开发【模块】

    Python全栈开发[模块] 本节内容: 模块介绍 time random os sys json & picle shelve XML hashlib ConfigParser loggin ...

随机推荐

  1. 【BZOJ 4580】【Usaco2016 Open】248

    http://www.lydsy.com/JudgeOnline/problem.php?id=4580 区间dp,f(i,j)表示区间[i,j]全部合成一个数,这个数是多少. 可以归纳证明[i,j] ...

  2. Leetcode 365. Water and Jug Problem

    可以想象有一个无限大的水罐,如果我们有两个杯子x和y,那么原来的问题等价于是否可以通过往里面注入或倒出水从而剩下z. z =? m*x + n*y 如果等式成立,那么z%gcd(x,y) == 0. ...

  3. Web Application Penetration Testing Local File Inclusion (LFI) Testing Techniques

    Web Application Penetration Testing Local File Inclusion (LFI) Testing Techniques Jan 04, 2017, Vers ...

  4. UVA232

    这只是大概的雏形. 步骤就是:1输入网格,2给网格里的起始格编序号,3输出所有字母,前面要加序号 #include<stdio.h> #include<ctype.h> #in ...

  5. Install ArchLinux(draft)

    1.# dd bs=4M if=/path/to/archlinux.iso of=/dev/sdx status=progress && sync 2. # timedatectl ...

  6. add user and grant privileges on mariadb

    create database foo_db; create user foo_user identified by 'foo_password'; grant all on foo_db.* to ...

  7. 深入理解JS的闭包

    闭包(closure)是Javascript语言的一个难点,也是它的特色,很多高级应用都要依靠闭包实现. 一.变量的作用域 要理解闭包,首先必须理解Javascript特殊的变量作用域. 变量的作用域 ...

  8. 12月15日smarty模板基本语法

    smarty基本语法: 1.注释:<{* this is a comment *}>,注意左右分隔符的写法,要和自己定义的一致. <{* I am a Smarty comment, ...

  9. UNIX下的LD_PRELOAD环境变量

    UNIX下的LD_PRELOAD环境变量 也许这个话题并不新鲜,因为LD_PRELOAD所产生的问题由来已久.不过,在这里,我还是想讨论一下这个环境变量.因为这个环境变量所带来的安全问题非常严重,值得 ...

  10. SpringMVC学习记录5

    Springmvc流程中的扩展点有很多,可以在很多地方插入自己的代码逻辑达到控制流程的目的. 如果要对Controller的handler方法做统一的处理.我想应该会有很多选择,比如:@ModelAt ...