#事先说一下
- re模块本身是用来操作正则表达式,与正则本身没有关系
- 正则表达式是指一规则,匹配字符串的规则

1.正则表达式regex

  • 正则表达式regex是指一规则,匹配字符串的规则,应用:

    • 匹配字符串
    • 表单验证
    • 爬虫:从网页源码获取一些链接,重要数据
  • 元字符
  • 量词

1.规则

​ 1.1 基本匹配: 本身是哪一个字符,就匹配字符换中的哪一个字符

​ 1.2 字符组匹配[字符1字符2]规则: 一个字符组就匹配一个字符,只要这个字符出现在字符组内就会被匹配到

  • 字符组可以使用范围,所有的范围必须遵循ascii码从小到大来指定
  • 常用字符组范围[0-9]/[a-z]/[A-Z]/[a-zA-Z0-9]

​ 1.3 [0-9]==\d 所有的数字

​ 1.4 \d 与 [0-9] 与 [\d]无区别

2.元字符

  • []字符组 只要在中括号之内的所有字符都符合匹配规则
  • [^]非字符组 只要在中括号之内的所有字符都符合匹配规则
  • \d 数字(digit)
  • \w 标识符(word)表示大小写字母,数字,下划线
  • \s 空格(space),表示空格,换行符,table制表符
  • \t (table) 仅仅制表符
  • \n (next) 仅仅换行符
  • \D 匹配非数字
  • \w 匹配非大小写字母,数字,下划线
  • \S 匹配非空格,换行符,table
  • . 表示除了换行符的任意内容
  • \取消转义, \ .表示只匹配 .
  • [\d\D] 匹配任意字符
  • 表示一个字符的开始:s表示只匹配开头的s
  • $表示一个字符的结束:$e表示只匹配结束的e
  • ^abc$ 同时出现字符串只能是abc
  • | 表示或,注意如果两个规则有重叠部分,总是长的在前面,短的在后面
  • (|)括号限制|的作用域, 例 :www.(baidu|google).com,只会作用域括号内
#帮助记忆#
\d \w \s \t(table) \n(next)
\D \W \S
.
[] [^]
^ $
| ()

3.量词

  • \d{n} 数字n表示该原字符执行次数,且只能匹配这么多次

  • \d{n,}数字n表示该原字符至少出现n次

  • \d{n,m}数字n表示该原字符至少出现n次,至多出现m次

  • \d? ?表示匹配0次或者1次 ,比如小数点

  • \d+ +表示匹配1次或多次

  • \d * *表示匹配0次或多次 ,比如匹配整数或者小数

  • 匹配小数

    \d+(\.\d+)?
    #例:
    12.3432

3.1 默认贪婪匹配 ,总是在符合匹配规则的范围内尽可能多的匹配

3.2 非贪婪匹配,(惰性匹配):总是在符合匹配规则的范围内尽可能少的匹配

  • 元字符 量词 ? x

    表示按照元字符规则在量词范围内匹配,一旦遇到x就停止

    • .*?x 匹配任意字符,碰见x立即停止.
  • ? 出现在量词之后表示非贪婪匹配

身份证小练习
# 身份证号
# 15位 全数字 首位不为0
# 18位 前17位全数字 首位不为0 最后一位可能是x和数字
[1-9](\d{14}|\d{16}(\d|x))
[1-9](\d{16}[\dx]|\d{14})
[1-9]\d{14}(\d{2}[\dx])?

python学习day25 正则表达式的更多相关文章

  1. [Python学习笔记]正则表达式总结

    常用缩写字符及其含义表格查询 缩写字符分类 含义 \d 0-9的任意数字 \D 除0-9的数字以外的任何字符 \w 任何字母.数字或下划线字符(可以认为是匹配"单词"字符) \W ...

  2. Python学习 之 正则表达式

    1.简单的正则表达式 import re s=r'abc' re.findall(s,"aaaaaaaaaaaaaaa") #结果为[] re.findall(s,"ab ...

  3. Python学习笔记——正则表达式入门

    # 本文对正则知识不做详细解释,仅作入门级的正则知识目录. 正则表达式的强大早有耳闻,大一时参加一次选拔考试,题目就是用做个HTML解析器,正则的优势表现得淋漓尽致.题外话不多讲,直接上干货: 1. ...

  4. Python学习--16 正则表达式

    正则表达式是一种描述性的语言,用来匹配字符串.凡是符合规则的字符串,我们认为就是匹配了. 正则表达式并非Python独有的,它与语言无关.很多语言都支持正则表达式. 我们经常用正则表达式来匹配电子邮件 ...

  5. python学习日记(正则表达式)

    定义 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Pyth ...

  6. python学习笔记----正则表达式

    正则: regular expression 常用的场景: #正则的包 >>> import re #match:开头匹配,匹配到,返回一个匹配对象,否则返回None >> ...

  7. python学习笔记——正则表达式regex

    1 概述 1.1 定义 本质是由一系列字符和特殊符号组成的字串,用来表示一定规则的某一类字符串. 1.2 特点 正则表达式是一个独立的技术,其在多种编程语言中使用. 在python语言中的正则表达式模 ...

  8. Python学习 :正则表达式

    正则表达式 python 使用正则表达式(re)来进行匹配引擎搜索 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个“规则字符串” 关于正则表达式 ...

  9. python 学习总结----正则表达式

    正则表达式 应用场景 - 特定规律字符串的查找,切割,替换 - 邮箱格式:URl,IP地址等的校验 - 爬虫项目中,特定内容的提取 使用原则 - 只要使用字符串等函数能解决的问题,就不要使用正则 - ...

随机推荐

  1. 纯代码Autolayout的三种方法

    Autolayout讲解较多的就是xib和storyboard用法,本文主要记录纯代码的Autolayout使用方法: 方法1.苹果原生的方法,这种方法虽然简单但是太过繁杂,可用性很差 //宽度=su ...

  2. 使用TreeDMS进行MySQL数据库的Web页面远程管理

    在互联网应用蓬勃发展的时代背景下,各种各样的网络平台,网络应用,移动应用层出不穷,那么这些应用及平台都需要使用到数据库.如何高效的对数据进行日常维护.管理.监控成为迫切需要解决的问题. 基于web的方 ...

  3. linux ubuntu 安装nginx

    参考原文 在Ubuntu下安装Nginx有以下方法,但是如果想要安装最新版本的就必须下载源码包编译安装. 一.基于APT源安装 sudo apt-get install nginx 安装好的文件位置: ...

  4. jvm 内存机制

    jvm 的内存包括stack ,Heap,NonHeap,在此重点说明Heap,NonHeap. Heap叫堆内存,它用于存放类实例和数组信息.NonHeap叫非堆内存,用于存放类,方法等可反射的对象 ...

  5. Myeclipse中设置jsp页面的默认编码格式

    在MyEclispe中创建Jsp页面,Jsp页面的默认编码是“ISO-8859-1”,如下图所示: 在这种编码下编写中文是没有办法保存Jsp页面的,会出现如下的错误提示: 因此可以设置Jsp默认的编码 ...

  6. java停止一个线程

    Thread类中有start(), stop()方法,不过stop方法已经被废弃掉. 平时其实也有用过,共享一个变量,相当于标志,不断检查标志,判断是否退出线程 如果有阻塞,需要使用Thread的in ...

  7. Qt获取控件位置,坐标总结

    总结的结果是: QMouseEvent中两类坐标系统,一类是窗口坐标,一类是显示器坐标.   总结一:经过试验,QMouseEvent::globalPos()  和 QCursor::pos()效果 ...

  8. net 4.0+EF6+Sqlite 使用,安装,打包

    开发 1.因为EF不支持Codefirst,开始可以使用SQL来进行开发. 部署安装 2.然后可以找到SQL转Sqlite工具(http://www.cnblogs.com/walkingp/arch ...

  9. c#多线程调用有参数的方法

      Thread (ParameterizedThreadStart) 初始化 Thread 类的新实例,指定允许对象在线程启动时传递给线程的委托.   Thread (ThreadStart) 初始 ...

  10. React学习笔记(五)State&声明周期

    React学习笔记(五) 四.State&声明周期 可以为组件添加"状态(state)".状态与属性相似,但是状态是私有的,完全受控于当前组件. 局部状态就是只能用于类(定 ...