用法

从某个字符抽取信息

用新文本替换匹配的文本

把字符串拆分成小块字符串组成的数组

基础

preg_match('/需要匹配的正则表达式/', '字符串');

正则匹配模式

集合:

[xxxx]--一个字符串的可选范围,[ ^xxxxx]--一个字符串的不可选范围

选择性:

A|B: A或者B

重复序列: 重复模式 + 量词

量词

? --------------- 一次或者零次

* --------------- 零次或者多次

+ --------------- 一次或者多次

{n} ------------ n次

{n,  m} ------- 至少n次,至多m次

{n,  } -------------- 至少n次

贪婪

当匹配是遇到一个量词时,正则表达式引擎会尽可能多的匹配这个模式

非贪婪匹配(最少匹配), 在量词后面加一个问号

子模式: 使用小括号把几个正则表达式组合在一起

捕获模式

preg_match('/正则表达式/', string, array);

array保存子模式匹配到的子字符串(依次放到第一位,第二位......), 开始位置放置string。

非捕获模式

当某些子模式不需要在匹配到时捕获,可以改写子模式(subpattern)为(?:subpattern)

分隔符:

任何非数字字母字符都可以被用来当做分隔符,来区分分隔符与表达式。

字符类: 字符类中使用的命名字符集

[:alnum:] --------------------- [0-9a-zA-Z]

[:alpha:] ---------------------- [a-zA-Z]

......

eg: 要查找任意一个数字,字母,或者@

[@[:digit:][:upper:]]

Hint: 排序序列[st[.ch.]] 匹配s, t, ch的其中一个

 等价类[=XXX=]      匹配本地定义的具有相同排序序列的字符

锚(anchor): 将匹配限制在字符串中的特定位置

^ -------------------- 字符串、一行开始

$ -------------------- 字符串、一行结束

[[:<:]] -------------------- 单词开始

[[:>:]]  -------------------- 单词结束

......

后缀选项

perl风格的正则表达式允许把一个单个字符放在正则表达式后面,从而改变表达式的解析, 行为, 匹配方式。

后缀标识(一个模式中可以使用多个):

/regexp/i ------------- 匹配大小写

/regexp/s ------------ 使句点匹配任何字符

/regexp/x ------------ 去掉空白和注释

/regexp/m ------------ 使得^匹配换行符之后的内容,$匹配换行符之前的内容

......

内联选项

内联选项可以在一个模式内部指定仅运用于部分模式的后缀选项

(?flags:subpattern) 	设置内联选项

(?-flags:subpattern)	取消模式后面的选项

((?flags:subpattern))	内联标志不能用于捕获数组,需要额外设置一个小括号来完成捕获

前向/后向断言

待填坑

条件表达式

(?(condition)yespattern\nopattern)

函数

匹配: preg_match(pattern, string[, captured]);

替换: preg_replace(pattern, replacement, subject[, limit]);

拆分: preg_split (pattern, string) (pattern表示分割块)

过滤数组: preg_grep (pattern, array) 返回给定模式匹配的所有元素、

构造指定正则表达式: preg_quote (string );

基于PHP的正则表达式的更多相关文章

  1. 基于ε-NFA的正则表达式引擎

    正则表达式几乎每个程序员都会用到,对于这么常见的一个语言,有没有想过怎么去实现一个呢?乍一想,也许觉得困难,实际上实现一个正则表达式的引擎并没有想像中的复杂,<编译原理>一书中有一章专门讲 ...

  2. 基于java的正则表达式

    正则表达式概念 正则表达式,又称正规表示法.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式使用单个字符串来描 ...

  3. 正则表达式基于JavaScript的入门详解

    关于正则表达式,和很多前辈聊起这个知识点时,他们的反馈都比聊其他技术谦逊,而和很多刚入门的程序员讨论时甚至会有觉得你看不起他. 的确,正则表达式从通常的应用来看,的确不难,比如电话,邮箱等验证.语法, ...

  4. 【转】java正则表达式

    在Sun的Java JDK 1.40版本中,Java自带了支持正则表达式的包,本文就抛砖引玉地介绍了如何使用java.util.regex包. 可粗略估计一下,除了偶尔用Linux的外,其他Linu ...

  5. JAVA 正则表达式 (超详细)

    (PS:这篇文章为转载,我不喜欢转载的但我觉得这篇文章实在是超赞了,就转了过来,这篇可以说是学习JAVA正则表达的必读篇.作者是个正真有功力的人,阅读愉快) 在Sun的Java JDK 1.40版本中 ...

  6. 转载:JAVA 正则表达式 (超详细)

    在Sun的JavaJDK 1.40版本中,Java自带了支持正则表达式的包,本文就抛砖引玉地介绍了如何使用Java.util.regex包. 可粗略估计一下,除了偶尔用Linux的外,其他Linu x ...

  7. 关于pcre正则表达式库libpcre

    gcc 4.8中已经包含了std regex的头文件 可是没有实现,所以链接是失败的 gcc 4.9完整的支持了c++ 11的regex. 在4.9以前,可以寻求boost的regex. 不过,我更熟 ...

  8. 基于php常用正则表达整理(下)

    61        \n 匹配一个换行符.等价于 \x0a 和 \cJ.62        \r 匹配一个回车符.等价于 \x0d 和 \cM.63        \s 匹配任何空白字符,包括空格.制 ...

  9. 基于php常用正则表达整理(上)

    电子邮件:/\w+([-+.']\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/变量:/[a-zA-Z_\x7f-\xff][a-zA-Z0-9_\x7f-\xff]*/ 基于p ...

随机推荐

  1. Algorithm: Euler function

    欧拉函数. phi(n)表示比n小的与n互质的数的个数,比如 phi(1) = 1; phi(2) = 1; phi(3) = 2; phi(4) = 2; phi(5) = 4; 性质: 1. 如果 ...

  2. java基础以及操作Excle

    今天把会经常用的几个集合的迭代方法又练习了一下,放在这里,经常复习! map集合迭代 /*** 迭代map[1]*/ for (Integer key : map.keySet()) {//迭代key ...

  3. cookie VS sessionstorge VS localstorge

    虽然cookie , localstorge , sessionstorge三者都有存储的功能,但是还是有区别, git上地址:https://github.com/lily1010/cookie-s ...

  4. BZOJ 1628 [Usaco2007 Demo]City skyline:单调栈

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1628 题意: 题解: 单调栈. 单调性: 栈内元素高度递增. 一旦出现比栈顶小的元素,则表 ...

  5. BestCoder8 1002 Revenge of Nim(hdu 4994) 解题报告

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4994 题目意思:有 n 个 heap(假设从左至右编号为1-n),每个 heap 上有一些 objec ...

  6. 【转】澄清P问题、NP问题、NPC问题

    首先,原文链接.(这篇文章让我第一次有了感谢腾讯,感谢微信,感谢微信公众号的冲动.总之,非常感谢作者的分享.) 然后:结论图如下 担心万一哪天原网站把这篇文章下线,所以原文内容复制过来. 澄清P问题. ...

  7. C语言教学杂记——字母排序

    一个人在被告诉一个问题应该怎么被解决后,而且亲身试验效果OK后,一旦遇到类似的问题,就会条件反射般直接拿这个方法来用了.很少会去想为什么要用这个方法,会不会有什么隐患,还有没有别的方法呢,等等这些问题 ...

  8. Linux-awk和shell编程初步

    1 awk 格式: awk -选项 '处理' 输入 awk -F : '{print $1}' file -F指定分隔符, 默认是空格 $1 分割后的第一部分 $0 获得所有部分 NF 表示以分隔符分 ...

  9. 「HNOI2004」「LuoguP2292」L语言(AC自动机

    题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的 ...

  10. codevs 1497取余运算

    1497 取余运算  时间限制: 1 s  空间限制: 128000 KB  题目等级 : 钻石 Diamon   题目描述 Description 输入b,p,k的值,编程计算bp mod k的值. ...