php正则表达式基本
一.正则表达式的组成 1.分隔符,可以是除了字母,数字,反斜线及空白以外的任何字符,比如/,!,#,%,|,~等;通常有/,!,~ 2.表达式:由一些特殊字符和非特殊字符组成. 3.修饰符:用于开启或关闭某种功能/模式 二.元字符 常用的元字符有以下几种 . 匹配除换行符外任何字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意空白字符
\d 匹配数字
\b 匹配单词开始或结束
^ 匹配字符串开始
$ 匹配字符串结束
- 表示范围
[] 匹配括号中任意一个字符
* + ? 量词 三.字符组 如果匹配没有预定义的元字符,可以使用字符组;只需要在[]内列出他们;
如
[aoeiou]匹配任何一个英文元音字母;
[.?!] 匹配标点符号 . ? ! ps:尽管[]号内有好多字符,但他只匹配单个字符 四.转义 如果要匹配元字符本身,比如?,直接匹配,会被当成元字符处理,这时候要使用转义;
\? 如:
\? 就可匹配字符串中含有?的字符串 ps:字符组中的元字符不需要转义 五.反义 \W 匹配除字母或数字或下划线或汉字以外
\S 匹配除任意空白字符以外
\D 匹配除数字以外
\B 匹配不是单词开始或结束的位置 字符组的反义是加^
[^abc] 匹配除了abc这几个字母以外的任意字符 ps:反义的特征是和一些已知元字符相反,并且为大写形式.字符组例外 六.分支 | 表示分支 分支就是存在多种可能的匹配情况;如要匹配cat,hat,fat,toat,就可以用分支形式
(c|h|f|to)at ps:匹配分支条件时,从左到右测试每个条件,如果满足某个分支,就不再考虑其他条件. 七.分组 重复单个字符需要限定符即可做到,重复多个字符就需要分组;分组用小括号指定表达式,然后规定这个表达式重复的次数. 1.捕获
(exp) 匹配exp,并捕获文本到自动命名组里
(?<name>exp) 匹配exp,并捕获文本到name组里
(?:exp) 匹配exp,不捕获,也不分配组号 示例1:
<?php
$str = 'cat';
preg_match_all('/(c).*/', $str, $arr);
var_dump($arr); 输出(自动命名组):
array(2) {
[0]=>
array(1) {
[0]=>
string(3) "cat"
}
[1]=>
array(1) {
[0]=>
string(1) "c"
}
} 示例2:
<?php
$str = 'cat';
preg_match_all('/(?<name>c).*/', $str, $arr);
var_dump($arr); 输出(多出一个test组):
array(3) {
[0]=>
array(1) {
[0]=>
string(3) "cat"
}
["test"]=>
array(1) {
[0]=>
string(1) "c"
}
[1]=>
array(1) {
[0]=>
string(1) "c"
}
} 示例3:
<?php
$str = 'cat';
preg_match_all('/(?:c).*/', $str, $arr);
var_dump($arr); 输出: array(1) {
[0]=>
array(1) {
[0]=>
string(3) "cat"
}
} 2.零宽断言(匹配的是事实,不是内容)
(?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面跟的不是exp的位置 如:
<?php
$str = 'testecattest';
preg_match_all('/(?=te)/', $str, $arr); 则输出:
array(1) {
[0]=>
array(3) {
[0]=>
string(0) ""
[1]=>
string(0) ""
[2]=>
string(0) ""
}
}
匹配到三处 ps:默认情况下,每个分组拥有一个组号,规则是从左到右,以分组的左括号为标志,第一个出现在分组里的为1,第二个为2,以此类推;分组0为整个表达式. 八.反向引用 反向引用在于重复搜索前面某个分组匹配的文本. 示例:
$str = '[url]1.gif[/url]';
$img = preg_replace('/\[url\](\d+\.gif)\[\/url\]/', '<img src="$1" />', $str);
echo $img; 输出
<img src="1.gif" /> $1匹配了分组(\d+\.gif) 九.环视(零宽断言) 1.顺序肯定环视(?=exp)
断言自身出现位置的后面能匹配表达式exp
示例:
<?php
$str = 'what are you doing testing?';
preg_match_all('/\b\w+(?=ing\b)/', $str, $arr);
var_dump($arr); 匹配do和test 2.逆序肯定环视(?<=exp)
断言自身出现位置的前面能匹配表达式exp
示例:
<?php
$str = 'what are you doing testing?';
preg_match_all('/\b(?=ing)/', $str, $arr);
var_dump($arr); 匹配doing和testing 3.顺序否定环视(?!exp) 4.逆序否定环视(<!exp) 十.常用修饰符/模式
1. i 忽略大小写
示例:
<?php
$str = 'cat test CAT';
preg_match_all('/cat/i', $str, $arr);
var_dump($arr); 不加i修饰符,只匹配cat 2. m 多行模式
仅当表达式中出现^,$至少一个元字符且有换行符\n时,m修饰符才起作用; 如:
$str = 'cat test
cat'; 要提取cat a.不用多行模式
preg_match_all('/cat.*/', $str, $arr); b.用多行模式
preg_match_all('/cat.*$/m', $str, $arr); 3.s 点号统配模式(.号可以匹配换行符)
如:
<?php
$str = 'cat
t
test
cat
f';
preg_match_all('/t.*f/s', $str, $arr);
var_dump($arr); 输出:
array(1) {
[0]=>
array(1) {
[0]=>
string(19) "t
t
test
cat
f"
}
} 4.U 懒惰模式
等效于懒惰匹配 5.D 结尾限制
等效于结尾限定符 6.u 启用pcre中与perl不兼容的功能,模式字符串被当成utf-8
php正则表达式基本的更多相关文章
- JS正则表达式常用总结
正则表达式的创建 JS正则表达式的创建有两种方式: new RegExp() 和 直接字面量. //使用RegExp对象创建 var regObj = new RegExp("(^\\s+) ...
- Python高手之路【五】python基础之正则表达式
下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print( ...
- C# 正则表达式大全
文章导读 正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串.正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法.Regex 类表示不可变(只读)的 ...
- C#基础篇 - 正则表达式入门
1.基本概念 正则表达式(Regular Expression)就是用事先定义好的一些特定字符(元字符)或普通字符.及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来判断我们给定的字符串 ...
- JavaScript正则表达式,你真的知道?
一.前言 粗浅的编写正则表达式,是造成性能瓶颈的主要原因.如下: var reg1 = /(A+A+)+B/; var reg2 = /AA+B/; 上述两个正则表达式,匹配效果是一样的,但是,效率就 ...
- Python 正则表达式入门(中级篇)
Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...
- 【JS基础】正则表达式
正则表达式的() [] {}有不同的意思. () 是为了提取匹配的字符串.表达式中有几个()就有几个相应的匹配字符串. (\s*)表示连续空格的字符串. []是定义匹配的字符范围.比如 [a-zA-Z ...
- JavaScript 正则表达式语法
定义 JavaScript定义正则表达式有两种方法. 1.RegExp构造函数 var pattern = new RegExp("[bc]at","i"); ...
- [jquery]jquery正则表达式验证(手机号、身份证号、中文名称)
数字判断方法:isNaN()函数 test()方法 判断字符串中是否匹配到正则表达式内容,返回的是boolean值 ( true / false ) // 验证中文名称 function isChin ...
- JS中给正则表达式加变量
前不久同事询问我js里面怎么给正则中添加变量的问题,遂写篇博客记录下. 一.字面量 其实当我们定义一个字符串,一个数组,一个对象等等的时候,我们习惯用字面量来定义,例如: var s = &quo ...
随机推荐
- .com和.cn域名的区别所在,各个域名后缀含义
很多人在注册域名的时候不明白域名后缀的含义,在这里就介绍两种最为常用的域名,介绍下他们的区别以及适用的范围.需要先查询是否被注册,我们经常去的就是西部数据和万网,查询并注册未被注册的域名,一般无论是什 ...
- WireShark:TCP三次握手 抓包
本机ip:192.168.201.200 服务器ip:192.168.230.20 抓到的数据如下: 第一次握手: SYN标记位为1,表示这是一个连接请求.seq 用于服务端返回确认信息,此时ack ...
- MySQL 5.7主从复制与主主复制实现细节分析
0.简介: MySQL作为世界上使用最为广泛的数据库之一,免费是其原因之一.但不可忽略的是它本身的功能的确很强大.随着技术的发展,在实际的生产环境中,由单台MySQL数据库服务器不能满足实际的需求.此 ...
- Distributed Cache Coherence at Scalable Requestor Filter Pipes that Accumulate Invalidation Acknowledgements from other Requestor Filter Pipes Using Ordering Messages from Central Snoop Tag
A multi-processor, multi-cache system has filter pipes that store entries for request messages sent ...
- xen 保存快照的实现之 —— device model 状态保存
xen 保存快照的实现之 —— device model 状态保存 实现要点: 设备状态保存在 /var/lib/xen/qemu-save.x 文件这个文件由 qemu-dm 产生,也由 qemu- ...
- Nodejs将Buffer转化成Stream
编写接口的时候经常需要将上传的文件保存到数据库的情况,在nodejs中文件上传可以使用multer来接收上传的文件.如果不想保存到本地,而是直接保存到mongodb中,就要将buffer对象转化成流再 ...
- python每日一类(5):itertools模块
itertools模块包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用. ch ...
- 获取a'p'p签名
1.第一种方式 https://open.weixin.qq.com/cgi-bin/showdocument?action=dir_list&t=resource/res_list& ...
- slice,splice,substr,substring函数的区别
slice: 语法:array.slice(startIndex,endIndex); 参数: startIndex:必须,规定从何处开始选取,如果为负则从尾部开始计算 : endIndex:可选,规 ...
- 线性基【p4570】 [BJWC2011]元素
题目描述-->p4570 [BJWC2011]元素 题目大意 给定一些矿石的编号与价值,我们想要得到最大的价值和,并且选定物品的编号异或之和不为0. 分析 线性基就不多bb了,来这里->p ...