PHP正则表达式基本语法
本章主要学习正则表达式的基本语法;
正则表达式就是一个匹配的模式,正则表达式本身也就是一个字符串(有一些语法规则,特殊符号组成)
正则表达式这个字符串一定要在对应的函数中使用才有意义(分割,替换函数结合使用)
1、定界符 / /
2、原子 最小的一个匹配单元(放在 / / 中,在正则表达式中,至少有一个。例如:$reg = '/ 7 /' )
3、元字符 元字符是不能单独使用的,用来修饰元子的,用来扩展原子功能和限字的做补充说明(协助定界符中 例如:$reg = '/{5}/' )
4、模式修正符 修正,对模式(正则)修正(写在定界符的外面,写在右边 例如: $reg = '/ {5} / i ' 中的i)
一、界定符号
界定符就表示一个正则表达式的开始和结束
例如:/[0-9]/ | #[0-9]# | {[0-9]} 常用写法建议使用斜杠;// $pattern = '/[0-9]/'
二、原子
可见原子:
1、标点符号; ‘’ _ ? . 等等
2、英文字母数字 a-z, A-Z, 0-9
3、汉语,日文,阿拉伯文等其他文字
4、数理化公司符号
5、其他可见字符
不可见原子:
1、换行符 \n
2、回车 \r
3、制表符 \t
4、空格
5、其他看不见的符号
(所有的数字,所有的字,所有的空白,所有的字母,特殊符号 如下)
. 匹配除换行符之外的任意字符
\d (所有的数字) 代表任意一个数字 [ 0-9 ]
\D (代表所有非数字) 代表任何一个非数字 [ ^0-9 ]
\w 代表任意一个字,a-z A-Z, 0-9 _ [ a-zA-Z0-9_]
\W 代表任意一个非字,a-z A-Z 0-9 _ 之外的所有字符 [ ^ a-zA-Z0-9_ ]
\s 代表空白 [ \t \n \f \v ]
\S 代表任意一个非空白 [^ \t \n \f \v ]
自定义原子表
[ 13579 ]
[ a-zA-Z] 说明:- 是从哪到哪
[ ^a-zA-Z ] 说明: ^ 是除了什么
说明:( . ) 点, 能代表所有的一个原子
三、元字符
元字符这个不能在正则表达式中单独使用,用来修饰原子的
元字符 即原子的筛选方式
* 用来修饰前面的原子可以出现 0 个 1 个 或者 多个
+ 用来修饰前面的原子出现的次数 1 次 或 多次 (不能没有一次)
?用来修饰前面的原子出现的次数 0 次 或 1次
{ m } 用来修饰前面的原子出现 m 次,多一次少一次都不行
{ n, m } 用来修饰前面的原子出现的个数,在 n 到 m 之间,包含 n, m
{ n, } 用来修饰前面的原子可以出现至少 n 次,包含 n
| 或的关系,表示它两边的原子,只有有一个出现就可以,但是 | 的优先级最低
^ 和 \A 表示必须以什么开始,必须写在正则表达式的前面
$ 和 \Z 表示必须以什么结束,必须写在正则表达式的后面
\b 单词边界
\B 非单词边界
()第一个作用:改变优先级别
$str = ' orisaabc';
$reg = '/ or(is|a)abc/';
第二个作用:将小原子变成大原子
$str = 'sqlsalabcsqlddfd';
$reg = '/(sql)*/';
第三个作用:子模式,整个表达式是一个大模式,小括号中的是每一个独立的子模式
第四个作用:反向引用
?: 取消子模式,作为大模式用(?:\d{4})
\1 取子模式
四、模式修正符
模式修正符要放在定界符之外,放在右边,模式修正符一个字符就是一个功能,可以组合使用;
例如: “/ go*gle/ i ”; "/go*gle/ ieu";
作用:
模式修正符号可以修正正则表达式的解释,或者扩充正则表达式的功能;
i 不区分大小写(默认是区分大小写)
m 修正符号修正正则表达式可以视为多行,在使用 ^ 或 $ 时每一行满足都可以(默认为一行)
s 用来修正正则表达式中的换行符号,是包含换行符,不用 s 则不包含换行符,默认不包含换行符
x 忽略修正正则表达式可以省略多个单词之间的空白
U (.* , .+) 正则表达式比较贪婪,.*? 和 .+?可以取消贪婪
贪婪的案例:
$pattern = '/myistest.+123/';
$subject = 'you look myistest__123123123123';
$matche = [];
preg_match($pattern, $subject, $matche);
show($matche);
贪婪的结果:
Array
(
[0] => myistest__123123123123
)
取消贪婪的大U:
$pattern = '/myistest.+123/U';
$subject = 'you look myistest__123123123123';
$matche = [];
preg_match($pattern, $subject, $matche);
show($matche);
取消贪婪的结果:
Array
(
[0] => myistest__123
)
忽略大小写的案例:i 的用法
$pattern = '/myisTest.+123/Ui';
$subject = 'you look myistest__123123123123';
$matche = [];
preg_match($pattern, $subject, $matche);
show($matche);
输出结果同上;不加 i 是匹配不到结果的;
忽略空白符的案例: x 的使用
$pattern = '/m yi s Test.+123/Uix';
$subject = 'you look myistest__123123123123';
$matche = [];
preg_match($pattern, $subject, $matche);
show($matche);
输出结果同上,不加 x 是匹配不到结果的;
五、实战应用
1、非空匹配 ‘/.+/’
2、浮点数匹配(保留2位)‘/(?!0\.00)(\d+\.\d{2}$)/’
$subject = ['1.00', '2.345', '0.23', '234', '23.22', '0.00'];
$matche = [];
for ($i = 0; $i < count($subject); $i++){
if(preg_match('/(?!0\.00)(\d+\.\d{2}$)/', $subject[$i], $matche)){
show($matche);
}
}
结果:
Array
(
[0] => 1.00
[1] => 1.00
)
Array
(
[0] => 0.23
[1] => 0.23
)
Array
(
[0] => 23.22
[1] => 23.22
)
3、手机号码 ‘/^1(3|4|7|8)\d{9}$/’
4、Email地址 ‘/^([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)$/i’ 或者 ‘/^\w+(\.\w+)*@\w+(\.\w+)+$/’
5、常见URL地址 '/^(https?://)?(\w\.)+[a-zA-Z]+$/'
注:学习笔记
PHP正则表达式基本语法的更多相关文章
- Java正则表达式的语法与示例
Java正则表达式的语法与示例 java 正则表达式 正则表达式语法 java正则表达式语法 java正则表达式 概要: Java正则表达式的语法与示例 | |目录 1匹配验证-验证Email是否正确 ...
- 前端学PHP之正则表达式基础语法
前面的话 正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割.匹配.查找及替换操作.在PHP中,正则表达式一般是由正规字符和一些特殊字符(类似于通配符)联合构成的一个文本 ...
- (转)Java正则表达式的语法与示例
转自:http://www.cnblogs.com/lzq198754/p/5780340.html 概要: Java正则表达式的语法与示例 | |目录 1匹配验证-验证Email是否正确 2在字符串 ...
- JS 正则表达式基本语法(精粹)
1.正则表达式基本语法 两个特殊的符号'^'和'$'.他们的作用是分别指出一个字符串的开始和结束. 例子如下: "^The":表示所有以"The"开始的字符串( ...
- js正则表达式基本语法
正则表达式基本语法 两个特殊的符号'^'和'$'.他们的作用是分别指出一个字符串的开始和结束. 例子如下: "^The":表示所有以"The"开始的字符串(&q ...
- JavaScript正则表达式之语法
Regular Expressions翻译成中文叫正则表达式.也不知道是谁翻译过来的,听起来就很严肃.似乎翻译成通用表达式更能传达其精髓. 为什么叫通用表达式?因为它有一套和编程语言无关的文本匹配规则 ...
- 学习django之正则表达式的语法
正则表达式 正则表达式的常用语法: 1)单个字符: . 任意的一个字符 a|b 字符a或字符b [afg] a或者f或者g的一个字符 [0-4] 0 ...
- JavaScript学习笔记-正则表达式(语法篇)
正则表达式的模式规则是由一个字符系列组成的,包括所有字母和数字在内;大多数的字符(所有字母和数字)都是按字符的直接量来描述带匹配的字符;一些具有特殊语义的字符按照其特殊语义来进行匹配,有些字符需要通过 ...
- JavaScript 正则表达式基础语法
前言 正则表达式在人们的印象中可能是一堆无法理解的字符,但就是这些符号却实现了字符串的高效操作.通常的情况是,问题本身并不复杂,但没有正则表达式就成了大问题.javascript中的正则表达式作为相当 ...
随机推荐
- c++ undefinede reference to 构造函数/析构函数
g++编译器问题 把头文件"a.h"和头文件实现文件"a.cpp"都include就解决了.
- openssl在多平台和多语言之间进行RSA加解密注意事项
首先说一下平台和语言: 系统平台为CentOS6.3,RSA加解密时使用NOPADDING进行填充 1)使用C/C++调用系统自带的openssl 2)Android4.2模拟器,第三方openssl ...
- jenkins配置01--用户添加及权限配置
原文出自:https://www.cnblogs.com/kevingrace/p/6019707.html 下面重点记录下jenkins安装后的一些配置: (1)添加用户权限 jenkins初次登陆 ...
- React Native iOS 离线包
平时使用React Native 时候, js代码和图片资源运行在一个Debug Server上(需要cd 到RN目录,然后终端执行 npm start 命令开启本地服务 ).每次更新代码之后只需要使 ...
- No.11_功能规格说明书
功能规格说明书 • 基本目标 为用户提供更加便捷和人性化的闹钟提醒服务,以群组为单位规划时间安排与分配,对于个人用户,实现个人的设置闹钟,取消闹钟的操作,这些操作将会上传至数据库,并被同步到所有的客户 ...
- 20162314 《Program Design & Data Structures》Learning Summary Of The Second Week
20162314 2017-2018-1 <Program Design & Data Structures>Learning Summary Of The Second Week ...
- scanf() scanf_s() 区别
写博原因:这几天由于小学期的缘故,接触到了好多C代码,在VS2013中编译的时候,遇到了如下问题: 错误 1 error C4996: 'scanf': This function or variab ...
- 《UML大战需求分析》-读后感一
UML英文全拼是unified modeling language 就是统一建模语言. UML就是一种软件开发中帮助我们设计的标准,虽然说是建模语言但是它是图形,图形能更清楚的表达我们对软件的想法.U ...
- bata2
目录 组员情况 组员1(组长):胡绪佩 组员2:胡青元 组员3:庄卉 组员4:家灿 组员5:凯琳 组员6:翟丹丹 组员7:何家伟 组员8:政演 组员9:黄鸿杰 组员10:刘一好 组员11:何宇恒 展示 ...
- 《TCP/IP 详解 卷1:协议》第 2 章:Internet 地址结构
第二章介绍 Internet 使用的网络层地址,即熟知的 IP 地址.连接到 Internet 的设备,基于 TCP/IP 的专用网络中使用的设备都需要一个 IP 地址. 路由器(见 IP 协议 一章 ...