摘自http://www.tuicool.com/articles/MFNZRzu

本文通过逐步完善一个验证手机号的正则表达式来介绍了正则表达式中的 字符组 、量词 、 字符串起始/结束位置 、 分组 、 分组中的选择结构 、 反向引用 、 命名分组等概念。

1 基本验证

即验证字符串是否是11位数字。

表达式

  • [0123456789]{11}

  • 或 [0-9]{11}

  • 或 \d{11}

知识点

字符组:正则表达式中用方括号对 [...] 表示字符组。字符组表示在同一位置可能出现的字符。

如, [0123456789] 表示匹配数字0123456789中的任意一个; [0123abc] 匹配数字0123和字母abc中的任意一个。

字符组的范围表示法:字符组中使用短横线( [..-..] )来表示一段范围的字符。

如, [a-z] 表示匹配所有小写英文字母中的任意一个; [a-zA-Z] 表示匹配所有小写英文字母和大写英文字母中的一个; [0-9] 表示匹配0123456789中的任意一个。

要注意的是,默认范围是起始字符的ACSⅡ码到结束字符的ACSⅡ码之间的字符。

字符组简记法:对于一些常用的字符组,正则表达式规定了一些简记符号来表示它们。

  • \d 所有的数字,即 [0-9]

  • \D 所有的非数字,与 \d 互斥

  • \w 所有的单词字符(字符、数字、下划线),即 [0-9a-zA-Z_]

  • \W 所有的非单词字符,与 \W 互斥

  • \s 所有的空白字符,包括空格、制表符、回车符、换行符等空白字符

  • \S 所有的非空白字符,与 \s 互斥

量词:量词表示它所修饰的对象(如字符、字符组)可能出现的次数。

量词的一般形式是 {m,n} (逗号 , 后面不能有空格),表示它所修饰的字符(或字符组)的出现次数大于等于m次,小于等于n次。特别地

  • {m} 表示修饰对象只能出现m次;

  • {0,n} 表示修饰的对象最多出现n次,最少出现0次;

  • {m,} 表示修饰的对象最少出现m次。

2 长度真的只能为11?

观察下面的gif中的代码可以看到,当输入的字符串是长度为15的数字时,也可以匹配前面11个数字。甚至输入字符是 abcd180123412341234 时也可以匹配到11个数字。

这是因为上面的正则表达式的含义是“匹配11个数字”,因此 只要 输入的字符串中 有连续的11个数字 就可以匹配成功。要想验证输入的字符串仅仅是手机号,需要使用正则表达式中的字符串起始位置 ^ 和字符串结束位置 $ 。

表达式

  • ^\d{11}$

知识点

正则表达式中有一些符号匹配的是位置,而不是文本,这类符号叫做 锚点 (anchor)。 ^ 、 $ 就是其中两个。

^ 匹配的位置是字符串的开始位置

$ 匹配的位置是字符串的结束位置

3 更严谨的验证

我们都知道国内常见的手机号都是以130-139,150-153、155-159、180、182、185-189开头,此外,还有170、176-178等。我们上一节得到的表达式对手机开头并没有进行验证。

表达式

^1(3[0-9]|5[012356789]|8[0256789]|7[0678])\d{8}$

知识点

分组:正则表达式中可以用圆括号对 (...) 表示一个分组(子表达式),这样在匹配的结果中除了会返回全部匹配到的内容,还会返回每个子表达式各自匹配到的内容。如上图中的表达式执行后的结果,数组的第0个元素为整个正则表达式匹配到的值,第1个元素为圆括号对内的正则匹配到的值。

preg_match('/^1(3[0-9]|5[012356789]|8[0256789]|7[0678])\d{8}$/', '18012341234', $arr);
print_r($arr);
/*
Array
(
[0] => 18012341234
[1] => 80
)
*/

选择结构:圆括号对 (...) 内的子表达式用竖线 | 隔开表示不同的选择,圆括号内的整个正则可以匹配任意一个选择。

例如, (3[0-9]|5[012356789]|8[0256789]|7[0678]) 表示这里匹配的值可以是 3[0-9] 或者 5[012356789] 或者 8[0256789] 或者 7[0678] 中的任意一个。

4 锦上添花

有些时候,手机号中间会有 - 符号,变成 180-1234-1234 的形式,比如现在的iPhone会自动将手机号转为这种格式。

依据到目前为止介绍的一些知识,可以写出下面的正则表达式来兼容 180-1234-1234 的形式:

^1(3[0-9]|5[012356789]|8[0256789]|7[0678])-{0,1}\d{4}-{0,1}\d{4}$

其中 -{0,1} 表示字符 - 可以出现1次或者不出现,这是我们前面了解过的量词,其实在正则表达式中,对这种 常用量词 还规定了特殊的记法:

  • ? 相当于 {0,1} ,可以出现0次或1次

  • + 相当于 {1,} ,出现次数大于等于1次

  • * 相当于 {0,} ,出现次数大于等于0次

因此,上面的正则表达式也等价于

^1(3[0-9]|5[012356789]|8[0256789]|7[0678])-?\d{4}-?\d{4}$

但是,上面的表达式除了能匹配 18012341234 和 180-1234-1234 ,其实也能匹配 180-12341234 、 1801234-1234 这两种形式。

如果我们只想匹配 18012341234 和 180-1234-1234 这两种形式,可以使用正则表达式中的 反向引用:

^1(3[0-9]|5[012356789]|8[0256789]|7[0678])(-?)\d{4}\2\d{4}$

上面的 \2 就是反向引用,它是匹配第二个圆括号对 (...) 匹配到的内容。反向引用的形式是 \num ,它是在正则表达式里面引用前面的分组匹配到的内容。

上面的正则表达式中,我们用 \2 来进行反向引用,然而 \1 却没有什么用,那么我们可不可以忽略那些不用的分组呢?正则表达式中的 非捕获分组 可以满足这个需求:

^1(?:3[0-9]|5[012356789]|8[0256789]|7[0678])(-?)\d{4}\1\d{4}$

上面的 (?:3[0-9]|5[012356789]|8[0256789]|7[0678]) 就是非捕获分组。非捕获的形式是 (?:...) ,使用了非捕获分组后,匹配的结果里面不再有该分组匹配到的结果。

上面对分组的引用是基于子表达式的编号,当正则表达式比较复杂或编号太多时要弄清楚每个分组的编号是一件很痛苦的事情。因此,正则表达式提供了 命名分组 :

^1(?:3[0-9]|5[012356789]|8[0256789]|7[0678])(?P<separato>-?)\d{4}(?P=separato)\d{4}$

上面正则表达式中的 (?P<separato>-?) 就是命名分组。命名分组的形式是 (?P<name>...) ,命名分组的引用使用 (?P=name) 的形式。

5 总结

到此为止,一个健壮的验证手机号的正则表达式就完成了。虽然功能很简单,但是还是涉及到了正则表达式中不少的知识点。

php实战正则表达式:验证手机号的更多相关文章

  1. Android 正则表达式验证手机号、姓名(包含少数民族)、身份证号

    最近项目中新增的功能,需要对手机号.姓名.身份证号等一些信息进行验证,最好的方法是通过正则表达式来验证,网上查了一些资料,写了这几个工具方法. 1.验证手机号 规则:第一位只能是1,第二位为3-8中的 ...

  2. JS正则表达式验证手机号和邮箱

    一.验证手机号 function isPoneAvailable(poneInput) { var myreg=/^[1][3,4,5,7,8][0-9]{9}$/; if (!myreg.test( ...

  3. Android中利用正则表达式验证手机号是否合法

    利用正则表达式来验证手机号是否合法,现在我们简单使用一下,这个在实际的应用中很实用. 例:在输入框中输入手机号,判断是否合法, MainActivity中: package com.example.m ...

  4. IOS开发——正则表达式验证手机号、密码

    App的实际应用中,用户登陆功能基本是每个App都有需求的一个功能.而当前我们很常规的做法,就是让用户把手机号作为自己的用户名,而在注册获取短信验证码的过程中,我们首先要完成的一个步骤,就是校验用户的 ...

  5. Android使用正则表达式验证手机号

    国内手机号代码段分配如下: 移动:134.135.136.137.138.139.150.151.157(TD).158.159.187.188 联通:130.131.132.152.155.156. ...

  6. JQuery使用正则表达式验证手机号,邮箱,身份证(含有港澳台),网址

    自己对正则验证也没系统用过,这次自己做个demo,一下子把这些全都用上了,下次有需要直接来拿了. 以下代码是在页面使用JQuery进行验证的,也有在后台进行验证的,可以试试,都一样的原理. 直接上代码 ...

  7. js正则表达式 验证手机号,email地址和邮政编码

    手机号码的验证(13开头和158,159开头,共11位) var re;        var ss=document.getElementById('textbox3').value;        ...

  8. [jquery]jquery正则表达式验证(手机号、身份证号、中文名称)

    数字判断方法:isNaN()函数 test()方法 判断字符串中是否匹配到正则表达式内容,返回的是boolean值 ( true / false ) // 验证中文名称 function isChin ...

  9. JS正则表达式验证账号、手机号、电话和邮箱

    JS正则表达式验证账号.手机号.电话和邮箱 效果体验:http://keleyi.com/keleyi/phtml/jstexiao/15.htm 验证帐号是否合法 验证规则:字母.数字.下划线组成, ...

随机推荐

  1. php课程---简单的分页练习

    在写代码时,我们可以用类来使代码更加方便简洁,下面是一个简单的查询分页练习 源代码: <html> <head> <style type="text/css&q ...

  2. 《Linux内核分析》第一周 计算机是如何工作的?

    刘蔚然 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000] WEEK ONE(2. ...

  3. sshpass 用法举例

    关于sshpass 背景 在Linux后台中,经常会用到ssh.scp等命令.需要进行认证,手动输入密码,是交互式的过程. 当将ssh.scp等命令做成自动化脚本时,可能需要非交互式的登录过程,此时可 ...

  4. SQL server2012怎么备份数据库(设置自动备份)

    1.打开SQL server配置管理器,设置sql server服务里的SQL server代理服务为自动并启动 2.启动Master Data Services Configuration Mana ...

  5. C# gridControl 部分设置

    1.页数导航状态栏 2.列表行号栏 3.列标题显示隐藏 4.Button设置

  6. selected对话框全选

    selected对话框全选 <!DOCTYPE html> <html lang="en"> <head> <meta charset=& ...

  7. 关于Thread.IsBackground属性的理解(转载)

    C#中,Thread类有一个IsBackground 的属性.MSDN上对它的解释是:获取或设置一个值,该值指示某个线程是否为后台线程.个人感觉这样的解释等于没有解释. .Net中的线程,可以分为后台 ...

  8. js 点赞数 处理

    likeNum(num) { if (num === 0) { num = ''; } else if (num > 9999 && num <= 9999999) { n ...

  9. FlashFXP5_gr坑爹的故事

    数据中心说已把数据存放到ftp上,但我通过flashfxp5工具链接到ftp server查看数据中心存放的数据,一天了都没有看到数据结果,经过我反复多次重新链接否没有发现数据中心所说的最新数据结果, ...

  10. Could not load file or assembly'System.Data.SQLite.dll' or one of its depedencies

    安装对应的 Microsoft Visual C++ 2010 Redistributable Package (x86)   If your download does not start afte ...