JavaScript正则表达式

学习要点:

1.什么是正则表达式

2.创建正则表达式

3.获取控制

4.常用的正则

假设用户需要在HTML表单中填写姓名、地址、出生日期等。那么在将表单提交到服务器进一步处理前,JavaScript程序会检查表单以确认用户确实输入了信息并且这些信息是符合要求的。

一.什么是正则表达式

正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript的RegExp类表示正则表达式,而String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。

正则表达式主要用来验证客户端的输入数据。用户填写完表单单击按钮之后,表单就会被发送到服务器,在服务器端通常会用PHP、ASP.NET等服务器脚本对其进行进一步处理。因为客户端验证,可以节约大量的服务器端的系统资源,并且提供更好的用户体验。

二.创建正则表达式

创建正则表达式和创建字符串类似,创建正则表达式提供了两种方法,一种是采用new运算符,另一个是采用字面量方式。

1.两种创建方式

通过new关键字和RegExp()创建表达式

RegExp()表达式对象,【有参,第一个参数是字符串,第二个参数是模式修饰符】

var asdc = "叫卖录音网";
var asdc2 = new RegExp(asdc); //创建正则对象,将字符串传入表达式
alert(asdc2); //打印出表达式,返回/叫卖录音网/
var asdc = "叫卖录音网";
var asdc2 = new RegExp(asdc,'ig'); //创建正则对象,将字符串传入表达式,并且写了正则模式修饰符
alert(asdc2); //打印出表达式,返回/叫卖录音网/gi

模式修饰符的可选参数

参  数

含  义

i

忽略大小写

g

全局匹配

m

多行匹配

字面量方式创建正则

var asdc2 = /叫卖录音网/;    //字面量方式创建正则
var asdc3 = /叫卖录音网/ig; //字面量方式创建正则,并且写入模式修饰符
alert(asdc2); //打印正则,返回/叫卖录音网/
alert(asdc3); ////打印正则,返回/叫卖录音网/gi

2.测试正则表达式

RegExp对象包含两个方法:test()和exec(),功能基本相似,用于测试字符串匹配。test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,不存在则返回false。exec()方法也用于在字符串中查找指定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。

RegExp对象的方法

方  法

功  能

test

在字符串中测试模式匹配,返回true或false

exec

在字符串中执行匹配搜索,返回结果数组

test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,不存在则返回false。

使用new运算符的test方法示例

/*使用new运算符的test方法示例*/
var pattern = new RegExp('box', 'i'); //创建正则模式,不区分大小写
var str = 'This is a Box!'; //创建要比对的字符串
alert(pattern.test(str)); //通过test()方法验证是否匹配,返回true

使用字面量方式的test方法示例

/*使用字面量方式的test方法示例*/
var pattern = /box/i; //创建正则模式,不区分大小写
var str = 'This is a Box!'; //创建要匹配的字符串
alert(pattern.test(str)); //通过test()方法验证是否匹配,true

使用一条语句实现正则匹配

/*使用一条语句实现正则匹配*/
alert(/box/i.test('This is a Box!')); //模式和字符串替换掉了两个变量

exec()方法也用于在字符串中查找指定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。

使用exec返回匹配数组

/*使用exec返回匹配数组*/
var pattern = /录音/i; //创建正则匹配模式
var str = '专业广告录音网站'; //创建要匹配的字符串
alert(pattern.exec(str)); //匹配了返回数组,否则返回null

PS:exec方法还有其他具体应用,我们在获取控制学完后再看。

3.使用字符串的正则表达式方法

除了test()和exec()方法,String对象也提供了4个使用正则表达式的方法。

String对象中的正则表达式方法

方  法

含  义

match(pattern)

返回pattern中的子串或null

replace(pattern, replacement)

用replacement替换pattern

search(pattern)

返回字符串中pattern开始位置

split(pattern)

返回字符串按指定pattern拆分的数组

match()返回匹配到的字符串以数组形式,加上length属性还可以返回匹配到的数组长度

/*使用match方法获取获取匹配数组*/
var pattern = /box/ig; //全局搜索
var str = 'This is a Box!,That is a Box too';
alert(str.match(pattern)); //匹配到两个Box,Box
alert(str.match(pattern).length); //获取数组的长度

search()返回匹配字符串的开始位置

/*使用search来查找匹配数据*/
var pattern = /box/ig;
var str = 'This is a Box!,That is a Box too';
alert(str.search(pattern)); //查找到返回位置,否则返回-1

PS:因为search方法查找到即返回,也就是说无需g全局

replace()将匹配到的字符串替换成别的字符串

/*使用replace替换匹配到的数据*/
var pattern = /box/ig;
var str = 'This is a Box!,That is a Box too';
alert(str.replace(pattern, 'Tom')); //将Box替换成了Tom

split()返回字符串按指定匹配拆分的数组 

/*使用split拆分成字符串数组*/
var pattern = /!/ig;
var str = 'This is a Box!,That is a Box too';
alert(str.split(pattern)); //将空格拆开分组成数组

RegExp对象的静态属性

属  性

短  名

含  义

input

$_

当前被匹配的字符串

lastMatch

$&

最后一个匹配字符串

lastParen

$+

最后一对圆括号内的匹配子串

leftContext

$`

最后一次匹配前的子串

multiline

$*

用于指定是否所有的表达式都用于多行的布尔值

rightContext

$'

在上次匹配之后的子串

使用静态属性
/*使用静态属性*/
var pattern = /(g)oogle/;
var str = 'This is google!';
pattern.test(str); //必须执行一下
alert(RegExp.input); //This is google!
alert(RegExp.leftContext); //This is
alert(RegExp.rightContext); //!
alert(RegExp.lastMatch); //google
alert(RegExp.lastParen); //g
alert(RegExp.multiline); //false

PS:Opera不支持input、lastMatch、lastParen和multiline属性。IE不支持multiline属性。

所有的属性可以使用短名来操作

RegExp.input可以改写成RegExp['$_'],依次类推。但RegExp.input比较特殊,它还可以写成RegExp.$_。

RegExp对象的实例属性

属  性

含  义

global

Boolean值,表示g是否已设置

ignoreCase

Boolean值,表示i是否已设置

lastIndex

整数,代表下次匹配将从哪里字符位置开始

multiline

Boolean值,表示m是否已设置

Source

正则表达式的源字符串形式

使用实例属性

/*使用实例属性*/
var pattern = /google/ig;
alert(pattern.global); //true,是否全局了
alert(pattern.ignoreCase); //true,是否忽略大小写
alert(pattern.multiline); //false,是否支持换行
alert(pattern.lastIndex); //0,下次的匹配位置
alert(pattern.source); //google,正则表达式的源字符串 var pattern = /google/g;
var str = 'google google google';
pattern.test(str); //google,匹配第一次
alert(pattern.lastIndex); //6,第二次匹配的位

PS:以上基本没什么用。并且lastIndex在获取下次匹配位置上IE和其他浏览器有偏差,主要表现在非全局匹配上。lastIndex还支持手动设置,直接赋值操作

三.获取控制

正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能,可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。

字符类:单个字符和数字

元字符/元符号

匹配情况

.

匹配除换行符外的任意字符

[a-z0-9]

匹配括号中的字符集中的任意字符

[^a-z0-9]

匹配任意不在括号中的字符集中的字符

\d

匹配数字

\D

匹配非数字,同[^0-9]相同

\w

匹配字母和数字及_

\W

匹配非字母和数字及_

 

字符类:空白字符

元字符/元符号

匹配情况

\0

匹配null字符

\b

匹配空格字符

\f

匹配进纸字符

\n

匹配换行符

\r

匹配回车字符

\t

匹配制表符

\s

匹配空白字符、空格、制表符和换行符

\S

匹配非空白字符

 

字符类:锚字符

元字符/元符号

匹配情况

^

行首匹配

$

行尾匹配

\A

只有匹配字符串开始处

\b

匹配单词边界,词在[]内时无效

\B

匹配非单词边界

\G

匹配当前搜索的开始位置

\Z

匹配字符串结束处或行尾

\z

只匹配字符串结束处

 

字符类:重复字符

元字符/元符号

匹配情况

x?

匹配0个或1个x

x*

匹配0个或任意多个x

x+

匹配至少一个x

(xyz)+

匹配至少一个(xyz)

x{m,n}

匹配最少m个、最多n个x

 

字符类:替代字符

元字符/元符号

匹配情况

this|where|logo

匹配this或where或logo中任意一个

 

字符类:记录字符

元字符/元符号

匹配情况

(string)

用于反向引用的分组

\1或$1

匹配第一个分组中的内容

\2或$2

匹配第二个分组中的内容

\3或$3

匹配第三个分组中的内容

 

 .匹配除换行符以外的任意字符

/*使用点元字符*/
var pattern = /g.gle/; //.匹配一个任意字符
var str = 'g@gle';
alert(pattern.test(str)); //返回true

 *匹配0个一个或者多个前导字符

/*重复匹配*/
var pattern = /g.*gle/; //*匹配0个一个或者多个前导字符
var str = 'g2456gle';
alert(pattern.test(str)); var pattern2 = /gi*gle/; //*匹配0个一个或者多个前导字符
var str2 = 'giigle';
alert(pattern2.test(str2));

 +匹配至少一个前导字符

var pattern2 = /gi+gle/;                    // +匹配至少一个前导字符
var str2 = 'giigle';
alert(pattern2.test(str2));

?匹配0个或一个前导字符

var pattern2 = /gi?gle/;                    //?匹配0个或一个前导字符
var str2 = 'gigle';
alert(pattern2.test(str2));

{}匹配指定数量范围的前导字符

var pattern2 = /gi{2,4}gle/;                    //{}匹配指定数量范围的前导字符
var str2 = 'giiiigle';
alert(pattern2.test(str2));

[a-z]匹配小写字母a到z之间的任意一个字母

var pattern2 = /gi[a-z]gle/;                    //[a-z]匹配小写字母a到z之间的任意一个字母
var str2 = 'gixgle';
alert(pattern2.test(str2));

[0-9]匹配数字0到9之间的任意一个数字

var pattern2 = /gi[0-9]gle/;                    //[0-9]匹配数字0到9之间的任意一个数字
var str2 = 'gi5gle';
alert(pattern2.test(str2));

[a-zA-Z0-9]匹配小写字母或者大写字母a到z之间数字0到9之间的任意一个字母或者数字

var pattern2 = /gi[a-zA-Z0-9]gle/;                    //[a-zA-Z0-9]匹配小写字母或者大写字母a到z之间数字0到9之间的任意一个字母或者数字
var str2 = 'giFgle';
alert(pattern2.test(str2));

[^]非,后导字符不相同或者不在范围就匹配,反向匹配

^如果不是写在元字符里的,是另外一个意思

var pattern2 = /gi[^a-zA-Z0-9]gle/;                    //[^]非,后导字符不相同或者不在范围就匹配,反向匹配
var str2 = 'gi!gle';
alert(pattern2.test(str2));

\d匹配数字等同于[0-9]

var pattern2 = /\digle/;                    //\d匹配数字等同于[0-9]
var str2 = '5555555igle';
alert(pattern2.test(str2));

\D匹配非数字,等同于[^0-9]

var pattern2 = /\Digle/;                    //\D匹配非数字,等同于[^0-9]
var str2 = 'Tigle';
alert(pattern2.test(str2));

\w匹配字母及数字和_下划线

var pattern2 = /\wigle/;                    //\w匹配字母及数字和_下划线
var str2 = '5igle';
alert(pattern2.test(str2));

\W匹配非字母及数字和_下划线

var pattern2 = /\Wigle/;                    //\W匹配非字母及数字和_下划线
var str2 = '!igle';
alert(pattern2.test(str2));

^行匹配

var pattern2 = /^[0-9]igle/;                    //^首行匹配
var str2 = '5igle';
alert(pattern2.test(str2));

$行尾匹配

var pattern2 = /igle$/;                    //$行尾匹配
var str2 = '1121555igle';
alert(pattern2.test(str2));

\s匹配空白字符、空格、制表符和换行符

var pattern2 = /ig\sle/;                    //\s匹配空白字符、空格、制表符和换行符
var str2 = 'ig le';
alert(pattern2.test(str2));

\b匹配是否到达了边际

var pattern2 = /igle\b/;                    //\b匹配是否到达了边际
var str2 = 'igle';
alert(pattern2.test(str2));

|或模式匹配,其中任意一个符合就匹配

var pattern2 = /igle|adc|varjk/;                    //|或模式匹配,其中任意一个符合就匹配
var str2 = 'adc';
alert(pattern2.test(str2));

()分组,组里的可以看做一个整体

var pattern2 = /(igle)45(adc)/;                    //()分组,组里的可以看做一个整体
var str2 = 'igle45adc';
alert(pattern2.test(str2));

 $获取匹配内容里分组部分,后面跟要获取第几个分组如$1

var pattern2 = /(igle)45(adc)/;                    //()分组,组里的可以看做一个整体
var str2 = 'igle45adc'; //执行一次
str2.match(pattern2);
alert(RegExp.$1); //打印匹配内容里分组部分

替换匹配内容里分组部分

var pattern1 = /8(.*)8/;
var str1 = 'This is 8google8';
var result1 = str1.replace(pattern1,'<strong>$1</strong>'); //得到替换的字符串输出
document.write(result1); var pattern2 = /(.*)\s(.*)/;
var str2 = 'google baidu';
var result2 = str2.replace(pattern2, '$2 $1'); //将两个分组的值替换输出
document.write(result2);

 贪婪和惰性

贪  婪

惰  性

+

+?

?

??

*

*?

{n}

{n}?

{n,}

{n,}?

{n,m}

{n,m}?

 关于贪婪和惰性

var pattern = /[a-z]+?/;                        //?号关闭了贪婪匹配,只替换了第一个
var str = 'abcdefjhijklmnopqrstuvwxyz';
var result = str.replace(pattern, 'xxx');
alert(result);

禁止了贪婪,开启的全局

var pattern = /8(.+?)8/g;                        //禁止了贪婪,开启的全局
var str = 'This is 8google8, That is 8google8, There is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>');
document.write(result);

另一种禁止贪婪

var pattern = /8([^8]*)8/g;                    //另一种禁止贪婪
var str = 'This is 8google8, That is 8google8, There is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>');
document.write(result);

使用exec返回数组,也就是可以用exec()方法将匹配到的内容输出

var pattern = /^[a-z]+\s[0-9]{4}$/i;
var str = 'google 2012';
alert(pattern.exec(str)); //返回包含字符串的数组
只匹配字母
var pattern = /^[a-z]+/i;                        //只匹配字母
var str = 'google 2012';
alert(pattern.exec(str)); //返回google

使用分组

var pattern = /^([a-z]+)\s([0-9]{4})$/i;            //使用分组
var str = 'google 2012';
alert(pattern.exec(str)[0]); //google 2012
alert(pattern.exec(str)[1]); //google
alert(pattern.exec(str)[2]); //

捕获性分组和非捕获性分组,就是所有分组都捕获

捕获性分组

var pattern = /(\d+)([a-z])/;                    //捕获性分组
var str = '123abc';
alert(pattern.exec(str)); //返回数组类型的123a,123,a

非捕获性分组

var pattern = /(\d+)(?:[a-z])/;                    //非捕获性分组
var str = '123abc';
alert(pattern.exec(str)); //返回数组123a,123

使用分组嵌套

/*使用分组嵌套*/
var pattern = /(A?(B?(C?)))/; //从外往内获取
var str = 'ABC';
alert(pattern.exec(str)); //返回分组ABC,ABC,BC,C

使用前瞻捕获

/*使用前瞻捕获*/
var pattern = /(goo(?=gle))/; //goo后面必须跟着gle才能捕获
var str = 'google';
alert(pattern.exec(str)); //返回数组goo,goo

使用特殊字符匹配

/*使用特殊字符匹配*/
var pattern = /\.\[\/b\]/; //特殊字符,用\符号转义即可
var str = '.[/b]';
alert(pattern.test(str)); //返回true

使用换行模式

/*使用换行模式*/
var pattern = /^\d+/mg; //启用了换行模式
var str = '1.baidu\n2.google\n3.bing';
var result = str.replace(pattern, '#');
alert(result);
//返回
//#.baidu
//#.google
//#.bing

四.常用的正则

1.检查邮政编码

var pattern = /[1-9][0-9]{5}/;                    //共6位数字,第一位不能为0
var str = '224000';
alert(pattern.test(str));

2.检查文件压缩包和文件格式

var pattern = /^[\w]+\.(zip|rar|gz)&/;                //\w表示所有数字和字母加下划线
var str = '123.zip'; //\.表示匹配.,后面是一个选择
alert(pattern.test(str));

3.删除多余空格

var pattern = /\s/g;                            //g必须全局,才能全部匹配
var str = '111 222 333';
var result = str.replace(pattern,''); //把空格匹配成无空格
alert(result);

4.删除首尾空格

var pattern = /^\s+/;                            //强制首
var str = ' goo gle ';
var result = str.replace(pattern, '');
pattern = /\s+$/; //强制尾
result = result.replace(pattern, '');
alert('|' + result + '|');
使用了非贪婪捕获
var pattern = /^\s*(.+?)\s*$/;                    //使用了非贪婪捕获
var str = ' google ';
alert('|' + pattern.exec(str)[1] + '|');
使用了分组获取
var pattern = /^\s*(.+?)\s*$/;
var str = ' google ';
alert('|' + str.replace(pattern, '$1') + '|'); //使用了分组获取

5.简单的电子邮件验证


var pattern = /^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/;
var str = 'yc60.com@gmail.com';
alert(pattern.test(str));

var pattern = /^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/;
var str = 'yc60.com@gmail.com';
alert(pattern.test(str));

PS:以上是简单电子邮件验证,复杂的要比这个复杂很多,大家可以搜一下。

 
 

第一百零五节,JavaScript正则表达式的更多相关文章

  1. 第四百零五节,centos7下搭建sentry错误日志服务器,接收python以及Django错误,

    第四百零五节,centos7下搭建sentry错误日志服务器,接收python以及Django错误, 注意:版本,不然会报错 Docker >=1.11Compose >1.6.0 通过d ...

  2. “全栈2019”Java第一百零五章:匿名内部类覆盖作用域成员详解

    难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...

  3. 第一百零九节,JavaScript面向对象与原型

    JavaScript面向对象与原型 学习要点: 1.学习条件 2.创建对象 3.原型 4.继承 ECMAScript有两种开发模式:1.函数式(过程化),2.面向对象(OOP).面向对象的语言有一个标 ...

  4. 第一百零七节,JavaScript基本包装类型,数据类型的方法

    JavaScript基本包装类型,数据类型的方法 学习要点: 1.基本包装类型概述 2.Boolean类型 3.Number类型 4.String类型 为了便于操作基本类型值,ECMAScript提供 ...

  5. 第一百零一节,JavaScript流程控制语句

    JavaScript流程控制语句 学习要点: 1.语句的定义 2.if 语句 3.switch语句 4.do...while语句 5.while语句 6.for语句 7.for...in语句 8.br ...

  6. 第一百零六节,JavaScript变量作用域及内存

    JavaScript变量作用域及内存 学习要点: 1.变量及作用域 2.内存问题 JavaScript的变量与其他语言的变量有很大区别.JavaScript变量是松散型的(不强制类型)本质,决定了它只 ...

  7. 第一百零二节,JavaScript函数

    JavaScript函数 学习要点: 1.函数声明 2.return返回值 3.arguments对象 函数是定义一次但却可以调用或执行任意多次的一段JS代码.函数有时会有参数,即函数被调用时指定了值 ...

  8. 第一百零四节,JavaScript时间与日期

    JavaScript时间与日期 学习要点: 1.Date类型 2.通用的方法 3.格式化方法 4.组件方法 ECMAScript提供了Date类型来处理时间和日期.Date类型内置一系列获取和设置日期 ...

  9. 第一百零三节,JavaScript对象和数组

    JavaScript对象和数组 学习要点: 1.Object类型 2.Array类型 3.对象中的方法 什么是对象,其实就是一种类型,即引用类型.而对象的值就是引用类型的实例.在ECMAScript中 ...

随机推荐

  1. 向python3进发

    在Python2.x中,交互输入有input和raw_input两种方法 input-----------tmd是个坑,就别用 raw_input------把输入无论是Int或str都当做是str处 ...

  2. Maven之(三)Maven插件

    Maven本质上是一个插件框架,它的核心并不执行任何具体的构建任务,所有这些任务都交给插件来完成,像编译是通过maven-compile-plugin实现的.测试是通过maven-surefire-p ...

  3. readelf -s 命令‘symbol’名字显示不全

    GCC编译出来的object(目标文件)getPon.o,在链接时(ld)报了一个错误说找不到一个函数(undefined reference to identifier devCtl_getEthe ...

  4. SUSE linux升级perl及openssl

    一.perl安装: 1.下载并解压软件:tar zxvf perl-5.24.0.tar.gz 2.运行./configure.gnu -help查看帮助,运行./configure.gnu -des ...

  5. log4j基本使用方法

    通过配置文件可知,我们需要配置3个方面的内容: 1.根目录(级别和目的地) 2.目的地(控制台和文件等) 3.输出样式 Log4j由三个重要的组件构成: 1.日志信息的优先级 日志信息的优先级从高到低 ...

  6. 【Time系列四】查询各月份的日历

    荒废了两个星期没学java了,今天一心想突破"日历查询"这个小程序.先用比较简单的python实现下. 无奈天资愚钝,想了一个上午.最后卡在了日期排列的问题上,只好去参考下别人的代 ...

  7. ajax客户端请求与服务端响应浅谈

    AJAX,即Asynchronous Javascript And XML,AJAX本质是在HTTP协议的基础上以异步的方式与服务器进行通信. 所谓的异步,是指某段程序执行不会阻塞其他程序执行,其表现 ...

  8. android之控件与布局

    基本控件:TextViewButtonEditTextImageViewAlertDialog.BubliderProgressDialog 四种基本布局的特殊属性: LinerLayout andr ...

  9. Attribute的理解和认识

    1什么是Attribute? 在网上看到这样一段定义 MADN的定义为:公共语言运行时允许添加类似关键字的描述声明,叫做attributes, 它对程序中的元素进行标注,如类型.字段.方法和属性等.A ...

  10. Java 彩色图转灰度图

    1. 方法1 BufferedImage grayImage = new BufferedImage(width, height, colorImage.TYPE_BYTE_GRAY); Graphi ...