http://www.cnblogs.com/chenmeng0818/p/6370819.html

js中的正则表达式入门

什么是正则表达式呢？

正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个字符串是否含有某种子串、将匹配的子串做替换或者从某个字符串中取出符合某个条件的子串等。

说白了正则表达式就是处理字符串的,我们可以用它来处理一些复杂的字符串。

为什么要学习正则表达式

我们直接用一个例子来说明

//找出这个字符串中的所有数字

var str = 'abc123de45fgh6789qqq111';

//方法1

     function findNum(str) {

        var tmp = '',

            arr = [];

        for (var i = 0; i < str.length; i++) {

            var cur = str[i];

            if (!isNaN(cur)) {

                tmp += cur;

            } else {

                if (tmp) {

                    arr.push(tmp);

                    tmp = '';

                }

            }

        }

        if (tmp) {

            arr.push(tmp)

        }

        return arr;

    }

    console.log(findNum(str))

    //["123", "45", "6789", "111"]

//方法2 使用正则表达式

    var reg = /\d+/g;

    console.log(str.match(reg))

   // ["123", "45", "6789", "111"]

通过比较2种方法我们明显看出在对字符串进行处理时，使用正则表达式会简单许多，所以虽然正则表达式看起来像是火星文一样的一堆乱码的东西，但我们还是有必要去学习它的。

正则表达式的创建方式

字面量创建方式
实例创建方式

    var reg = /pattern/flags

    // 字面量创建方式

    var reg = new RegExp(pattern,flags);

    //实例创建方式

    pattern:正则表达式

    flags:标识(修饰符)

    标识主要包括：

    1. i 忽略大小写匹配

    2. m 多行匹配，即在到达一行文本末尾时还会继续寻常下一行中是否与正则匹配的项

    3. g 全局匹配 模式应用于所有字符串，而非在找到第一个匹配项时停止

字面量创建方式和构造函数创建方式的区别

字面量创建方式不能进行字符串拼接，实例创建方式可以

var regParam = 'cm';

var reg1 = new RegExp(regParam+'1');

var reg2 = /regParam/;

console.log(reg1);  //   /cm1/

console.log(reg2);  //  /regParam/

字面量创建方式特殊含义的字符不需要转义，实例创建方式需要转义

var reg1 = new RegExp('\d');  //    /d/

var reg2 = new RegExp('\\d')  //   /\d/

var reg3 = /\d/;              //  /\d/

元字符

代表特殊含义的元字符

\d : 0-9之间的任意一个数字  \d只占一个位置

\w : 数字，字母 ，下划线 0-9 a-z A-Z _

\s : 空格或者空白等

\D : 除了\d

\W : 除了\w

\S : 除了\s

 . : 除了\n之外的任意一个字符

 \ : 转义字符

 | : 或者

() : 分组

\n : 匹配换行符

\b : 匹配边界 字符串的开头和结尾 空格的两边都是边界 => 不占用字符串位数

 ^ : 限定开始位置 => 本身不占位置

 $ : 限定结束位置 => 本身不占位置

[a-z] : 任意字母 []中的表示任意一个都可以

[^a-z] : 非字母 []中^代表除了

[abc] : abc三个字母中的任何一个 [^abc]除了这三个字母中的任何一个字符

代表次数的量词元字符

* : 0到多个

+ : 1到多个

? : 0次或1次 可有可无

{n} : 正好n次；

{n,} : n到多次

{n,m} : n次到m次

量词出现在元字符后面如\d+，限定出现在前面的元字符的次数

var str = '1223334444';

var reg = /\d{2}/g;

var res = str.match(reg);

console.log(res)  //["12", "23", "33", "44", "44"]

var str ='  我是空格君  ';

var reg = /^\s+|\s+$/g; //匹配开头结尾空格

var res = str.replace(reg,'');

console.log('('+res+')')  //(我是空格君)

正则中的()和[]和重复子项 //拿出来单独说一下

一般[]中的字符没有特殊含义如+就表示+
但是像\w这样的还是有特殊含义的

var str1 = 'abc';

var str2 = 'dbc';

var str3 = '.bc';

var reg = /[ab.]bc/; //此时的.就表示.

reg.test(str1)  //true

reg.test(str2)  //false

reg.test(str3)  //true

[]中，不会出现两位数

[12]表示1或者2 不过[0-9]这样的表示0到9 [a-z]表示a到z

例如:匹配从18到65年龄段所有的人

var reg = /[18-65]/; // 这样写对么

reg.test('50')

 //Uncaught SyntaxError: Invalid regular expression: /[18-65]/: Range out of order in character class

//聪明的你想可能是8-6这里不对，于是改成[16-85]似乎可以匹配16到85的年龄段的，但实际上发现这也是不靠谱的

实际上我们匹配这个18-65年龄段的正则我们要拆开来匹配

我们拆成3部分来匹配 18-19  20-59 60-65

reg = /(18|19)|([2-5]\d)|(6[0-5])/;

()的提高优先级功能:凡是有|出现的时候，我们一定要注意是否有必要加上()来提高优先级；
()的分组重复子项 (两个放到一起说)

分组：

只要正则中出现了小括号那么就会形成一份分组

只要有分组，exec(match)和replace中的结果就会发生改变(后边的正则方法中再说)

分组的引用(重复子项) :

只要在正则中出现了括号就会形成一个分组，我们可以通过\n (n是数字代表的是第几个分组)来引用这个分组，第一个小分组我们可以用\1来表示

例如：求出这个字符串'abAAbcBCCccdaACBDDabcccddddaab'中出现最多的字母,并求出出现多少次(忽略大小写)。

var str = 'abbbbAAbcBCCccdaACBDDabcccddddaab';

    str = str.toLowerCase().split('').sort(function(a,b){return a.localeCompare(b)}).join('');

    var reg = /(\w)\1+/ig;

    var maxStr = '';

    var maxLen = 0;

    str.replace(reg,function($0,$1){

        var regLen = $0.length;

        if(regLen>maxLen){

            maxLen = regLen;

            maxStr = $1;

        }else if(maxLen == regLen){

            maxStr += $1;

        }

    })

    console.log(`出现最多的字母是${maxStr},共出现了${maxLen}次`)

当我们加()只是为了提高优先级而不想捕获小分组时，可以在()中加?:来取消分组的捕获

var str = 'aaabbb';

var reg = /(a+)(?:b+)/;

var res =reg.exec(str);

console.log(res)

//["aaabbb", "aaa", index: 0, input: "aaabbb"]

//只捕获第一个小分组的内容

正则运算符的优先级

正则表达式从左到右进行计算，并遵循优先级顺序，这与算术表达式非常类似。
相同优先级的会从左到右进行运算，不同优先级的运算先高后低。

下面是常见的运算符的优先级排列

依次从最高到最低说明各种正则表达式运算符的优先级顺序：

\ : 转义符

(), (?:), (?=), []  => 圆括号和方括号

*, +, ?, {n}, {n,}, {n,m}   => 量词限定符

^, $, \任何元字符、任何字符

|       => 替换，"或"操作

字符具有高于替换运算符的优先级，一般用 | 的时候，为了提高 | 的优先级，我们常用()来提高优先级

如： 匹配 food或者foot的时候 reg = /foo(t|d)/ 这样来匹配

正则的特性

贪婪性

所谓的贪婪性就是正则在捕获时，每一次会尽可能多的去捕获符合条件的内容。
如果我们想尽可能的少的去捕获符合条件的字符串的话，可以在量词元字符后加?
懒惰性

懒惰性则是正则在成功捕获一次后不管后边的字符串有没有符合条件的都不再捕获。
如果想捕获目标中所有符合条件的字符串的话，我们可以用标识符g来标明是全局捕获

var str = '123aaa456';

var reg = /\d+/;  //只捕获一次,一次尽可能多的捕获

var res = str.match(reg)

console.log(res)

// ["123", index: 0, input: "123aaa456"]

reg = /\d+?/g; //解决贪婪性、懒惰性

res = str.match(reg)

console.log(res)

// ["1", "2", "3", "4", "5", "6"]

和正则相关的一些方法

这里我们只介绍test、exec、match和replace这四个方法

reg.test(str) 用来验证字符串是否符合正则符合返回true 否则返回false

var str = 'abc';

var reg = /\w+/;

console.log(reg.test(str));  //true

reg.exec() 用来捕获符合规则的字符串

var str = 'abc123cba456aaa789';

var reg = /\d+/;

console.log(reg.exec(str))

//  ["123", index: 3, input: "abc123cba456aaa789"];

console.log(reg.lastIndex)

// lastIndex : 0 

reg.exec捕获的数组中

// [0:"123",index:3,input:"abc123cba456aaa789"]

0:"123" 表示我们捕获到的字符串

index:3 表示捕获开始位置的索引

input 表示原有的字符串

当我们用exec进行捕获时，如果正则没有加'g'标识符，则exec捕获的每次都是同一个，当正则中有'g'标识符时捕获的结果就不一样了,我们还是来看刚刚的例子

var str = 'abc123cba456aaa789';

var reg = /\d+/g;  //此时加了标识符g

console.log(reg.lastIndex)

// lastIndex : 0 

console.log(reg.exec(str))

//  ["123", index: 3, input: "abc123cba456aaa789"]

console.log(reg.lastIndex)

// lastIndex : 6

console.log(reg.exec(str))

// ["456", index: 9, input: "abc123cba456aaa789"]

console.log(reg.lastIndex)

// lastIndex : 12

console.log(reg.exec(str))

// ["789", index: 15, input: "abc123cba456aaa789"]

console.log(reg.lastIndex)

// lastIndex : 18

console.log(reg.exec(str))

// null

console.log(reg.lastIndex)

// lastIndex : 0

每次调用exec方法时,捕获到的字符串都不相同

lastIndex ：这个属性记录的就是下一次捕获从哪个索引开始。

当未开始捕获时，这个值为0。

如果当前次捕获结果为null。那么lastIndex的值会被修改为0.下次从头开始捕获。

而且这个lastIndex属性还支持人为赋值。

exec的捕获还受分组()的影响

var str = '2017-01-05';

var reg = /-(\d+)/g

// ["-01", "01", index: 4, input: "2017-01-05"]

"-01" : 正则捕获到的内容

"01"  : 捕获到的字符串中的小分组中的内容

str.match(reg) 如果匹配成功，就返回匹配成功的数组，如果匹配不成功，就返回null

//match和exec的用法差不多

var str = 'abc123cba456aaa789';

var reg = /\d+/;

console.log(reg.exec(str));

//["123", index: 3, input: "abc123cba456aaa789"]

console.log(str.match(reg));

//["123", index: 3, input: "abc123cba456aaa789"]

上边两个方法console的结果有什么不同呢？二个字符串是一样滴。
当我们进行全局匹配时，二者的不同就会显现出来了.

var str = 'abc123cba456aaa789';

var reg = /\d+/g;

console.log(reg.exec(str));

// ["123", index: 3, input: "abc123cba456aaa789"]

console.log(str.match(reg));

// ["123", "456", "789"]

当全局匹配时，match方法会一次性把符合匹配条件的字符串全部捕获到数组中,
如果想用exec来达到同样的效果需要执行多次exec方法。

我们可以尝试着用exec来简单模拟下match方法的实现。

 String.prototype.myMatch = function (reg) {

    var arr = [];

    var res = reg.exec(this);

    if (reg.global) {

        while (res) {

            arr.push(res[0]);

            res = reg.exec(this)

        }

    }else{

        arr.push(res[0]);

    }

    return arr;

}

var str = 'abc123cba456aaa789';

var reg = /\d+/;

console.log(str.myMatch(reg))

// ["123"]

var str = 'abc123cba456aaa789';

var reg = /\d+/g;

console.log(str.myMatch(reg))

// ["123", "456", "789"]

此外，match和exec都可以受到分组()的影响，不过match只在没有标识符g的情况下才显示小分组的内容，如果有全局g，则match会一次性全部捕获放到数组中

var str = 'abc';

var reg = /(a)(b)(c)/;

console.log( str.match(reg) );

// ["abc", "a", "b", "c", index: 0, input: "abc"]

console.log( reg.exec(str) );

// ["abc", "a", "b", "c", index: 0, input: "abc"]

当有全局g的情况下

var str = 'abc';

var reg = /(a)(b)(c)/g;

console.log( str.match(reg) );

// ["abc"]

console.log( reg.exec(str) );

// ["abc", "a", "b", "c", index: 0, input: "abc"]

str.replace() 这个方法大家肯定不陌生，现在我们要说的就是和这个方法和正则相关的东西了。

正则去匹配字符串，匹配成功的字符去替换成新的字符串

写法：str.replace(reg,newStr);

var str = 'a111bc222de';

var res = str.replace(/\d/g,'Q')

console.log(res)

// "aQQQbcQQQde"

replace的第二个参数也可以是一个函数

str.replace(reg,fn);

var str = '2017-01-06';

str = str.replace(/-\d+/g,function(){

    console.log(arguments)

})

控制台打印结果：

["-01", 4, "2017-01-06"]

["-06", 7, "2017-01-06"]

"2017undefinedundefined"

从打印结果我们发现每一次输出的值似乎跟exec捕获时很相似，既然与exec似乎很相似，那么似乎也可以打印出小分组中的内容喽 

var str = '2017-01-06';

str = str.replace(/-(\d+)/g,function(){

    console.log(arguments)

})

["-01", "01", 4, "2017-01-06"]

["-06", "06", 7, "2017-01-06"]

"2017undefinedundefined"

从结果看来我们的猜测没问题。

此外，我们需要注意的是，如果我们需要替换replace中正则找到的字符串，函数中需要一个返回值去替换正则捕获的内容。

通过replace方法获取url中的参数的方法

(function(pro){

    function queryString(){

        var obj = {},

            reg = /([^?&#+]+)=([^?&#+]+)/g;

        this.replace(reg,function($0,$1,$2){

            obj[$1] = $2;

        })

        return obj;

    }

    pro.queryString = queryString;

}(String.prototype));

// 例如 url为 https://www.baidu.com?a=1&b=2

// window.location.href.queryString();

// {a:1,b:2}

零宽断言

用于查找在某些内容(但并不包括这些内容)之前或之后的东西，如\b,^,$那样用于指定一个位置，这个位置应该满足一定的条件(即断言)，因此它们也被称为零宽断言。

在使用正则表达式时，捕获的内容前后必须是特定的内容，而我们又不想捕获这些特定内容的时候，零宽断言就可以派上用场了。

零宽度正预测先行断言 (?=exp)
零宽度负预测先行断言 (?!exp)
零宽度正回顾后发断言 (?<=exp)
零宽度负回顾后发断言 (?<!exp)

这四胞胎看着名字好长，给人一种好复杂好难的感觉，我们还是挨个来看看它们究竟是干什么的吧。

(?=exp) 这个简单理解就是说字符出现的位置的右边必须匹配到exp这个表达式。

var str = "i'm singing and dancing";

var reg = /\b(\w+(?=ing\b))/g

var res = str.match(reg);

console.log(res)

// ["sing", "danc"]

注意一点，这里说到的是位置，不是字符。

var str = 'abc';

var reg = /a(?=b)c/;

console.log(res.test(str));  // false

// 这个看起来似乎是正确的，实际上结果是false

reg中a(?=b)匹配字符串'abc' 字符串a的右边是b这个匹配没问题,接下来reg中a(?=b)后边的c匹配字符串时是从字符串'abc'中a的后边b的前边的这个位置开始匹配的，

这个相当于/ac/匹配'abc',显然结果是false了

(?!exp) 这个就是说字符出现的位置的右边不能是exp这个表达式。

var str = 'nodejs';

var reg = /node(?!js)/;

console.log(reg.test(str)) // false

(?<=exp) 这个就是说字符出现的位置的前边是exp这个表达式。

var str = '￥998$888';

var reg = /(?<=\$)\d+/;

console.log(reg.exec(str)) //888

(?<!exp) 这个就是说字符出现的位置的前边不能是exp这个表达式。

var str = '￥998$888';

var reg = /(?<!\$)\d+/;

console.log(reg.exec(str)) //998

最后，来一张思维导图

图片如果放大也看不清的话下载地址
如有错误欢迎指正！

http://www.cnblogs.com/chenmeng0818/p/6370819.html的更多相关文章

js中正则表达式使用
js中使用正则表达式,除了了解正则表达式基本的匹配规则外.还需要了解下面的基本的知识: python,js,groovy这些脚本语言都有在线调试的网站,可以在线测试是否有语法错误,用起来也很方便. v ...
js正則表達式
正則表達式實例化的兩種方式: 字符型 var a=// 對象型var a=new RegExp(,) 修飾符: i:忽略大小寫 g:全局搜索 m:多行搜索元字符: \轉義字符 \w:字符,數字,下劃 ...
js正则表达式讲的最好的
https://www.cnblogs.com/chenmeng0818/p/6370819.html
js正则表达式：学习网址和部分正则验证
https://www.cnblogs.com/chenmeng0818/p/6370819.html ① 不以0开头的多个数字,但可以是单个0,必须为数字,位数不允许超过10个. var reg=/ ...
JS中正则表达式
正则表达式用于对字符串模式匹配及检索替换,是对字符串执行模式匹配的强大工具.简单来说正则表达式就是处理字符串的,我们可以用它来处理一些复杂的字符串. 1.创建方式 pattern(模式):描述了表达式 ...
js中的一些隐式转换和总结
js中的不同的数据类型之间的比较转换规则如下: 1. 对象和布尔值比较对象和布尔值进行比较时,对象先转换为字符串,然后再转换为数字,布尔值直接转换为数字 [] == true; //false [] ...
吐血大奉献，打造cnblogs最新最火辣的css3模板（IE9以下请勿入内） -- 第一版
一直自己都想给自己的博客打造一个独一无二的皮肤,但是一直没有强劲的动力去完成这件事情.后来凭借着工作上面的需求(涉及到css3),就把自己的博客当成一个最好的试验场地.从而产生了你现在所看到的这个模板 ...
已经重写，源码和文章请跳转http://www.cnblogs.com/ymnets/p/5621706.html
文章由于写得比较仓促已经重写,源码和文章请跳转 http://www.cnblogs.com/ymnets/p/5621706.html 系列目录前言: 导入导出实在多例子,很多成熟的组建都分装了 ...
总结Cnblogs支持的常用Markdown语法
一.什么是Markdown Markdown是一种可以使用普通文本编辑器编写的标记语言, Markdown的语法简洁明了.学习容易,而且功能比纯文本更强,因此有很多人用它写博客.世界上最流行的博客平台 ...

随机推荐

MySql:Table 'database.TABLE_ONE' doesn't exist
1. 问题描述由于最近使用本地的MySQL奔溃了,在修改管理员密码时,不慎修改错误,导致无法重新写会,甚至按照MySQL官网手册都无法修改正确,遂放弃修改root密码,直接将一个未有数据的纯净版My ...
自己开发能在asp.net项目正常使用的定时器WebTimer，让定时器听话起来
简述: iis是一个很不错的服务器,有很多很好用的特性来支持网站运行,但有时候这些特性却会影响到我们开发者的一些操作.比如我们需要定时运行做一些操作,但由于iis的利用应用程序池来管理这种方式会让网站 ...
深入理解 Array.prototype.map()
深入理解 Array.prototype.map() map() 方法创建一个新数组,其结果是该数组中的每个元素都调用一个提供的函数后返回的结果. 语法 let new_array = arr.map ...
潭州课堂25班：Ph201805201 python 操作数据库第五课 (课堂笔记)
一用 python 操作 mysql 1,导入 pymysql 2,检查配置文件, 3,端口转发如果 python 在本机,数据库在远程,或虚拟机则需要 4用 python 连接 # -*- co ...
[Astar2008]Black-Whilte-Tree
Description: 你拥有一棵有 N 个结点白色的树--所有节点都是白色的. 接下来,你需要处理 C 条指令: 1.修改指令:改变一个给定结点的颜色(白变黑,黑变白); 2.查询指令:询问从结点 ...
BZOJ1330 : Editing a Book
注意到答案不超过$5$,因此可以考虑BFS求出距离起始态或者终止态不超过$2$的所有状态. 设它们到起始态.终止态的距离分别为$f[S],g[S]$,则$ans=\min(5,f[S]+g[S])$. ...
java三大特性--继承
定义: 继承就是子类继承父类的特征和行为,使得子类具有父类的各种属性和方法,使得子类具有父类相同的行为. 继承的好处: 有效实现代码复用,避免重复代码的出现. 让类与类之间产生了关系,是多态的前提. ...
菜鸟nginx源代码剖析数据结构篇（八）缓冲区链表ngx_chain_t
菜鸟nginx源代码剖析数据结构篇(八) 缓冲区链表 ngx_chain_t Author:Echo Chen(陈斌) Email:chenb19870707@gmail.com Blog:Blog. ...
EasyUI学习总结(二)——easyloader分析与使用(转载)
本文转载自:http://www.cnblogs.com/haogj/archive/2013/04/22/3036685.html 使用脚本库总要加载一大堆的样式表和脚本文件,在easyui 中,除 ...
PLSQL连接Oracle 数据库配置详解
1. 下载instantclient-basic-win32-11.2.0.1.0 (oracle官网下载地址:http://www.oracle.com/technetwork/topics/win ...