慕课笔记-JavaScript正则表达式笔记

概述

RegExp对象

两种方法构造RegExp对象

  • 字面量 var reg = /\bis\b /g
  • 构造函数 var reg = new RegExp('\\bis\\b', 'g')

:在Linux中反斜线本身就是特殊字符,所以需要再次转义,故写成\\bis\\b的格式

修饰符

  • g: global 全文搜索,不添加的话搜索到第一个匹配停止,添加的话匹配全局
  • i: ignore case 忽略大小写,默认大小写敏感
  • m: multipl lines 多行搜索

示例

  1. 'He is a boy. Is he?'.replace(/\bis\b/g, '0') // expected: "He 0 a boy. Is he?"
  2. 'He is a boy. Is he?'.replace(/\bis\b/i, '0') // expected: "He 0 a boy. 0 he?"

元字符

  • 正则表达式有两种基本字符串类型组成

    • 原义文本字符
    • 元字符
  • 元字符是有特殊含义的非字母字符
  • * + ? $ ^ . | \ ( ) { } [ }

元字符

字符 含义
\t 水平制表符
\v 垂直制表符
\n 换行符
\r 回车符
\0 空字符
\f 换页符
\cX 与X对应的控制字符(Ctrl+X)

字符类

  • 一般情况下正则表达式一个字符对应字符串的一个字符

  • 字符类

    • 我们可以使用元字符[]构建一个简单的类
    • 所谓类是指符合某些特性的对象,一个泛指,而不是指某个字符
    • 表达式[abc]把字符串a或b或c归为一类,表达式可以匹配这类的字符
  • 字符类取反

    • 使用元字符^创建反向类/负向类
    • 反向类的意思是不属于某类的内容
    • 表达式[^abc]表示不是字符a或b或c的内容
  • 示例

  1. 'a1b2c3d4'.replace(/[abc]/g, 'X'); //output: X1X2X3d4
  2. 'a1b2c3d4'.replace(/[^abc]/g, 'X'); //output: aXbXcXXX

范围类

  • 正则表达式提供了范围类
  • 可以使用[a-z]表示从a到z的任意字符
  • 这是个闭区间,包括a和z本身
  • []中是可以连写的,例如[a-zA-Z]表示从a到z大小写匹配

示例:

  1. 'a1b2c3d4'.replace(/[a-z]/g, 'Q'); //output: Q1Q2Q3Q4
  2. '2016-09-12'.replace(/[0-9-]/g, 'A'); //output: AAAAAAAAAA

预定义类

预定义字符

字符 等价类 含义
. [^\r\n] 除了回车符和换行符之外的所有字符
\d [0-9] 数字字符
\D [^0-9] 非数字字符
\s [\t\n\x0B\f\r] 空白字符
\S [^\t\n\x0B\f\r] 非空白字符
\w [a-zA-Z_0-9] 查询字符串(字母,数字下划线)
\W [^a-zA-Z_0-9] 非单词字符

边界

字符 含义
^ 以xxx开头
$ 以xxx结束
\b 单词边界
\B 非单词边界

示例

  1. // for \b \B
  2. 'This is a boy'.replace(/is/g, '0'); //output: Th0 0 a boy
  3. 'This is a boy'.replace(/\bis/g, '0'); //output: This 0 a boy
  4. 'This is a boy'.replace(/\Bis/g, '0'); //output: Th0 is a boy
  1. // for ^
  2. '@123@abc@'.replace(/@./g, 'Q'); //output: Q23Qbc@
  3. '@123@abc@'.replace(/^@./g, 'Q'); //output: Q23@abc@
  4. '@123@abc@'.replace(/.@/g, 'Q'); //output: @23QabcQ
  5. '@123@abc@'.replace(/.@$/g, 'Q'); //output: @123@abQ
  1. // for multip line
  2. mulstr="@123\n@456\n@789";
  3. mulstr.replace(/^@\d/g, 'X'); //output:"X23\n@456\n@789"
  4. mulstr.replace(/^@\d/gm, 'X'); //output:"X23\nX456\nX789"

量词

  • 适用场景:希望匹配连续出现多次的内容的字符串
字符 含义
? 出现零次或一次(最多出现一次)
+ 出现一次或多次(至少出现一次)
* 出现零次或多次(任意次)
{n} 出现n次
{n,m} 出现n到m次
{n,} 至少出现n次
  1. \d{20} //匹配连续出现20次的数字
  2. \d{20}\w\d?\w+\d*\d{3}\w{3,5}\d{3,}

贪婪模式

  • 正则表达式会尽可能多的匹配,直到匹配失败
  • 非贪婪模式即让正则表达式尽可能少的匹配,即一旦匹配成功就不再匹配了。做法很简单,在量词后面加上 ? 即可。

分组

  • 问题:匹配字符串byron连续出现3次的场景

使用量词:byron{3}并不能完成目标。因为它只会对紧挨着的n匹配三次,此时,需要使用分组。分组很简单,直接加上小括号即可。即(byron){3}

示例:

  1. 'a1b2c3d4'.replace(/[a-z]\d{3}/g, 'X') //a1b2c3d4
  2. 'a1b2c3d4'.replace(/([a-z]\d){3}/g, 'X') //Xd4

或(使用竖线表示)

  1. 'ByronCaseper'.replace(/Byron|Caseper/g, 'X') //XX
  2. 'ByronsperByrCasper'.replace(/Byr(on|Ca)sper/g, 'X') //XX

反向引用

  • 问题:将2015-12-25 => 12/25/2015
  • 实现方法是使用反向引用,将分组内容使用$进行捕获,然后再用$进行表示。

示例

  1. '2015-12-25'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$1/$2/$3')
  2. // 12/25/2015

忽略分组

  • 不想捕获某些分组,只需要在分组内加上?:就可以了。例如
  1. (?:Bryon).(ok)

前瞻

  • 正则表达式从文本头部向尾部开始解析,文本尾部方向,称之为前
  • 前瞻就是再正则表达式匹配到规则的时候,向前检测是否符合断言,后顾/后瞻方向相反

注:JavaScript不支持后顾,故不再演示

名称 正则 含义
正向前瞻 exp(?=asset)
负向前瞻 exp(?!asset)
正向后顾 exp(?<=asset) JS不支持
负向后顾 exp(?<!asset) JS不支持

示例:

  1. 'a2*34v8'.replace(/\w(?=\d)/g, 'X')
  2. //"X2*X4X8"
  3. 'a2*34v8'.replace(/\w(?!\d)/g, 'X')
  4. //"aX*3XvX"

对象属性

  • global:是否全文搜索,默认false
  • ignore case:是否大小写敏感,默认false
  • multiline:多行搜索,默认false
  • lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置
  • source:正则表达式的文本字符串

test和exec方法

  • RegExp.prototype.test(str)

    • 用于测试字符串参数中是否存在匹配正则表达式模式的字符串
    • 如果存在则返回true,否则返回false
  • RegExp.prototype.exec(str)
    • 使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配的结果
    • 过没有匹配的文本则返回null,否则返回一个结果数组
      • index声明匹配文本的第一个字符的位置
      • input存放被检索的字符串

:在test方法中,如果匹配全局后有多个结果时,lastindex保存上次执行结果,并向下迭代,直至没有结果时返回false,则重新回到首位。此时再次执行,则再次循环上面的步骤。

示例:

  1. var reg1 = /\w/;
  2. var reg1 = /\w/g;
  3. while(reg2.test('ab')) {
  4. console.log(reg2.lastIndex);
  5. }
  6. /*
  7. 1
  8. 2
  9. */

非全局调用

  • 调用非全局的RegExp对象的exec()方法时,返回数组
  • 第一个元素是与正则表达式相匹配的文本
  • 第二个元素是与RegExpObject的第一个子表达式相匹配的文不(如果有的话)
  • 第三个元素是与RegExp对的第二个子表达式想匹配的文本(如果有的话),以此类推
  1. var reg3 = /\d(\w)(\w)\d/;
  2. var reg4 = /\d(\w)(\w)\d/g;
  3. var ts = '$1az2bb3cy4dd5ee';
  4. var ret = reg3.exec(ts);
  5. console.log(reg3.lastIndex+'\t'+ret.index+'\t'+ret.toString());
  6. //"0 1 1az2,a,z"
  7. console.log(reg3.lastIndex+'\t'+ret.index+'\t'+ret.toString());
  8. //"0 1 1az2,a,z"
  9. while(ret = reg4.exec(ts)) {
  10. console.log(reg4.lastIndex + '\t'+ret.index+'\t'+ret.toString());
  11. }
  12. /*
  13. "5 1 1az2,a,z"
  14. "11 7 3cy4,c,y"
  15. */

可以使用正则的函数

String.prototyp.search(reg)

  • search()方法用于检索字符串中指定的字符串,或检索与正则表达式相匹配的子字符串
  • 方法返回一个匹配结果index,查不到返回-1
  • search()方法不执行全局匹配,它将忽略标志g,并且总是从字符串开始进行检索
  1. 'a1b2c3d4'.search(/1/g); //1

String.prototype.match(reg)

  • match()方法将检索字符串,以找到一个或多个与RegExp匹配的文本
  • RegExp是否具有标志g对结果影响很大
  • 非全局调用
    • 如果RegExp没有标志g,那么match()方法就只能执行一次匹配
    • 如果没有找到任何匹配,则返回null
    • 否则返回一个数组,其中存放了了与它找到的匹配文本有关的信息
    • 返回数组的第一个元素存在的是匹配文本,而其他元素存放的是与正则表达式的子表达式匹配的文本
    • 处理常规的数组元素之外,返回的数组还含有两个对数属性
      • index声明匹配文本的其实字符串在字符串的位置
      • input声明对stringObject的引用
  • 全局调用
    • 如果RegExp具有标志g,则match方法执行全局检索,找到字符串的所有匹配子字符串

      • 没有找到匹配,返回null
      • 如果找到一个或多个匹配子串,则返回以数组
    • 数组元素中存放的是字符串所有的匹配子串,而且也没有index属性或则input属性

String.prototype.split(reg)

  • 使用split方法把字符串分割为字符数组
  1. 'a,b,c,d'.split(',');//['a','b','c','d']
  • 在一些复杂分割情况下我们可以使用正则表达式解决
  1. 'a1b2c3d4'.split(/\d/);//['a','b','c','d']

String.prototype.replace

  • String.prototype.replace(str, replaceStr)

    • str 被替换目标(字符串)
    • replaceStr 替换的字符串
  • String.prototype.replace(reg, replaceStr)
    • str 被替换目标(正则表达式)
    • replaceStr 替换的字符串
  • String.prototype.replace(reg, function)
    • function有四个参数

      • 匹配字符串
      • 正则表达式分组ner,没有分组则没有该参数
      • 匹配项在字符串中的index
      • 原字符创

慕课笔记-JavaScript正则表达式的更多相关文章

  1. JavaScript正则表达式学习笔记(二) - 打怪升级

    本文接上篇,基础部分相对薄弱的同学请移步<JavaScript正则表达式学习笔记(一) - 理论基础>.上文介绍了8种JavaScript正则表达式的属性,本文还会追加介绍几种JavaSc ...

  2. javascript正则表达式 - 学习笔记

    JavaScript 正则表达式 学习笔记 标签(空格分隔): 基础 JavaScript 正则表达式是用于匹配字符串中字符组合的模式.在javascript中,正则表达式也是对象.这些模式被用于Re ...

  3. web前端学习(四)JavaScript学习笔记部分(10)-- JavaScript正则表达式

    1.JavaScript正则表达式课程概要 方便查找字符串.数字.特殊字串等等 2.正则表达式的介绍 RegExp是正则表达式的缩写 当检索某个文本时,可以使用一种模式来描述要检索的内容.RegExp ...

  4. Javascript 正则表达式简述

    本文地址:http://www.cnblogs.com/blackmanba/p/regular-expressions-introduce.html 或者 http://forkme.info/re ...

  5. JavaScript正则表达式,你真的知道?

    一.前言 粗浅的编写正则表达式,是造成性能瓶颈的主要原因.如下: var reg1 = /(A+A+)+B/; var reg2 = /AA+B/; 上述两个正则表达式,匹配效果是一样的,但是,效率就 ...

  6. 【JS】javascript 正则表达式 大全 总结

    javascript 正则表达式 大全 总结 参考整理了一些javascript正则表达式 目的一:自我复习归纳总结 目的二:共享方便大家搜索 微信:wixf150 验证数字:^[0-9]*$ 验证n ...

  7. 理清JavaScript正则表达式--上篇

    在JavaScript中,正则表达式由RegExp对象表示.RegExp对象呢,又可以通过直接量和构造函数RegExp两种方式创建,分别如下: //直接量 var re = /pattern/[g | ...

  8. 理清JavaScript正则表达式--下篇

    紧接:"理清JavaScript正则表达式--上篇". 正则在String类中的应用 类String支持四种利用正则表达式的方法.分别是search.replace.match和s ...

  9. JavaScript正则表达式详解(一)正则表达式入门

    JavaScript正则表达式是很多JavaScript开发人员比较头疼的事情,也很多人不愿意学习,只是必要的时候上网查一下就可以啦~本文中详细的把JavaScript正则表达式的用法进行了列表,希望 ...

随机推荐

  1. OLED中的Demura

    OLED作为一种电流型发光器件已越来越多地被应用于高性能显示中.由于它自发光的特性,与LCD相比,AMOLED具有高对比度.超轻薄.可弯曲等诸多优点.但是,亮度均匀性和残像仍然是它目前面临的两个主要难 ...

  2. Linux下分布式项目部署环境搭建与使用(druid-1.0.25.jar)数据库连接加密

    一.JDK安装 1.执行命令:cd Downloads/ 2.上 传:jdk-8u111-linux-x64.tar.gz 到Downloads 3.执行命令:tar -zxvf jdk-8u111- ...

  3. GIT团队合作探讨之四--不同工作流优缺辨析

    由于git非常强大,它可以支持非常多的协作模式,而可能正因为选择太多反而有时候对于我们如何开始开展团队协作无从下手.本文试图阐述企业团队中应用最为广泛的git 工作流,为大家理清思路,最大限度发挥gi ...

  4. NSJSONSerialization能够处理的JSONData

    NSJSONSerialization能够处理的JSONData You use the NSJSONSerialization class to convert JSON to Foundation ...

  5. 看了xici有写给孩子的信,maybe我也要写给孩子一些东西了

    看了xici有写给孩子的信,maybe我也要写给孩子一些东西了

  6. 08提权 系统文件权限和远程连接IP绕过 安装后门

    大家都知道08权限的系统权限设置很严格  面对限制IP连接的情况 我们及时拿到system权限 有账号也上不去这种情况下只能弄shift后门 或者放大镜了  但08权限 在system权限也操作不了系 ...

  7. hdu-1695 GCD---容斥定理

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1695 题目大意: 求解区间[1, n]和[1, m]中有多少对不同的x和y使得gcd(x, y) = ...

  8. 使用JQuery做一组复选框的功能。

    之前做过复选框的功能,奈何笔记丢失,害的我又鼓捣了一番...还是博客园做笔记比较好. 假设现在有一个表格,每一行都有一个复选框按钮.在表头还有一个全选的复选框按钮. ①.当点击一个全选按钮时,下面的同 ...

  9. 对于view的深入理解,续篇(一)重写ViewGroup的onDraw

    在上一篇文章中,不仅熟悉了动态设定布局的方法,而且也对view的绘制流程有所了解.于是我继续做了下面几个实验,发现了一个问题.如果对view的绘制流程不是很明白,可以看看我的上一篇文章的介绍,点击下面 ...

  10. [USACO08FEB]酒店Hotel

    嘟嘟嘟 这道题以前在学校内网刷过类似的,AC了后还挺有成就感,所以更详细的题解请看这里. 总的来说,就是用线段树维护区间最长连续0.因此我们要维护这么几个值:lmax:从当前区间左端点开始最长的连续0 ...