前言


js中类RegExp类表示正则表达式,具有强大的模式匹配、文本检索和替换功能。正则表达式的模式规则是由一个字符序列组成,包括所有字母和数字在内,大多数的字符都是按照直接量匹配字符,某些特殊字符并不按照字面含义匹配字符例如$等,当按照非字面含义匹配时使用需要利用反斜杠转义

可以采用下面两种方式创建RegExp对象:

eg:下面两种方式都可以匹配以s结尾的字符串

  1. //方式一($匹配字符串的结尾),采用构造函数方式
  2. var pattern = new RegExp("s$");
  3.  
  4. //方式二 ,采用正则表达式直接量的方式,定义在一对斜杠之间的字符
  5. var pattern = /s$/;

注意: 在ECMAScript3中一个正则表达式在执行到它时会转换为一个RegExp对象,同一段代码所表示的正则表达式直接量的每次运算都返回同一个对象(区别于{}和[],每次会创建新的对象),而ECMAScript5中不是

    即ECMAScript3中RegExp对象会共享同一个实例,而在ECMAScript5中是两个独立的实例

字符


1、直接量字符

 

  1. 字母和数字字符: 自身
  2.  
  3. \o:       NUL字符
  4.  
  5. \t:       制表符
  6.  
  7. \n:       换行符
  8.  
  9. \v:       垂直制表符
  10.  
  11. \f:       翻页符
  12.  
  13. \r:      回车符
  14.  
  15. ....

2、字符类

将直接量字符放进方括号内组成了字符类,一个字符类可以匹配它所包含的任意字符 eg:/[abc]/可以匹配a、b、c

字符类列表如下:

  1. [....]:  方括号内任意字符
  2.  
  3. [^...]:  不在方括号内的任意字符
  4.  
  5. .   : 除换行符和其他Unicode行终止符之外的任意字符
  6.  
  7. \w  :  任意ASCII字符组成的单词,等价于[a-zA-Z0-9]
  8.  
  9. \W :  任何不适ASCII字符组成的单词,等价于[^a-zA-Z0-9]
  10.  
  11. \s  :  任何Unicode空白符
  12.  
  13. \S  :  任何非Unicode空白符的字符
  14.  
  15. \d  :  任何ASCII数字,等价于[0-9]
  16.  
  17. \D  :  等价于[^0-9]
  18.  
  19. [\b] 退格直接量

重复


/\d\d/可以匹配两个数字,如果位数很多时怎么办呢,可以采用如下方式:

  1. {n}:   匹配前一项n
  2.  
  3. {n,}:  匹配前一项n次或者是更多次
  4.  
  5. {n,m}:  匹配前一项至少n次,至多m次 
  6.  
  7. * :   匹配前一项0次或者多次,等价于{0,}
  8.  
  9. + :    匹配前一项1次或者多次,等价于{1,}
  10.  
  11. ? :  匹配前一项0次或者1次(即前一项是可选的)等价于{0,1}

上面这种方式是”贪婪的“匹配,即尽可能多的匹配。如果要”非贪婪的“匹配,可以在匹配的字符后加一个问号。

eg:/a+/ 和 /a+?/, 如果将aaa作为匹配字符串,前一种方式会匹配aaa,后一种方式只会匹配第一个a

当需要匹配aaab时 /a+b/和/a+?b/等价

分组


字符|用于分割供选择的字符,eg /ab|cd|ef/可以匹配字符串 ab或者cd或者ef。

选择项的尝试匹配次序是从左到右,知道发现匹配项,如果左边的选择项匹配就会忽略右边的匹配项,eg /a|ab/  匹配ab时只能匹配a

圆括号()


圆括号()作用:

1. 将单独的项组合为表达式

  eg:/java(script)?/ 可以匹配java或者javascript

2. 在完成模式中定义子模式,当一个正则表达式成功的与目标字符串相匹配时可以从目标串中抽出和圆括号中的子模式相匹配的部分

 eg: /[a-z]+(\d+)/   模式中  /[a-z]+\d+/可以匹配一个或者多个小写字母后加一个和多个数字,那么我们使用()将\d+括起来后,就可以从匹配项中抽取出数字部分。当我们更关心后面的数字时可以使用这种方式

3. 允许在同一正则表达式的后面引用前面的子表达式。 通过在反斜杠\后加一个或者多个数字来实现,这个数字指定了带圆括号的子表达式在正则表达式中的位置

  eg1: /(java(script)[abc]+)/ 中(script)可以使用\2来指代

  eg2: /[' "][^' "]*[' "]可以使用 /([' "])[^' "]*\1/替代

(?:....)


(?:)   把项组合成一个单元,但是不生成引用,区别于子表达式中的()

eg:在/([Jj]ava(?:[Ss]cript)?)\sis\s(fun\w*)/中 \2与(fun\W*)匹配

锚(指定匹配位置)


锚用于指定匹配表达式出现的合法位置。最常用的锚元素是^用于匹配字符串的开始,锚元素$用于匹配字符串的结束

总结列表:

  1. ^ :  匹配字符串的开头,多行检索时用于匹配一行的开头
  2.  
  3. $ :  匹配字符串的结尾,多行检索时用于匹配一行的结尾
  4.  
  5. \b:  匹配一个单词的边界(区别于[\b]退格)
  6.  
  7. \B:  匹配非单词边界的位置
  8.  
  9. (?=p): 正向先行断言,接下来的字符与p匹配
  10.  
  11. (?!p): 负向先行断言,接下来的字符不与p匹配

举例说明下正向先行断言和负向先行断言:

eg1: /[Jj]ava([Ss]cript)?(?=\:)/  则改模式能匹配Javascript:is a very interesting language 中的Javascript,但是不能匹配Java is a very interesting language 中的Java

eg2:/Java(?! script)[A-Z]\w*/  能够匹配Java后跟随一个大写字母和任意多个ASCII单词,但是不能跟随Script

   例如它能匹配JavaBeans 不能匹配Javanese

修饰符


修饰符放在"/"之外,下面的修饰符可以任意组合

  1. i:说明匹配模式不区分大小写
  2.  
  3. g:说明匹配模式时全局的,应该找出所有的匹配,而不是找到第一个就停止
  4.  
  5. m:多行执行模式,此时^和$除了匹配整个字符串的开始和结尾之外,还能匹配每行的开始和结尾

eg: /\bjava\b/i 可以匹配java Java JAVA等

  /JAVA$/im 可以匹配java Java\nis fun

例子


1)邮箱

  1. /^[a-zA-Z0-9_-]+\@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$/

注意


1.正则表达式中不允许双引号括起来的内容中有单引号,反之亦然.

2.在字符类中不能使用字表达式的引用

  eg:/([' "])[^\1]*\1/ 是非法的

相关方法:


见:javascript正则表达式(二)——方法

javascript正则表达式(一)——语法的更多相关文章

  1. JavaScript 正则表达式基础语法

    前言 正则表达式在人们的印象中可能是一堆无法理解的字符,但就是这些符号却实现了字符串的高效操作.通常的情况是,问题本身并不复杂,但没有正则表达式就成了大问题.javascript中的正则表达式作为相当 ...

  2. JavaScript正则表达式之语法

    Regular Expressions翻译成中文叫正则表达式.也不知道是谁翻译过来的,听起来就很严肃.似乎翻译成通用表达式更能传达其精髓. 为什么叫通用表达式?因为它有一套和编程语言无关的文本匹配规则 ...

  3. JavaScript 正则表达式——基本语法(2)

    来源:http://www.cnblogs.com/dolphinX/p/3486214.html 定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%>  ...

  4. JavaScript正则表达式下——相关方法

    上篇博客JavaScript 正则表达式上——基本语法介绍了JavaScript正则表达式的语法,有了这些基本知识,可以看看正则表达式在JavaScript的应用了,在一切开始之前,看看RegExp实 ...

  5. javascript正则表达式语法

    1. 正则表达式规则 1.1 普通字符 字母.数字.汉字.下划线.以及后边章节中没有特殊定义的标点符号,都是"普通字符".表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的 ...

  6. JavaScript 正则表达式上——基本语法

    定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%&g ...

  7. javascript正则表达式(RegExp)简述

    首先我们来思考以下两个个场景 我们使用window操作系统,有时候需要找一个文件,刚刚好这个文件我不知道放哪里去了,这个时候我们该怎么办呢? 我们使用word写论文的时候,不小心将"订价&q ...

  8. JavaScript正则表达式详解(一)正则表达式入门

    JavaScript正则表达式是很多JavaScript开发人员比较头疼的事情,也很多人不愿意学习,只是必要的时候上网查一下就可以啦~本文中详细的把JavaScript正则表达式的用法进行了列表,希望 ...

  9. 5分钟教你学会JavaScript正则表达式

    正则表达式在实际开发过程中和技术面试过程中的重要性不言而喻,本文仅仅只是教你如何在几分钟之类学会正则表达式,对于它的原理及运行机制不做介绍. 第一:什么是正则 正则表达式是一种用来描述一定数量文本的模 ...

随机推荐

  1. [转] prerender-SPA程序的SEO优化策略

    随着web2.0的兴起,ajax的时代已经成为了事实,更如今 Knockout,backbone, angular,ember前端MDV(model driver view)框架强势而来,Single ...

  2. sublime text3 插件配置

    (转) sublme text 全程指引:http://www.cnblogs.com/figure9/p/sublime-text-complete-guide.html 使用Package Con ...

  3. 模板-->单变元模线性方程

    如果有相应的OJ题目,欢迎同学们提供相应的链接 相关链接 所有模板的快速链接 extend_gcd模板 poj_2115_C Looooops,my_ac_code 简单的测试 None 代码模板 / ...

  4. 本文实例汇总了C#中@的用法,对C#程序设计来说有不错的借鉴价值。

    具体如下: 一 字符串中的用法 1.学过C#的人都知道C# 中字符串常量可以以@ 开头声名,这样的优点是转义序列“不”被处理,按“原样”输出,即我们不需要对转义字符加上 \ (反斜扛),就可以轻松co ...

  5. AmazeUI 模态框封装

    /** * 模态窗口 */ window.Modal = { tpls:{ alert:'<div class="am-modal am-modal-alert" tabin ...

  6. c# 用正则表达式获取开始和结束字符串中间的值

    c# 用正则表达式获取开始和结束字符串中间的值 /// <summary> /// 获得字符串中开始和结束字符串中间得值 /// </summary> /// <para ...

  7. c-连接两个链表

    概述 还是相对简单,不过要记得释放不用的头结点即可. 代码为: //将lList2头结点连接在lList1尾结点的后面. void combine(linklist lList1, linklist ...

  8. 启动php-fpm报错:please specify user and group other than root

    安装好PHP之后启动报错: 启动php-fpm报错:please specify user and group other than root, pool 'default 修改 php-fpm.co ...

  9. zookeeper集群一次性启动

    编写shell脚本 新建文本,命名为start-zookeeper.sh #!/bin/sh echo "start zkServer…" for i in master work ...

  10. Starting and Stopping Oracle Fusion Middleware

    指定用户名密码启动管理服务器 You can start and stop Oracle WebLogic Server Administration Servers using the WLST c ...