关于-RegExp
// exec() exec() 查找并返回当前的匹配结果,并以数组的形式返回。
// test() test() 方法检索字符串中的指定值。返回值是 true 或 false。
// compile() compile() 方法用于改变 RegExp。compile() 既可以改变检索模式,也可以添加或删除第二个参数。
// match() match() 是获取正则匹配到的结果,以数组的形式返回
// replace() replace() 本身是JavaScript字符串对象的一个方法,它允许接收两个参数:replace([RegExp|String],[String|Function])
// search() search() 字符串方法与indexOf()有些类似,search()方法返回第一个匹配值的位置,search()方法不支持全局匹配正规表达式(带参数g)
//使用RegExp对象创建 var regObj = new RegExp("(^\s+)|(\s+$)","g");
//使用直接字面量创建 var regStr = /(^\s+)|(\s+$)/g;
// ()、[]、{} 的区别
// () 的作用是提取匹配的字符串。表达式中有几个()就会得到几个相应的匹配字符串。比如 (\s+) 表示连续空格的字符串
// []是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示字符文本要匹配英文字符和数字。
// {}一般用来表示匹配的长度,比如 \d{3} 表示匹配三个空格,\d[1,3]表示匹配1~3个空格
// ^ 和 $
// ^ 匹配一个字符串的开头,比如 (^a) 就是匹配以字母a开头的字符串
// $ 匹配一个字符串的结尾,比如 (b$) 就是匹配以字母b结尾的字符串
// ^ 还有另个一个作用就是取反,比如[^xyz] 表示匹配的字符串不包含xyz
// 需要注意的是:如果^出现在[]中一般表示取反,而出现在其他地方则是匹配字符串的开头
// \d \s \w .
// \d 匹配一个非负整数, 等价于 [0-9]
// \s 匹配一个空白字符
// \w 匹配一个英文字母或数字,等价于[0-9a-zA-Z]
// . 匹配除换行符以外的任意字符,等价于[^\n]
// * + ?
// * 表示匹配前面元素0次或多次,比如 (\s*) 就是匹配0个或多个空格
// + 表示匹配前面元素1次或多次,比如 (\d+) 就是匹配由至少1个整数组成的字符串
// ? 表示匹配前面元素0次或1次,相当于{0,1} ,比如(\w?) 就是匹配最多由1个字母或数字组成的字符串
正则表达式是基于grep和ed这些Unix管理工具发展而来的,使用正则表达式可以使字符串处理变得更加方便快捷,以下内容主要是JavaScript正则表达式的一些基础知识汇总:
1. JavaScript正则表达式的实现
JavaScript对正则表达式的支持是通过ECMAScript中的RegExp类实现的,RegExp对象的构造函数可以带一个或两个参数。第一个参数描述需要进行匹配的模式字符串,第二个参数指定了额外的处理指令。
程序代码
var re=new RegExp("test","gi");
实现方法二:使用Perl风格的语法(较常用)
程序代码
var re=/test/gi; //这种方式和上面是一样的效果
2. 使用RegExp对象的方法
RegExp对象主要方法有:RegExp.test(String) RegExp.exec(String) String.match(RegExp) String.search(RegExp)
2.1 test()方法
test()方法,如果给定字符串匹配这个模式,就返回true,否则返回false。
程序代码
var re=/test/;
alert(re.test("this is the test content")); //output "true"
2.2 exec()方法
exec()方法和test()用法类似,不过exec返回的是一个数组,并且只有一个条目,既是第一次的匹配。
程序代码
var re=/test/gi;
alert(re.exec("this is the test content")); //output "test"
2.3 match()方法
match()方法也是返回一个数组,不过使用方法和上面有区别,match的使用方法为String.match(RegExp)。
程序代码
var re=/te/gi;
alert(("this is the test content").match(re)); //output "te, te"
2.4 search()方法
search()方法和字符串的indexOf()方法类似,返回在字符串中出现的一个匹配的位置。
程序代码
var re=/te/i;
alert(("this is the test content").search(re)); //output 12
3. 在字符串方法中使用正则表达式
在字符串方法String.replace()和String.split()中使用正则表达式。
3.1 String.replace()
程序代码
var re=/te/gi;
alert(("this is the test content").replace(re,"ok")); //output "this is the okst conoknt"
3.2 String.split()
示例代码:
程序代码
var re=/te/gi;
alert(("this is the test content").split(re)); //output "this is the ,st con,nt"
4. 使用元字符
JavaScript正则表达式元字符:
程序代码
( [ { \ ^ $ | ) ? * + .
任何时候要在正则表达式中使用元字符,都必须对他们进行转义。
程序代码
var re=/\?/ //匹配?
var re2=new RegExp("\\?"); //匹配?
第二行的定义中使用两个反斜杠,主要是因为JavaScript字符串解析器会按照\n的方式翻译\?,为了保证不出现这个问题,所以要在元字符前面使用两个反斜杠,我们称之为双重转义。
5. 使用特殊字符
在表达式中可以使用字符串本身,也可以使用它的ASCII码或者Unicode代码,要用ASCII码来表示一个字符,则必须制定一个两位的十六进制代码,并在前面加上\x。例如:字符b的ASCII码为98,转换成十六进制为62,既是\x62。
程序代码
var re=/\x62/;
alert(re.test("blue")); //output "true"
另外也可以使用八进制代替十六进制表示。
示例代码:
程序代码
var re=/\142/; //使用八进制表示
alert(re.test("blue")); //output "true"
如果使用Unicode来表示字符,必须制定字符串的四位十六进制表示形式,比如b的表示方式为:\u0062
示例代码:
程序代码
var re=/\u0062/; //使用Unicode表示
alert(re.test("blue")); //output "true"
另外一些需要双重转义的字符:
程序代码
\t \n \r \r \a \e \cX \b \v \0
6. 正则表达式字符类
6.1 简单类 [abc...]
程序代码
var re=/[gts]o/g; //匹配go to so
alert(("you go to bed,so will i").match(re)); //output "go to so"
6.2 负向类 [^abc]
负向类主要是采用排除策略,例如[^abc],既是排除a b c三个字符。
程序代码
var re=/[^gts]o/g; //排除g t s +o
alert(("you go to bed,so do i").match(re)); //output "yo do"
6.3 范围类 [a-z]
范围类主要是不方便枚举,但连续的一系列字符或数字等。
程序代码
var re=/a[3-5]/g;
alert(("a1,a2,a3,a4,a5,a6").match(re)); //output "a3,a4,a5"
6.4 组合类 [a-z0-9\r\n]
组合类是有几种方式组合而成的字符串。
示例代码:
程序代码
var re=/[a-b3-5]/g;
alert(("a1,a2,a3,a4,a5,a6").match(re)); //output "a,a,a,3,a,4,a,5,a"
6.5 预定义类
常用的预定义类:
程序代码
. [^\n\r]
\d [0-9]
\D [^0-9]
\s [ \t\n\x0B\f\r]
\S [^ \t\n\x0B\f\r]
\w [a-zA-Z0-9]
\W [^a-zA-Z0-9]
7. 量词
7.1 简单量词
程序代码
? {0,1}
* {0,}
+ {1,}
{n} 一定出现n次
{n,m} 至少出现n次,但不超过m次
{n,} 至少出现n次
程序代码
var re=/g?oo?d?/g; //可匹配o go goo good oo ood od
alert(("to go is good").match(re)); //output "o go good"
7.2 贪婪的(? * + {n} {n,m} {n,})
贪婪的先看整个的字符串是否匹配,如果没有匹配,就去掉最后一个字符,然后再次进行匹配,以此规则进行下去......
程序代码
var str="abc abcd abcde";
var re=/.*c/g; //贪婪方式匹配
alert(re.exec(str)); //output "abc abcd abc"
7.3 懒惰的 (?? *? +? {n}? {n,m}? {n,}?)
懒惰的跟贪婪的匹配方向相反,懒惰的先从第一个字符开始匹配,如果不成功,就读入下一个字符继续进行匹配,以此规则进行下去...
程序代码
var str="abc abcd abcde";
var re=/.*?c/g; //懒惰方式匹配
alert(re.exec(str)); //output "abc"
7.4 支配的 (?+ *+ ++ {n}+ {n,m}+ {n,}+)
支配的只尝试匹配整个字符串,如果整个字符串不能匹配,不做进一步尝试,此方法浏览器支持不太好,不推荐使用。
8. 复杂模式
8.1 分组
分组是通过用一系列括号包围一系列字符、字符类以及量词来使用的。
程序代码
var re=/g(o)+gle/g; "o"至少出现1次
alert(("gogle google gooooogle").match(re)); //output "gogle google gooooogle"
8.2 反向引用(backreference)
利用分组进行正则匹配后,每个分组都被存储在一个特殊的地方,这些存储在分组中的特殊值,我们称之为反向引用(backreference)。
程序代码
var re=/(\d+)/;
re.test("123456789");
alert(RegExp.$1); //output "123456789"
8.3 候选
候选其实就是个or选择。使用|分隔。
程序代码
var re=/you|me/g;
alert(("say you say me").match(re)); //output "you, me"
8.4 非捕获性分组(?:)
不创建反向引用的分组,我们称之为非捕获性分组,使用非捕获性分组,可以除去捕获性分组存储分组的时间消耗,提高程序执行效率。
示例代码:
程序代码
var re=/(?:\d+)/;
re.test("123456789");
alert(RegExp.$1); //output ""
8.5 前瞻(lookahead) (?= )
有时候,希望某个特定的字符出现在另一个字符串之前时,才会捕获它。前瞻告诉正则表达式运算器向前看一些字符而不移动其位置。 前瞻有负向(?!)和正向(?=)之分。
程序代码
var re=/(good(?=lu))/g;
var str="goodluck is lucy";
alert(str.match(re)); //output "good"
8.6 边界
程序代码
^ 行开头
$ 行结尾
\b 单词的边界
\B 非单词的边界
程序代码
var re=/^(.+?)\b/g; //以懒惰的方式匹配单词
var str="goodluck is lucy";
alert(str.match(re)); //output "goodluck"
8.7 多行模式(m)
匹配多行,常配合g使用。
程序代码
var re=/(\w+)$/gm; //匹配每行末尾的一个单词
var str="goodluck is lucy\ngo to bed";
alert(str.match(re)); //output "lucy, bed"
关于-RegExp的更多相关文章
- JavaScript RegExp 基础详谈
前言: 正则对于一个码农来说是最基础的了,而且在博客园中,发表关于讲解正则表达式的技术文章,更是数不胜数,各有各的优点,但是就是这种很基础的东西,如果我们不去真正仔细研究.学习.掌握,而是抱着需要的时 ...
- javascript正则表达式(RegExp)简述
首先我们来思考以下两个个场景 我们使用window操作系统,有时候需要找一个文件,刚刚好这个文件我不知道放哪里去了,这个时候我们该怎么办呢? 我们使用word写论文的时候,不小心将"订价&q ...
- 正则-RegExp()构造函数
上次写了js正则的字面量声明,今天说说RegExp()构造函数声明: var p=/cat/g; //字面量声明var p=new RegExp('cat','g') //构造函数声明 它两所表达 ...
- REGEXP 正则的实现两个字符串组的匹配。(regexp)
主要懂3个mysql的方法:replace[替换] regexp[正则匹配] concat[连接] 由于某些原因,有时候我们没有按照范式的设计准则而把一些属性放到同一个字符串字段中.比如 ...
- 引用类型-RegExp类型
JavaScript高级程序设计(第三版)笔记-第五章-RegExp类型 定义正则表达式有两种方式 1.用字面量形式定义正则表达式: ver expression = /patterns/flags; ...
- 原生JS:RegExp对象详解
@import url(http://i.cnblogs.com/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/c ...
- javascript类型系统——正则表达式RegExp类型
× 目录 [1]对象 [2]实例属性 [3]静态属性[4]实例方法 前面的话 前面已经介绍过javascript中正则表达式的基础语法.javascript的RegExp类表示正则表达式,String ...
- RegExp类型exec()方法的返回值说明
之前看别人写的插件经常会用到RegExp对象来验证输入,并且获取一些那时我并不晓得是什么东西的数组,来取值进行自定义的逻辑处理.今天学习了一下RegExp类型.终于有了一个初步的了解,至少不会看一会就 ...
- RegExp 对象 (JavaScript)
$1...$9 属性 (RegExp) (JavaScript) 返回在模式匹配期间找到的,所存储的最近的九个部分.只读. 语法 RegExp.$n 参数 RegExp 始终为 ...
- RegExp
var str = "1a1b1c";var reg = new RegExp("1(.)", "g");alert(reg.test(st ...
随机推荐
- about unit test
Use unify unit test framework CPPUnit 1.12.1/Visual stdio Unit is a class or a function Test per maj ...
- oracle-rman-1
备份脚本 ############################# [oracle@rac02 backup_scripts]$ cat rman_bus_level_0_bk.sh######## ...
- Dynamic dispatch
Dynamic dispatch动态调度.动态分发 In computer science, dynamic dispatch is the process of selecting which im ...
- JDK动态代理实例
最近看<深入浅出MyBatis技术原理与实战>这本书时,里面讲到Mapper接口的内部实现是通过JDK动态代理生成实现类,联想到之前看<SPRING技术内幕>这本书里也常常提到 ...
- python初始化list列表(1维、2维)
1.初始化递增的list: list1 = range(10)#print list1#[0,1,2,...,9] 2.初始化每项为0的一维数组: list2 = [0] * 5#print list ...
- LOJ 2737 「JOISC 2016 Day 3」电报 ——思路+基环树DP
题目:https://loj.ac/problem/2737 相连的关系形成若干环 / 内向基环树 .如果不是只有一个环的话,就得断开一些边使得图变成若干链.边的边权是以它为出边的点的点权. 基环树的 ...
- Linux 高级文本处理命令
1.2.1 cut命令 cut命令可以从一个文本文件或者文本流中提取文本列. cut语法 [root@www ~]# cut -d'分隔字符' -f fields ## 用于有特定分隔字符 [ ...
- 用monit监控mongodb,崩溃后自动重启mongdb
什么是monit Monit是一个跨平台的用来监控Unix/linux系统(比如Linux.BSD.OSX.Solaris)的工具.Monit特别易于安装,而且非常轻量级(只有500KB大小),并且不 ...
- ByteType字符串中判断是否英文
ByteType('123你好吗',1)=mbSingleByte//单字节ByteType('123你好吗',4)=mbLeadByte//双字节字符的第一个字符ByteType('123你好吗', ...
- Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向 (四十三)
不多说,直接上干货! hadoop-2.6.0动态添加新节点 https://blog.csdn.net/baidu_25820069/article/details/52225216 Hadoop集 ...