javascript中的正则表达式学习
一、前言
关于正则表达式自身的语法这里不做过多介绍(详情可参见http://www.php100.com/manual/unze.html),这里仅仅解释javascript中和正则表达式相关的几个方法的使用(http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp)。
二、javascript中的RegExp对象
在javascript中,有两种方法可以构建正则:
正则表达式字面量
RegExp构造器
RegExp对象有以下属性:
global:如果标识g,则为true
ignoreCase:如果标识i被使用,则为true
lastIndex:下一次exec匹配开始的索引,初始值为0
multiline:如果标识m被使用,则为true
source:正则表达式源文本
三、正则表达式中的特殊需转义的字符
在正则表达式字面量中,如果希望下面的字符按照字面进行匹配:
/ \ [ ] ( ) { } ? + * | . ^ $
必须要用一个\前缀进行转义。如果拿不准的话,可以个任何特殊字符都添加一个\前缀使其字面化。注意\前缀不能使字母或数字字面化。
四、javascript中可以操作正则表达式的相关方法
在javascript中,可以处理正则表达式的方法有:
regexp.exec
regexp.test
string.match
string.replace
string.search
string.split
下面重点介绍一下上述方法的用法:
1.regexp.exec(string)
RegExpObject.exec(string) 返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null。
此数组的第 0 个元素是与正则表达式相匹配的文本,第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本(如果有的话),第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本(如果有的话),以此类推。除了数组元素和 length 属性之外,exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出,在调用非全局的 RegExp 对象的 exec() 方法时,返回的数组与调用方法 String.match() 返回的数组是相同的。
但是,当 RegExpObject 是一个全局正则表达式时,exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说,您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时,它将返回 null,并把 lastIndex 属性重置为 0。
重要事项:如果在一个字符串中完成了一次模式匹配之后要开始检索新的字符串,就必须手动地把 lastIndex 属性重置为 0。并且^因子仅匹配regexp.lastIndex为0的情况。
提示:请注意,无论 RegExpObject 是否是全局模式,exec() 都会把完整的细节添加到它返回的数组中。这就是 exec() 与 String.match() 的不同之处,后者在全局模式下返回的信息要少得多。因此我们可以这么说,在循环中反复地调用 exec() 方法是唯一一种获得全局模式的完整模式匹配信息的方法。
具体可参见下面的案例:
var str='visit bobo bobo';
var patt=/bobo/g;
var result;
console.log('带有g标示的循环调用');
while((result=patt.exec(str))!=null){
console.log(result);//第一次输出["bobo", index: 6, input: "visit bobo bobo"],第二次循环输出["bobo", index: 11, input: "visit bobo bobo"]
//下一个匹配位置
console.log(patt.lastIndex);//第一次输出10,第二次输出15
//匹配文本的第一个位置 } console.log('非手动退出循环时regexp.lastIndex的值');
console.log(patt.lastIndex);//输出0 console.log('不带g标示的exec');
var patt1=/bobo/;
var result1=patt1.exec(str);
console.log(patt1.lastIndex);//不带g标识的时候,每一次exec执行完毕,lastIndex都重置为0
console.log(result1);//["bobo", index: 6, input: "visit bobo bobo"]
2.regexp.test(string)
test方法是使用正则表达式最简单(和最快)的方法,如果匹配返回true,否则返回false。
r.test(string)等同于r.exec(string)!=null.不要对这个方法运用g标识。
3.string.match(regexp)
stringObject.match(searchvalue | regexp)可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。
match方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。
如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。
如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。
注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。
具体可参见下面的示例:
//测试match方法
var reg=/bobo(leishao)/;
//测试不带有g标识的match方法 var str='boboleishao leishaobobo boboleishao';
var result=str.match(reg);
console.log(result);//输出["boboleishao", "leishao", index: 0, input: "boboleishao leishaobobo boboleishao"]
console.log(reg.lastIndex);//输出0 //测试带有g标识的match方法
var reg1=/bobo(leishao)/g;
//测试不带有g标识的match方法 var str1='boboleishao leishaobobo boboleishao';
var result1=str1.match(reg1);
console.log(result1);//输出["boboleishao", "boboleishao"]
console.log(reg1.lastIndex);//输出0 //在jQuery中利用这种方法,将使用一个或者多个空格分开的字符串切割成一个数组
var rnotwhite=/\S+/g;
var testStr='bobo leishao bobo';
console.log(testStr.match(rnotwhite));//输出["bobo", "leishao", "bobo"]
3.string.replace(searchValue,replaceValue)
string.replace方法对string进行查找和替换操作,并返回一个新的字符串。
参数searchValue可以使一个字符串或者正则表达式:
1)如果是一个字符串,那么只会在第一次出现的地方进行匹配;
2)如果是一个正则表达式,并且带有g表示,那么它会替换所有的匹配,如果没有带g标识,它仅替换首个匹配。
参数replaceValue可以是一个字符串或者一个函数,
1)如果replaceValue是一个字符串,字符串$具有特殊含义;
$$替换$;
$&替换整个匹配的文本;
$number匹配捕获的分组;
$`匹配之前的文本,
$'匹配之后的文本
2)如果replaceValue是一个函数,那么每遇到一次匹配都会调用一次,函数的返回值将会作为替换文本,传递给函数的第一个参数是整个被匹配的文本,第二个参数是分组1捕获的文本,依次类推。。。并且数组最后会有两个参数,一个是匹配开始的位置,一个参数是输入文本
具体的可参见下面的示例:
//测试replace方法
var str='leishao bobo leishao';
//不含有g标识的正则
console.log(str.replace(/leishao/,'shaoxianlei'));//输出shaoxianlei bobo leishao
//包含g标识的正则
console.log(str.replace(/leishao/g,'shaoxianlei'));//输出shaoxianlei bobo shaoxianlei
//$的特殊含义
console.log(str.replace(/(\w+)\s+(\w+)/,"$2 $1"));//输出bobo leishao leishao
//测试第二个参数是函数
var str='leishao bobo leishao bobo';
console.log(str.replace(/(\w+)\s+(\w+)/,function(all,str1,str2){
console.log(all);//输出leishao bobo
console.log(str1);//输出leishao
console.log(str2);//输出bobo
return all.toUpperCase();
}));//输出LEISHAO BOBO leishao bobo
//如果是带有g标识,并且第二个参数是函数
console.log(str.replace(/(\w+)\s+(\w+)/g,function(all,str1,str2){
console.log(all);//调用两次,两次都输出leishao bobo
console.log(str1);//调用两次,两次都输出leishao
console.log(str2);//调用两次,两次都输出bobo
console.log(arguments);//调用两次,第一次输出["leishao bobo", "leishao", "bobo", 0, "leishao bobo leishao bobo"];第二次输出["leishao bobo", "leishao", "bobo", 13, "leishao bobo leishao bobo"]
return all.toUpperCase();
}));//最终输出EISHAO BOBO LEISHAO BOBO
console.log('没有分组的情况');
//如果正则中没有分组,第二个参数是函数
console.log(str.replace(/\w+\s+\w+/g,function(all,str1,str2){
console.log(all);//调用两次
console.log(arguments);//调用两次,第一次输出["leishao bobo", 0, "leishao bobo leishao bobo"];第二次输出["leishao bobo", 13, "leishao bobo leishao bobo"]
return all.toUpperCase();
}));
// jQuery中camelCase的实现
var camelReg=/\-([\da-z])/g;
function camelCase(str) {
return str.replace(camelReg,function(all,letter){
return letter.toUpperCase();
});
}
五、string.split(seperator,limit)
该方法用于将一个字符串分割为字符串数组。seperator必须,为字符串或者正则,当时正则表达式时,该方法忽略g标识;limit可选,该参数可以指定返回数组的最大长度。
1)如果seperator是空字符串,那么返回一个单字符的数组。
2)如果是正则表达式,会忽略g标识;如果正则表达式包含分组,那么分组捕获的文本会包含在分割后的数组中
//1.如果separator是空字符
var digits='';
console.log(digits.split(''));//输出["1", "2", "3", "4", "5"]
var str='|a|b|c|';
console.log(str.split('|'));//输出["", "a", "b", "c", ""]
var text='last, first,middle';
console.log(text.split(/\s*,\s*/));//输出["last", "first", "middle"]
//指的注意的是,来自分组的文本会被包含在被分割后的数组中
console.log(text.split(/\s*(,)\s*/));//输出["last", ",", "first", ",", "middle"]
五、string.search(regexp)
search()方法用于检索字符串中指定的子字符串,或者检索与正则表达式相匹配的子字符串。如果检索不到,返回-1.
1.参数regexp可以是子字符串,这时候感觉使用IndexOf更方便一些;
2.regexp可以是正则表达式对象,这时候会忽略g标识;如果要执行忽略大小写的检索,可以加上i标识。
var regexp=/\w+\s*,\s*\w+/i;
console.log('bobo leishao , bobo'.search(regexp));//输出5
javascript中的正则表达式学习的更多相关文章
- Javascript中的正则表达式
Javascript中的正则表达式 刚开始接触正则表达式的时候,觉得这是个很死板的东西(没办法,计算机不能像人眼一样能很快的辨认出我们需要的结果,它需要一定的规则来对它进行限制),了解的越多,发现这个 ...
- JavaScript中的正则表达式(终结篇)
JavaScript中的正则表达式(终结篇) 在之前的几篇文章中,我们了解了正则表达式的基本语法,但那些语法不是针对于某一个特定语言的.这篇博文我们将通过下面几个部分来了解正则表达式在JavaScri ...
- 浅谈JavaScript中的正则表达式
引言 对于正则表达式我想作为程序员肯定使用过它,那天书般的表达方式,我用一次就记住它了.这篇博客先介绍一些正则表达式的内容,然后介绍JavaScript中对正则表达式特有的改进.下面开始介绍正则表达式 ...
- 转载 javascript中的正则表达式总结 一
定义正则表达式的方法 定义正则表达式的方法有两种:构造函数定义和正则表达式直接量定义.例如: var reg1 = new RegExp('\d{5, 11}'); // 通过构造函数定义 var r ...
- C++、Java、JavaScript中的正则表达式
C++(VS2013编译器):http://msdn.microsoft.com/zh-cn/library/bb982727.aspx#grammarsummary Java: ...
- 浅谈JavaScript中的正则表达式(适用初学者观看)
浅谈JavaScript中的正则表达式 1.什么是正则表达式(RegExp)? 官方定义: 正则表达式是一种特殊的字符串模式,用于匹配一组字符串,就好比用模具做产品,而正则就是这个模具,定义一种规则去 ...
- 精通 JavaScript中的正则表达式
精通 JS正则表达式 (精通?标题党 ) 正则表达式可以: •测试字符串的某个模式.例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式.这称为数据有效性验证 ...
- JavaScript中的正则表达式详解
摘要:javascript中的正则表达式作为相当重要的知识,本文将介绍正则表达式的相关知识和用法. 正则表达式(Regular Expression)是一门简单语言的语法规范,是强大.便捷.高效的文本 ...
- (译)JavaScript 中的正则表达式(RegEx)实操——快速掌握正则表达式,伴有随手可练的例子————(翻译未完待续)
(原文:https://blog.bitsrc.io/a-beginners-guide-to-regular-expressions-regex-in-javascript-9c58feb27eb4 ...
随机推荐
- malloc与new的区别
1.new是运算符,而malloc是库函数 2.new可以重载,可以自定义内存分配策略,甚至不做内存分配,甚至分配到非内存设备上.而malloc不能. 3.new在用于定义一个新的非内部对象的时候,默 ...
- css3 tween
/* * Tween.js * t: current time(当前时间) * b: beginning value(初始值) * c: change in value(变化量) * d: durat ...
- python 爬虫(一)
1. 一次简单的网页访问 urllib 是一个标准的python库(意味着不需要安装任何附件的东西来运行这个demo),包含了通过网络请求数据的方法,处理cookies,甚至更改metadata比如h ...
- border
1.border-width:不支持百分比值 支持下面属性值: thin:1px medium:3px thick:5px 2.border-style类型 solid:实线 dashed:虚线(方形 ...
- [Python学习] python 科学计算库NumPy—矩阵运算
NumPy库的核心是矩阵及其运算. 使用array()函数可以将python的array_like数据转变成数组形式,使用matrix()函数转变成矩阵形式. 基于习惯,在实际使用中较常用array而 ...
- 【贪心】POJ 1065
头一次接触POJ,然后写了自己比较擅长的贪心. 解题思路大概就是从小排(这个很重要,然后用cmp随便长度或者重量的排序,选择最小的开始) 直到所有比他weight大的,没有符合条件的了.就代表要再加一 ...
- FineUI 基于 ExtJS 的专业 ASP.NET 控件库
FineUI 基于 ExtJS 的专业 ASP.NET 控件库 http://www.fineui.com/
- phpcmsv9 阿里云OSS云存储整合教程
该教程算不上是phpcmsv9阿里云oss插件,所以整个修改及其代码覆盖前请一定记得备份.还有一点就是后台发布文章时上传的附件还是会保存在你的服务器上,基于以下原因:1.个人的需求是前台页面需要使用t ...
- 影响前端的Chrome浏览器36
新发现,在我开发过的组件中表格组件是采用Table生成的,而在Webkit内核浏览器中,Table的列顺序是倒着生成的,所以在组件中要做兼容. 现在Chrome浏览器版本已经升级到36了.发现Tabl ...
- 用 Python 排序数据的多种方法
用 Python 排序数据的多种方法 目录 [Python HOWTOs系列]排序 Python 列表有内置就地排序的方法 list.sort(),此外还有一个内置的 sorted() 函数将一个可迭 ...