好吧,正则表达式,我从来没记过。以前要用的时候都是网上Copy一下的。

这里还是扯一下吧,以后要是有要用到的正则表达式那么就收集到这个帖子里。(尽管我认为不会,因为我根本就不是一个专业的前端,我只是来划下水的\(^o^)/)

应用范围:正则表达式主要应用于对字符串中的信息实现查找,替换和提取操作。

可处理正则表达式的方法有6个:

regexp.exec,regexp.test,string.match,string.replace,string.search和string.split

应用原因:在JS中,正则表达式相对于等效的字符串处理来说,有着显著的性能优势。

缺点:正如大部分人所看到的,这个东西有的时候光是看起来就很复杂和难懂。起码你让我这种菜去维护一个正则表达式我在网上Copy不到,一般都会用非正则表达式的方式去处理,美其名曰:代码可读性!

JS中正则表达式必需写在一行中,空白需要特别注意。

下面上一段代码:

var myRegExp=/^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;
var url="http://www.ora.com:8041/goodparts?q#fragment";
var result=myRegExp.exec(url);

看到上面这段代码你知道什么意思吗,绝大多数人不知道,知道的人也要看半天。这就是为什么大家都不愿意写这玩意。好了,这章就这样吧,大家散了吧。

即使如此,我还是自己要写下去,因为他实现的效果是这样的:

result的结果是下面这个数组:

["http://www.ora.com:8041/goodparts?q#fragment", "http", "//", "www.ora.com", "8041", "goodparts", "q", "fragment"]

这就是我为什么继续写下去的原因所在。

好吧,让我们一起学学这蛋疼又犀利的语法吧:

  • ^     表示字符串以下面匹配的方式开始
  • (?:([A-Za-z]+):)?   这个是套着捕获分组1的非捕获分组,必须后面跟着一个冒号才匹配(记住这里的冒号才匹配是由后面那个冒号决定的),匹配一个协议名,也就是http。
    • (?:)   表示一个非捕获型分组
    • 后缀? 表示这个分组是可选的,他表示重复0次或者一次。就比如你输入的url为www.baidu.com,不带协议名也是可以匹配的。
    • (...)   表示一个捕获型分组。一个捕获型分组会复制它所匹配的文本,并将其放在result数组里。每个捕获分组都会被指定一个编号。第一个捕获分组的编号是1,所以result[1]表示它。result[0]就是原字符串。
    • [...]   表示一个字符类。A-Za-z其实很好理解,就是26个大写字母和26个小写字母。-代表范围。
    • 后缀+ 表示这个字符类会被匹配一次或者多次。
    • 后面那个: 它表示匹配的字符串必须后面跟着一个冒号
  •   (\/{0,3})   这个是捕获分组2,这个因子匹配的是两个左斜杠
    • \/     表示的就是一个/,可以理解为\n一样的转义字符。
    • {0,3} 表示/这个东西会被匹配0到3次
  • ([0-9.\-A-Za-z]+) 这个是捕获分组3,匹配一个www.baidu.com之类的东西,由一个或多个字母和数字,以及 . 和 - 两个字符组成。也就是说你的网址是www.baidu.....----com---也是正确的
  • (?::(\d+)?  这个是套着捕获分组4的非捕获分组,匹配的是端口号。也就是以:开头的数字。同事将这个数字捕获后放入结果数组  
    • \d 表示的是一个数字字符,[0-9]也可以实现一样的效果
  • (?:\/([^?#]*))?   这又是一个套着捕获分组5的非捕获分组,它捕获了goodparts
    • (?:\/(...))? 匹配以左斜杠/开头的字串0到1次
    • [^?#]    匹配非?和#的所有字符,^表示非的意思
    • 后缀*  表示被匹配0次或者多次,和后缀+差不多,不过+是从1开始,
  • (?:\?([^#]*))? 同上吧,类似的,自己应该可以理解了吧
  • (?:#(.*))?  大致同上,
    • .  会匹配除行结束符以外的所有字符
  • $   表示字符串以上面那些匹配的方式结束

老实说,我照着书看完,又把这些话归纳总结出来,然后我就一直在想一个问题。

到底我是什么时候觉得正则表达式很难的呢?

是我还超级菜,并且还不爱学的时候。看什么都觉得难,再加上人也浮躁,不想沉下心来去学,所以形成了一个这样的印象。如今看来真是简单至极。

我会告诉你我基本上就从来没有自己写过正则表达式吗,我只会copy。

但是我在刚刚一个小时的学习中,我觉得我可以了,而且我能立马写出一段很6的正则表达式,无论多长,只需要把每个捕获分组换一行写就行了,然后贴到代码里时再合成一行。

突然的感悟:程序员只是需要一个安静的心和学习的兴趣。

我不会告诉你我是边看书边写博客的,好了,接下来我们继续吧。

无论如何,即时我现在明白了正则表达式不难,但是仍然还是把正则表达式写得越简单越好。

那么下面来写一个匹配数字的正则表达式吧

var myRegExp=/^-?\d+(?:\.\d*)?(?:e[+\-])?\d+)?$/i;
var url="-1.3e-3";
var result=myRegExp.test(url);//result为true

这上面的正则表达式的最后的 i 表示匹配字符串时忽略大小写。那么让我们扩展一下:

  • 以i结尾:表示忽略字符串大小写,都会匹配
  • 以g结尾: 表示全局的(匹配多次)。对于test方法不建议使用g,string的search方法会自动忽略g标识。
  • 以m结尾:多行($和^能匹配行结束符)

创建正则表达式的方式:

  • 最简单的,就像我上面那么玩的

    • var myRegExp=/^-?\d+$/i
  • 另外一种是使用RegExp构造器。Reg构造器适用于,必须在运行时动态生成正则表达式的情形。
    •   

      var myRegExp=new RegExp("\"(?:\\\\.|[^\\\\\\\"])*\"",'g');
    • RegExp的属性
      • global:如果标识g被使用,值为true。
      • ignoreCase:如果标识i被使用,值为true。
      • lastIndex:下一次exec匹配开始的索引。初始值为0.
      • multiline:如果标识m被使用,值为true
      • source:正则表达式源码文本
    • 用正则表达式字面量创造的RegExp对象,共享同一个单例。(我自己测了一下发现并非如此,所以这句话真实性有待确认)

关于构成正则表达式的元素

  • 分支:用|表示,两个正则表达式可以用|并起来成为一个,如果字符串匹配由|分隔的两个正则表达式任意一个,那么这个选择匹配。
  • 正则表达式匹配量词,简单来讲就是匹配多少次
    • {3,6}表示会匹配3到6次
    • *  等同于{0,}
    • +  等同于{1,}
    • ?  等同于{0,1}
  • ASCII码特殊字符的匹配写法
    • [!-\/:-@\[-'{-~]

      非常难看,且难懂,所以我的正则表达式啊,唉~~~

  • 正则表达式分组类型
    • 捕获型:()
    • 非捕获型:(?:)进行简单的匹配,并不会捕获所匹配的文本。会有微弱的性能优势。
    • 向前正向匹配:(?=)   作者说这个特性和下面这个特性并非好的特性,所以,我已经决定开始忘掉了。
    • 向后负向匹配:(?!)
  • 需要加转义字符的字符:\ / [ ]  (  )  ? + - * | . ^ s
  • 同时一些有趣的转义字符
    • \f 换页符
    • \n 换行符
    • \r  回车符
    • \t  制表符即tab
    • \u 允许指定一个Unicode字符来表示一个16进制的常量
    • \d 等同于[0-9],\D正好相反,等同于[^0-9]
    • \s 等同于[\f\n\r\t\u000B\u0020\u00A0\u2028\u2029].这是一个Unicode空白字符的不完全子集,\S正好相反
    • \w 等同于[0-9A-Z_a-z],\W正好相反,\W希望表示的是字母类但是它通常很难起作用。
    • 所以一个更简单的字母类是[A-Za-z\u00C0-\u1FFF\u2800-\uFFFD],它包括所有Unicode字母和其他非字母字符。Unicode比这大的多,但是太庞大而低效了。所以用这个简单的就好
    • \b 被指定为一个字边界标识,方便对文本的字边界进行匹配。然而他会用\w去找边界,所以对多语言来说这是个不好的特性。
    • \1 \2 \3分别值的第1、2、3个分组所捕获的文本的一个引用
      • 所以用此正则表达式可以用来搜索文本中是否存在重复的单词隔着几个空白字符挨在一起的情况:

        var doubledWord=/([A-Za-z\u00C0-\u1FFF\u2800-\uFFFD]+)\s+\1/gi;

【JS复习笔记】05 正则表达式的更多相关文章

  1. JS自学笔记05

    JS自学笔记05 1.例题 产生随机的16进制颜色 function getColor(){ var str="#"; var arr=["0","1 ...

  2. 【JS复习笔记】07 复习感想

    好吧,其实<JavaScript语言精粹>后面还简单介绍了代码风格,优美特性,以及包含的毒瘤.糟粕. 但我很快就看完了,发现其实都在前面讲过了,所以就不写了. 至今为止已经算是把JavaS ...

  3. 【JS复习笔记】02 对象与函数

    好吧,因为很重要的事情,几天没写笔记了. 关于对象: ||可以用来填充默认值,如:myApp.name || "无" &&可以用来避免错误,myApp.NameOb ...

  4. 【JS复习笔记】03 继承(从ES5到ES6)

    前言 很久以前学习<Javascript语言精粹>时,写过一个关于js的系列学习笔记. 最近又跟别人讲什么原型和继承什么的,发现这些记忆有些模糊了,然后回头看自己这篇文章,觉得几年前的学习 ...

  5. 【JS复习笔记】06 方法

    数组的方法: array.concat   一个数组去连接另一个数组,返回一个合成数组.var arrC=arrA.concat(arrB,'asd','sad',true,1.5); array.j ...

  6. 【JS复习笔记】04 数组

    JS里的数组其实并不是一个数组,它其实是一个对象,a[1]这种调用方式其实就是一个字面量为1的属性. 因为这东西实际上是一个对象,所以你就可以理解下面这种声明了吧! var arrName=['我可以 ...

  7. 【JS复习笔记】03 继承

    关于继承 好吧,说到底JS还是原型继承的,而不是类继承.所以在这个上面要经常用到prototype去继承另一个对象. 所有的构造器函数都约定命名为首字母大写的形式,并且不以首字母大写的形式拼写任何其它 ...

  8. 【JS复习笔记】01 基本语法

    数字: JS只有一种数字类型,相当于double.(不知道为什么,我每次打double输入法都会出现逗比了三个字) NaN是一个数值,可以用isNaN(number)检测NaN Infinity表示所 ...

  9. 【JS复习笔记】00 序

    作为一个前端苦手,说是复习,你就当我是重学好了. 好吧,我当然不可能抱着一个砖头去复习,所以捡了本薄的来读——<JavaScript语言精粹>. 当初带我的人说这本书挺好,就看这本书好了. ...

随机推荐

  1. git第一次提交代码到远程仓库

    博客搬家了,本文新地址:http://www.zicheng.net/article/4 感谢支持 本操作说明是先有代码,后来创建git仓库,然后把本地代码提交到远程仓库的操作步骤: 1.初始化 在当 ...

  2. Spring3系列13-Controller和@RequestMapping

    Spring3系列13-Controller和@RequestMapping Controller返回值,String或者ModelAndView @RequestMapping关联url @Requ ...

  3. 使用B或BL跳转时,下一条指令的地址是这样计算的

    B跳转指令:它是个相对跳转指令,其机器码格式如下: [31:28]位是条件码:[27:24]位为“1010”(0xeaffffff)时,表示B跳转指令,为“1011”时,表示BL跳转指令:[23:0] ...

  4. OBS---环境配置之#include <D3DX10.h>报错

    一.先贴错误 因为这个笔记主要记录我如何整好这个OBS源码环境的,给需要的童鞋一个参考 1.1.#include <D3DX10.h>  报错 没有这个 解决方案:把2,3先解决了就水到渠 ...

  5. SSAS:概念梳理

    Dimension Objects 原文 A simple Dimension object is composed of basic information, attributes, and hie ...

  6. 跟随标准与Webkit源码探究DOM -- 获取元素之querySelector,querySelectorAll

    使用CSS选择器获取元素 -- querySelector,querySelectorAll(HTML5) 标准 W3C Selector API Level 1为Document,DocumentF ...

  7. 安卓开发笔记——关于图片的三级缓存策略(内存LruCache+磁盘DiskLruCache+网络Volley)

    在开发安卓应用中避免不了要使用到网络图片,获取网络图片很简单,但是需要付出一定的代价——流量.对于少数的图片而言问题不大,但如果手机应用中包含大量的图片,这势必会耗费用户的一定流量,如果我们不加以处理 ...

  8. 解决Deprecated: mysql_connect(): The mysql extension is deprecated and will be removed in the future:

    php 5个版本,5.2.5.3.5.4.5.5,怕跟不上时代,新的服务器直接上5.5,但是程序出现如下错误:Deprecated: mysql_connect(): The mysql extens ...

  9. scanf中的[]

    今天被问到一个问题,如何用scanf将 hello-my-world中的三个单词, hello my world 分别放到三个char数组中去 于是用到了scanf中的[] [ ] 扫描字符集合,比如 ...

  10. cocos2d-x开发: 场景实体(entity)管理

    公司现在开新项目,主题的框架部分都是我自己在做,不用受到别人的牵制,所以还算是比较的自由,很好发挥. 游戏并不大,所以需要用到的地方并不多.今天花了一些时间写了场景entity管理的部分代码,还没有完 ...