按照自己的思路学习Node.Js 随心出发。突破正则冷门知识点,巧妙复习正则常用知识点

标签:AaronYang  茗洋  Node.Js 正则 Javascript

本篇博客地址:http://www.cnblogs.com/AaronYang/p/3979710.html

开发准备(AaronYang原味)(看完加20分)

1你需要有个带开发者工具的浏览器,我这里用chrome浏览器

来这里学习,第一也为巩固自己的知识,二来真的很需要它。正则入门简单,高级理解了也简单,但是因为不经常用,所以过段时间也就忘了
跟正则相似作用的操作:
打开电脑,搜索文件,比如 *.doc  是找出所有.doc结尾的文件,*号是通配符。
SQL: SELECT * FROM Persons WHERE City NOT LIKE '%lon%'      这里的%是通配符,找出包含lon的City
好了,下面主要说正则。

2基础回顾,比较简洁

好了,打开谷歌浏览器,按F12,点击Console
第一个正则-----HelloWorld,学会\b
var hello="hello world";
var reg=/hello world/;
alert(reg.test(hello)) //输出 true
这里/ 正则 /(细节) ,使用了 正则点test方法,test表示括号内的字符串是否符合正则的匹配,符合返回true,不符合返回false
这里的reg的匹配意思是,是否包含hello world,如果想要精确地查找hello world,则需要\b。 \b在正则里表示 单词的开头或者结尾,单词的分界。这里的意思是hello world作为一个单词,中间不能包含任何字符
比如hello world1 都是不符合的,但是 hello world hello world 就符合
如果想要完整匹配,就要 ^hello world$    
^$表示一个正则表达式的整体
var reg=/\bhello world\b/;

     第二个正则-----复习正则基本格式

学会 斜杠类字符(\w \d .) 寓意 加 特殊字符( * + ? {明确数字})  加 正则外的额外说明(g i)    加 正则的额外切割整体和部分的字符(^$ 还有 ()括弧 | )

1.        \w 字母或数字或下划线或汉字,记忆技巧 网站用户名注册可以中文

\d 数字,这个太好记了,因为常用

.   换行符以外的任意字符

\s 任意空白符,记忆技巧s是space的缩写,space是键盘上的空格键,空白的

跟\d 相反匹配的 \D   ,\W,\S   \B 等 。例如\d表示匹配数字,\D就是所有非数字以外的字符

\d -> [0-9]

\D -> [^0-9]

\w -> [a-zA-Z0-9_]

\W ->[^a-zA-Z0-9]

2.        有的 字符 比如 . 号,他不带斜杠,表示正则匹配符号,如果你想匹配  .net  这个字符,你就用 \.   来替代 点号。 斜杠是转义字符,如果你匹配的字符是正则已经预定义好的,你就要用斜杠来转义了

3.        对字符的附加说明

例如 \d+   这里的+号表示 1个以上,\d表示数字,整句话的意思就是 1个以上的数字,加号等同于 {1,} 所以正则也可以这样写 \d{1,}

?  表示 0个或者1个               *号表示 0个或者很多个

接下来就是花括号类型的 说明 {1} 表示 1个

{1,}表示不少于1个

{1,10}表示   不少于1个,不超过10个

4.      /g 表示该表达式将用来在输入字符串中查找所有可能的匹配,返回的结果可以是多个。如果不加/g最多只会匹配一个

/i 表示匹配的时候不区分大小写

/m 表示多行匹配,什么是多行匹配呢?就是匹配换行符两端的潜在匹配。影响正则中的^$符号,有的字符串含有\n也就是多行

5.     其他的

[输入任意字符] 例如 11[029] 表示 匹配110,112,119的字符

[a-z0-9A-Z_]  跟 \w有点像(不考虑中文)

[^123]表示匹配除了1,2,3这3个字符以外的任意字符

.*  表示匹配 任意数量的不包含换行的字符

6. 使用子匹配

可以使用( )进行字匹配

var osVersion = "Ubuntu 8";//其中的8表示系统主版本号
re=/^[a-z]+\s+(\d+)$/i;//用()来创建子匹配
arr =re.exec(osVersion);
alert(arr[0]);//整个osVersion,也就是正则表达式的完整匹配
alert(arr[1]);//8,第一个子匹配,事实也可以这样取出主版本号
alert(arr.length);//2

如果把字符也括起来,则又是一组

7. 反向引用

反向引用标识由正则表达式中的匹配组捕获的子字符串。每个反向引用都由一个编号或名称来标识,并通过“\编号”表示法进行引用。

var color = "#990000";
/#(\d+)/.test(color);
alert(RegExp.$1);//
alert(/(ay)\1/.test("ayay"))//true
re = /(\d+)\s(\d+)/;
str = "1234 5678";
alert(str.replace(re,"$2 $1"));//在这个里面$1表示第一个分组1234,$2则表示5678
alert(RegExp.$2)

中级正则 学习(看完加30分)

1零宽断言 (匹配但是不捕获,不捕获就是不返回值)

正向零宽断言(  =  )
 
写了一些例子,希望你能理解
①  (?=express)          匹配express前面的位置
匹配 21或者24前面的位置,前面是ay,所以匹配ay,符合的只有way21 ay24,由于匹配是ay,不包括21和24(强调),并不是ay21或者是ay24,所以replace时候,替换的只是ay,并不是ay21或者ay24
(?=express) 属于先行断言(零宽度正预测先行断言) 先从字符串右边开始查找21或者24结尾的ay,匹配到后,开始替换,即 先替换的 ay24为test24,然后是 way21替换成wtest21。
 
 
那么和 /ay(21|24)/ig 的区别是什么?
 
/ay(21|24)/ig 则匹配的只有2中两种可能,匹配查找ay21 或者ay24,然后替换
 
 
split的用法,只是用ay开头21或者24结尾作为分组条件
 
 
========================================aaronyang.cnblogs.com========================================
 
② (了解一下,js中的正则不支持) (?<=express)      匹配express后面的位置(Javascript不支持后向查找)
(?<=express)属于后发断言(零宽度正回顾后发断言),先从字符串左边开始查找,例如
(?<=abc).* 可以匹配 abcdefgabc 中的 defgabc 而不是 abcdefg
 
下面有个经典的例子,说明这两个的用法
(?<=\s)\d+(?=\s) 匹配以空白符间隔的数字(再次强调,不包括这些空白符)
 
 负向零宽断言(  !  )   看到感叹号,就知道是  "非",相反的意思
(?!express) 匹配后面跟的不是express的位置
例如:
(?!express) 属于先行断言,从右往左找 ay,第一个是ay24 发现ay后面不能跟24,所以不符合,继续找,找到ay23,符合条件,split出第一个值23 ay24 aaronyang21 2121
继续找,找到 aya22 符合条件,split出 a22,继续找,找到ay221,split出221,最后一个way21不符合,单独一份,最终split结果就是
"way21 ", "221 ", "a22 ", "23 ay24 aaronyang21 2121"
 
故事:bb这个字符串可以理解为一个长木头,第一次在ay23处,把ay两个字母凿了出去,切一段,以此类推,凿了4段,然后打包返回
 
========================================aaronyang.cnblogs.com========================================
当然这里的replace也是,竟然看会了split的,那我把故事稍微改下:
故事:bb这个字符串可以理解为一个长木头,第一次在ay23处,把ay两个字母凿了出去,留个洞,以此类推,凿了4个洞,然后在洞里填上test 4个字母,最后打包返回)
当然对应的也有 Javascript中不支持的 零宽度负回顾后发断言 (?<!express)  匹配前面不是express的位置
 
  (?:express)非捕获性分组
例如:
a(?:y|aronyang) 就是一个比 'ay|aaronyang' 更简略的表达式
区别:
一个捕获性分组,一个非捕获性分组

2贪婪和惰性,贪婪长,懒惰多

当正则表达式中含有 重复类别的限定符时候,后面加个? 号,表示开启懒惰模式

*? 重复任意次,但尽可能少重复
    +? 重复1次或更多次,但尽可能少重复
    ?? 重复0次或1次,但尽可能少重复
    {n,m}? 重复n到m次,但尽可能少重复
    {n,}? 重复n次以上,但尽可能少重复。

例子:

比如  ay2013ay2014ay2012ay2014

第一个是贪婪模式,从左往右,以20开始,找4结尾,取最长的一个字符串

第二个是懒惰模式,从左往右,以20开始,找最近的4,组成一个值,然后继续找,组成其他值,最后数组返回

看replace方法,都是先match值,然后替换的

3注释(知道就好)

.NET 正则可以有注释。

Regex regex = new Regex(@"\ba\w{6}\b", RegexOptions.IgnoreCase);        主要在RegexOptions中    RegexOptions.IgnorePatternWhitespace,忽略表达式中的非转义空白并启用由#标记的注释

例如:

高级正则 学习(看完加30分)

1递归组,平衡匹配,这个有点拗口,主要是分组吧

平衡组
 
 说的是一类案例,比如 html
<div><p>testay</p></div>
p可以是一组,div是一组,看每个标签是否都有个闭合标签,这里检查一下,下面这个例子可以匹配嵌套的标签
<div[^>]*>[^<>]*(((?'Open'<div[^>]*>)[^<>]*)+((?'-Open'</div>)[^<>]*)+)*(?(Open)(?!))</div>
例2,打印出html中  超链接 a中的 href的值
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions; namespace RegMy
{
class Program
{
static void Main(string[] args)
{
Regex reg = new Regex("(?<=<a\\s*.*href=\")[^\"]*(?=\")", RegexOptions.IgnoreCase); string text = "<a href=\"http://www.baidu.com/p/yangyanghaoran?from=zhidao\" class=\"user-name\" target=\"_blank\" id=\"user-name\">yangyanghaoran<i class=\"i-arrow-down\"></i></a><a href=\"333.html\"></a>";
Match m = reg.Match(text);
while (m.Success)
{ //显示匹配开始处的索引值和匹配到的值
Console.WriteLine("Match=[" + m + "]");
CaptureCollection cc = m.Captures;
foreach (Capture c in cc)
{
Console.WriteLine("\tCapture=[" + c + "]");
}
for (int i = ; i < m.Groups.Count; i++)
{
Group group = m.Groups[i];
System.Console.WriteLine("\t\tGroups[{0}]=[{1}]", i, group);
for (int j = ; j < group.Captures.Count; j++)
{
Capture capture = group.Captures[j];
Console.WriteLine("\t\t\tCaptures[{0}]=[{1}]", j, capture);
}
}
//进行下一次匹配.
m = m.NextMatch();
} Console.ReadLine();
}
}
}

效果图:

这一块跟js的正则有点偏了,这里感兴趣的自己百度学习吧

=====================================================================================

备注:

正则表达式对象的方法

test,返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在则返回 true,否则就返回 false。
exec,用正则表达式模式在字符串中运行查找,并返回包含该查找结果的一个数组。
compile,把正则表达式编译为内部格式,从而执行得更快。

match,找到一个或多个正则表达式的匹配。
replace,替换与正则表达式匹配的子串。
search,检索与正则表达式相匹配的值。
split,把字符串分割为字符串数组。

正则表达式对象的属性

source,返回正则表达式模式的文本的复本。只读。
lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的开始位置。
$1...$9,返回九个在模式匹配期间找到的、最近保存的部分。只读。
input ($_),返回执行规范表述查找的字符串。只读。
lastMatch ($&),返回任何正则表达式搜索过程中的最后匹配的字符。只读。
lastParen ($+),如果有的话,返回任何正则表达式查找过程中最后括的子匹配。只读。
leftContext ($`),返回被查找的字符串中从字符串开始位置到最后匹配之前的位置之间的字符。只读。
rightContext ($'),返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符。只读。

 

[AaronYang]那天有个小孩跟我说Js正则的更多相关文章

  1. [AaronYang]那天有个小孩跟我说Js-NodeJS[AY0]-EJS

    按照自己的思路学习Node.Js 随心出发.EJS是Node.js中express框架中使用的一个模版引擎,当然还有Jade 我的学习就靠网上查资料,没有买书系统学,自己整理,如果有用了哪位大神的代码 ...

  2. 那天有个小孩教我WCF[一][2/3]

    接着上次的继续讲吧 我们开始吧 9.创建数据库 use master go --创建库 if exists(select * from sysdatabases where name='NewsDB' ...

  3. 那天有个小孩教我WCF[一][1/3]

    那天有个小孩教我WCF[一][1/3] 既然是小孩系列,当然要有一点基础才能快速掌握,归纳,总结的一个系列,哈哈 前言: 第一篇嘛,不细讲,步步教你创建一个简单SOA案例,对WCF有个基本的认识,我不 ...

  4. (转)那天有个小孩教我WCF[一][1/3]

    原文地址:http://www.cnblogs.com/AaronYang/p/2950931.html 既然是小孩系列,当然要有一点基础才能快速掌握,归纳,总结的一个系列,哈哈 前言: 第一篇嘛,不 ...

  5. 那天有个小孩跟我说LINQ(五)转载

    2  LINQ TO SQL(代码下载)      我们以一个简单的销售的业务数据库为例子         表结构很简单:Users(购买者(用户)表),Products(产品信息表),Sales(销 ...

  6. 那天有个小孩跟我说LINQ(三)转载

    1  LINQ TO Objects续2(代码下载)      新建项目 linq_Ch3控制台程序    1.1 操作字符串        ①查找字符串中包含的大写字母,字符串是由多个char类型组 ...

  7. 那天有个小孩跟我说LINQ(八)学会Func

    文章已经迁移到:http://www.ayjs.net/2013/08/68/ 文章已经迁移到:http://www.ayjs.net/2013/08/68/ 文章已经迁移到:http://www.a ...

  8. 那天有个小孩跟我说LINQ(七)转载

    1  LINQ TO XML(代码下载)        准备:新建项目 linq_Ch7控制台程序,新建一个XML文件夹,我们就轻松地学习一下吧          XDocument         ...

  9. 那天有个小孩跟我说LINQ(六)转载

    2  LINQ TO SQL完结(代码下载)      我们还是接着上次那个简单的销售的业务数据库为例子,打开上次那个例子linq_Ch5 2.1 当数据库中的表建立了主外键 ①根据主键获取子表信息 ...

随机推荐

  1. 用Delphi从内存流中判断图片格式

    https://blog.csdn.net/my98800/article/details/53536774 废话不多说了,利用内存流来判断文件的格式,其实判断文件的前几个字节就可以简单的判断这个文件 ...

  2. 如何解决海量数据的Top K问题

    1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门 ...

  3. day17--JQuery实例

        1.表格选择框--全选,反选,取消 <!DOCTYPE html> <html lang="en"> <head> <meta c ...

  4. python全栈开发day49-jquery的位置信息、事件流、事件对象,事件委托,事件绑定和解绑

    一.昨日内容回顾    1. jQuery的属性操作 1) html属性操作:attr 2) DOM属性操作:prop 3) 类样式操作:addClass.removeClass.toggleClas ...

  5. T9 HDU1298

    就是字典树加dfs 把所有操作封在结构体里面 #include <cstdio> #include <cstring> #include <algorithm> # ...

  6. 9.Django组件-cookie和session

    HTTP协议的无保存状态,对两次请求没有任何关联.每次请求都是相互独立的. 1.cookie简介 什么是会话跟踪技术我们需要先了解一下什么是会话!可以把会话理解为客户端与服务器之间的一次会晤,在一次会 ...

  7. 018 spark on yarn (Job history)的配置,主要是yarn处跳转到历史聚合页面

    一:目标 1.目标 在yarn的8080页面可以跳转到spark的日志18080页面. 因为在运行spark之后,看对应的job的日志,这样直接连接,更合理直接. 2.总结 在后面可以看到,其实不需要 ...

  8. JVM GC-----4、finalize()方法

    finalize()方法是Object类中定义的protect方法.每一个类都可以重写该方法,给出自己的实现.当类在被回收期间,这个方法就可能会被调用到. 为什么说可能?这是由于finalize()的 ...

  9. 设置cookie,获取cookie,删除cookie,修改cookie

    怎么设置cookie,怎么设置cookie以及删除cookie和cookie详解 在操作cookie之前,先来看一下cookie长什么样. 可以看到,cookie是一个个键值对(“键=值”的形式)加上 ...

  10. nc高级应用

    参数介绍: nc.exe -h即可看到各参数的使用方法. 基本格式:nc?[-options]?hostname?port[s]?[ports]?... nc?-l?-p?port?[options] ...