正则表达式通常包含字母文本(Literaltext)和元字符(metacharacter)
字母文本指的是普通文本如"abcde"可匹配字符串中任何包含"abcde"的字符串。

元字符则更加灵活运用通用的表达式匹配所有符合此表达式规律的字符串。
C#正则表达式语法一、

匹配单个字符 []——从中选择一个字符匹配

中间支持的类型:单词字符([ae])、非单词字符([!?,;@#$*])、字母范围([A-Z])、数字范围([0])

eg.正则表达式[ae]ffect
可匹配字符串 affect,effect

(此例中"[ae]"为元字符,"ffect"为字母文本)

注意:
1.要在字符类中匹配连字符,那么把连字符号作为第一个字符列出即可。

2.可以在单个正则表达式中包含多个字符类。

eg.[01][0-9]:[0-5][0-9][ap]m可以用来匹配如12:59pm格式的所有时间

^——排除某些字符(在[]中表此意,还可表示字符串的开头)

eg.正则表达式m[^a]t
可匹配字符串
不可匹配字符串 met,mit,m&t……mat

C#正则表达式语法

二、匹配特殊字符

可以使用的特殊字符:

\t——匹配制表符
\r——匹配硬回车符
\f——匹配换页符
\n——匹配换行符

描述表示字符类的元字符:

.——匹配任何除了\n以外的字符(或者在单行模式中的任何字符)
\w——匹配任何单词字符(任何字母或数字)
\W——匹配任何非单词字符(除了字母和数字以外的任何字符)
\s——匹配任何空白字符(包括空格、换行、制表符等)
\S——匹配任何非空白字符(除了空格、换行、制表符等的任何字符)
\d——匹配任何数字字符(0~9的数字)
\D——匹配任何非数字字符(除了0~9以外的任何字符)

表示字符串中字符位置:
^——匹配字符串的开头(或者多行模式下行的开头)。
$——匹配字符串的结尾,或者是字符串结尾“\n”之前的最后一个字符,或者是多行模式中的行结尾。
\A——匹配字符串的开头(忽略多行模式)
\Z——匹配字符串的结尾或字符串结尾“\n”之前的最后一个字符(忽略多行模式)。
\z——匹配字符串的结尾。
\G——匹配当前搜索开始的位置。
\b——匹配单词的边界。
\B——匹配单词的非边界。

注意:

1.句点字符(.)特别有用。可以用它来表示任何一个字符。

eg.正则表达式01.17.84
可匹配字符串 01/17/84,01-17-84,011784,01.17.84

2.可以使用\b匹配单词的边界

eg.正则表达式
可匹配字符串 \blet\blet
不可匹配字符串letter,hamlet

3.\A和\z在确保字符串所包含的是某个表达式,而不是其他内容时很用。

eg.要判断Text控件是否包含单词"sophia",而不含任何额外的字符、换行符或者空白。

\Asophia\z

4.句点字符(.)具有特殊的含义,若要表示字母字符本身的含义,在前面加一个反斜杠:\.

C#正则表达式语法三、
匹配二选一的字符序列

|——匹配二选一

eg.正则表达式col(o|ou)r
可匹配字符串 color,colour

注意:\b(bill|ted)和\bbill|ted是不同的。

后者还可以匹配"malted"因为\b元字符只应用于"bill"。

C#正则表达式语法四、
用量词匹配 *——匹配0次或多次 +——匹配1次或多次 ?——匹配0次或1次 {n}——恰好匹配n次 {n,}——至少匹配n次 {n,m}——至少匹配n次,
但不多于m次
eg.正则表达式brothers?
可匹配字符串 brother,brothers

eg.正则表达式\bp\d{3,5}
可匹配字符串 \b以p开头,且后跟3~5个数字结尾

注意:也可以把量词与()一起使用,以便把该量词应用到整个字母序列。

eg.正则表达式(The)?schoolisbeautiful.
可匹配字符串 schoolisbeautiful,Theschoolisbeautiful.

C#正则表达式语法五、
识别正则表达式和贪婪 有些量词是贪婪的(greedy).他们会尽可能多的匹配字符。

如量词*匹配0个或多个字符。假设要匹配字符串中任何HTML标签。你可能会用如下正则表达式:

<.*>

现有字符串A<i>quantifier</i>canbe<big>greedy</big>

结果<.*>把<i>quantifier</i>canbe<big>greedy</big>都匹配上了。

要解决该问题,需要与量词一起使用一个特殊的非贪婪字符“?”,因此表达式变化如下:

<.*?>

这样就可以正确匹配<i>、</i>、<big>、</big>。

?能强制量词尽可能少地匹配字符,?还可以用在以下几个量词中:

*?——非贪婪的量词* +?——非贪婪的量词+ ??——非贪婪的量词? {n}?——非贪婪的量词{n} {n,}?——非贪婪的量词
{n,} {n,m}?——非贪婪的量词{n,m}
C#正则表达式语法六、
捕获和反向引用 捕获组(capturegroup)就像是正则表达式中的变量。
捕获组可以捕获正则表达式中的字符模式,并且由正则表达式后面的编号或名称来引用改模式。

()——用来捕获其中的字符串

\数字——用编号来引用

eg.

正则表达式 (\w)(\w)\2\1
可匹配字符串abba

注意:
1.反向引用用来匹配html标签非常有效如<(\w+)></\1>可以匹配<table></table>等类似格式的标签。

2.默认情况下,只要使用圆括号,就会捕获圆括号内所包含的字符,可以使用n选项来禁用这个默认行为(在第7条里会详细介绍),
或者添加?:到圆括号中。eg.(?:sophia)或(?n:sophia)此时不会捕获sophia。

(?<捕获组名称>)\k<捕获组名称>——用名称来引用

eg.

正则表达式(?<sophia>\w)abc\k<sophia>
可匹配字符串 xabcx

注意:在替换模式中使用捕获组的格式略有不同,要用$1、$2等来按数值引用捕获,用${sophia}等名称来按名称引用捕获组

C#正则表达式语法七、
设置正则表达式的选项

eg.

stringstr="<h4>sophia</h4>"

RegExobjRegEx=newRegEx("<h(d)>(.*?)</h1>");
Response.Write(objRegEx.Replace(str,"<fontsize=$1>$2</font>"));

i——所执行的匹配是不区分大小写的(.net中的属性为IgnoreCase) m——指定多行模式(.net中的属性为Multiline)
n——只捕获显示命名或编号的组(.net中的属性为ExplicitCapture) c——编译正则表达式,这样会产生较快的执行速度,但启动会变慢(.net中的属性为Compiled)
s——指定单行模式(.net中的属性为SingleLine) x——消除非转义空白字符和注释(.net中的属性为IgnorePatternWhitespace)
r——搜索从右到左进行(.net中的属性为RightToLeft) -——表示禁用。
eg.(?im-r:sophia)允许不区分大小写匹配sophia,使用多行模式,但禁用了从右到左的匹配。

注意:
1.m会影响如何解析起始元字符(^)和结束元字符($)。
在默认情况^和$只匹配整个字符串的开头,即使字符串包含多行文本。如果启用了m,那么它们就可以匹配每行文本的开头和结尾。

2.s会影响如何解析句点元字符(.)。通常一个句点能匹配除了换行符以外的所有字符。但在单行模式下,句点也能匹配一个换行符。

C#正则表达式语法规则详解的更多相关文章

  1. JSON 语法规则详解

    JSON 的语法规则十分简单,无论用何种方法总结都只有数条而已,它参考了 C 语言家族的一些习惯,学习起来并不会感到陌生. 回顾JSON 的五点语法 1)- 数组(Array)用方括号("[ ...

  2. Nginx 常用全局变量 及Rewrite规则详解

    每次都很容易忘记Nginx的变量,下面列出来了一些常用 $remote_addr //获取客户端ip $binary_remote_addr //客户端ip(二进制) $remote_port //客 ...

  3. 53个Oracle语句优化规则详解(转)

    Oracle sql 性能优化调整  1. 选用适合的ORACLE优化器        ORACLE的优化器共有3种:a. RULE (基于规则)   b. COST (基于成本) c. CHOOSE ...

  4. JMeter 后置处理器之正则表达式提取器详解

    后置处理器之正则表达式提取器详解   by:授客 QQ:1033553122 1. 添加正则表达式提取器 右键线程组->添加->后置处理器->正则表达式提取器 2. 提取器配置介绍 ...

  5. ESLint 规则详解(二)

    接上篇 ESLint 规则详解(一) 前端界大神 Nicholas C. Zakas 在 2013 年开发的 ESLint,极大地方便了大家对 Javascript 代码进行代码规范检查.这个工具包含 ...

  6. Apache Rewrite 规则详解

    在开篇之前: 我想说这篇文章其实是我刚刚接触Rewrite的时候学习的文档,应属转载,但是在这里我不想写明原地址,原因是文章中大多数给出的配置命令经实验都是错误的.需要原文的可以在谷歌上搜索一下&qu ...

  7. QuantLib 金融计算——基本组件之天数计算规则详解

    目录 天数计算规则详解 定义 30 / 360 法 30/360 US 30/360 Bond Basis 30E/360 30E/360 ISDA Actual 法 Actual/Actual IC ...

  8. Atitit.jdk java8的语法特性详解 attilax 总结

    Atitit.jdk java8的语法特性详解 attilax 总结 1.1. 类型推断这个特别有趣的.鲜为人知的特性1 2. Lambda1 2.1. 内部迭代意味着改由Java类库来进行迭代,而不 ...

  9. css样式继承规则详解

    css样式继承规则详解 一.总结 一句话总结:继承而发生样式冲突时,最近祖先获胜(最近原则). 1.继承中哪些样式不会被继承? 多数边框类属性,比如象Padding(补白),Margin(边界),背景 ...

随机推荐

  1. UITouch 触摸事件处理(实例)

    来源:http://www.open-open.com/lib/view/open1341882439838.html 1. UITouch 的主要方法: - (void)touchesBegan:( ...

  2. jps命令

    转载:http://blog.csdn.net/wanglha/article/details/40181701 ps -- JavaVirtual Machine Process Status To ...

  3. ASPxGridView改变列颜色

    protected void ASPxGridView1_HtmlDataCellPrepared(object sender, ASPxGridViewTableDataCellEventArgs ...

  4. [ActionScript 3.0] Away3D 天空盒(skybox)例子

    /* SkyBox example in Away3d Demonstrates: How to use a CubeTexture to create a SkyBox object. How to ...

  5. Java如何获取文件编码格式

    1:简单判断是UTF-8或不是UTF-8,因为一般除了UTF-8之外就是GBK,所以就设置默认为GBK.  按照给定的字符集存储文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原 ...

  6. python 之编码问题详解

    前在一个项目中遇到用post提交一个xml,xml中含有中文,对于单独的py文件,使用urllib2.urlopen完全ok,但在django中使用就一直报编码错误,然后在网上看到这篇文章不错,决定m ...

  7. (Array) 一个 N*N 的矩阵,每一行从左到右有序,每一列从上到下有序,都是递增,写个程序,判断一个数是否在矩阵中。

    int search(int d[N][N], int key) { int i1, i2, j1, j2; i1 = j1 = 0; i2 = j2 = N-1; while(i1 < i2 ...

  8. 关于WebView的内存泄露问题

    在一个Activity中包含着一个WebView,通过WebView不停的访问Web页面,会发现内存会一直增长,退出此Activity,甚至杀死此Activity,内存依然没有被释放.这就导致,即使是 ...

  9. arm交叉编译器gnueabi、none-eabi、arm-eabi、gnueabihf、gnueabi区别

    命名规则 交叉编译工具链的命名规则为:arch [-vendor] [-os] [-(gnu)eabi] arch – 体系架构,如ARM,MIPSvendor – 工具链提供商os – 目标操作系统 ...

  10. maven与git

    ================================================== maven的作用 ======================================== ...