C#正则表达式快速入门
作者将自己在学习正则表达式中的心得和笔记作了个总结性文章,希望对初学C#正则表达式的读者有帮助。
[内容]
- 什么是正则表达式
- 涉及的基本的类
- 正则表达式基础知识
- 构建表达式基本方法
- 编写一个检验程序
- 参考资料
[正文]
对于初学者看到类似“\w+@\w+\.\w{1,3}”这样复杂没有规律的字符,就会莫名产生一种恐惧感。其实正则表达式和字符串(String)的使用同样非常简单。下面让我们逐步地走进正则表达式的世界!
什么是正则表达式
正则表达式是用来检验和操作字符串的强大工具。简单的理解正则表达式可以认为是一种特殊的验证字符串。正则表达式常见运用是验证用户输入信息格式,比如上面的那组“\w{1,}@\w{1,}\.\w{1”,实际上就是验证邮件地址是否合法的;当然正则表达式不仅仅是用于验证,可以说只要运用字符串的地方都可以使用正则表达式;
涉及的基本的类
正则表达式在英文中写作(Regular Expression),根据正则表达式的使用范围和单词意思,.NET将其命名空间设置为System.Text.RegularExpressions;
在该命名空间内包括了8个基本的类:Capture、CaptureCollection、Group、GroupCollection、Match、MatchCollection、Regex和RegexCompilationInfo如图1所示;
Capture | 用于单个表达式捕获结果 |
CaptureCollection | 用于一个序列进行字符串捕获 |
Group | 表示单个捕获的结果 |
GroupCollection | 表示捕获组的集会 |
Match | 表示匹配单个正则表达式结果 |
MatchCollection | 表示通过迭代方式应用正则表达式到字符串中 |
Regex | 表示不可变的正则表达式 |
RegexCompilationInfo | 将编译正则表达式需要提供信息 |
[注意]
本文属于初学正则表达式的入门文章,对于高级的分组(Group)及其涉及语法等在这里不做介绍;
正则表达式基础知识
- 基本语法
在正则表达式中拥有一套自己的语法规则,常见语法包括;字符匹配、重复匹配、字符定位、转义匹配和其他高级语法(字符分组、字符替换和字符决策);
字符匹配语法:
字符语法 | 语法解释 | 语法例子 |
---|---|---|
\d | 匹配数字(0~9) | ‘\d’匹配8,不匹配12; |
\D | 匹配非数字 | ‘\D’匹配c,不匹配3; |
\w | 匹配任意单字符 | ‘\w\w’ 匹配A3,不匹配@3; |
\W | 匹配非单字符 | ‘\W’匹配@,不匹配c; |
\s | 匹配空白字符 | ‘\d\s\d’匹配3 d,不匹配abc; |
\S | 匹配非空字符 | ‘\S\S\S’匹配A#4,不匹配3 d; |
. | 匹配任意字符 | ‘....’匹配A$ 5,不匹配换行; |
[…] | 匹配括号中任意字符 | [b-d]匹配b、c、d, 不匹配e; |
[^…] | 匹配非括号字符 | [^b-z]匹配a,不匹配b-z的字符; |
重复匹配语法:
重复语法 | 语法解释 | 语法例子 |
---|---|---|
{n} | 匹配n次字符 | \d{3}匹配\d\d\d,不匹配\d\d或\d\d\d\d |
{n,} | 匹配n次和n次以上 | \w{2}匹配\w\w和\w\w\w以上,不匹配\w |
{n,m} | 匹配n次上m次下 | \s{1,3}匹配\s,\s\s,\s\s\s,不匹配\s\s\s\s |
? | 匹配0或1次 | 5?匹配5或0,不匹配非5和0 |
+ | 匹配一次或多次 | \S+匹配一个以上\S,不匹配非一个以上\S |
* | 匹配0次以上 | \W*匹配0以上\W,不匹配非N*\W |
字符定位语法:
定位语法 | 语法解释 | 语法例子 |
---|---|---|
^ | 定位后面模式开始位置 | |
$ | 前面模式位于字符串末端 | |
\A | 前面模式开始位置 | |
\z | 前面模式结束位置 | |
\Z | 前面模式结束位置(换行前) | |
\b | 匹配一个单词边界 | |
\B | 匹配一个非单词边界 |
转义匹配语法:
转义语法 | 涉及字符(语法解释) | 语法例子 |
---|---|---|
“\”+实际字符 | \ . * + ? | ( ) { }^ $ | 例如:\\匹配字符“\” |
\n | 匹配换行 | |
\r | 匹配回车 | |
\t | 匹配水平制表符 | |
\v | 匹配垂直制表符 | |
\f | 匹配换页 | |
\nnn | 匹配一个8进制ASCII | |
\xnn | 匹配一个16进制ASCII | |
\unnnn | 匹配4个16进制的Uniode | |
\c+大写字母 | 匹配Ctrl-大写字母 | 例如:\cS-匹配Ctrl+S |
- 构造正则表达的方法
构造正则表达式需要涉及Regex类,在Regex类中包括:IsMatch()、Replace()、Split()和Match的类;
(1) IsMatch()方法;
IsMatch()方法实际上是一个返回Bool值得方法,如果测试字符满足正则表达式返回True否则返回False;
例1;判断是非成都地区电话号码合法;
分析:成都地区电话号码组成028********,前面为固定区号028,后面满足8位数字;
设计正则表达式:028\d{8}(解释:028区号固定,后面为8个数字\d组成);
程序代码,如图2所示:
(2) Replace()方法;
Replace()方法实际上是一种替换的方法,替换匹配正则表达式匹配模式;
例2:在发布带有公开电子邮件地址的文章时,�滻@λAT避免产生垃圾邮件;
分析:首先需要判断文章中电子邮箱地址,然后执行替换
设计正则表达式:判断电子邮箱表达式”\w{1,}@w{1,}\\.”;
程序代码:如图3所示;
(3) Split()方法;
Split()方法实际上是拆分的方法,根据匹配正则表达式进行拆分储存在字符串数组中;
例3:从群发邮件地址中读取所有邮件地址;
分析:群发邮件采用“;”作为分割符,需要通过“;”进行拆分
程序代码:如图4所示;
构建表达式基本方法
构造Regex对象的构造函数包括两个重载,一个是不含参数的构造、另外一个是含有参数的构造函数;
- 基本形式Regex(string pattern);
- 重载形式Regex(string pattern,RegexOptions);
补充:RegexOptions属于枚举类型,包括IgnoreCase(忽略大小写)、ReghtToLeft(从右向左)、None(默认)、CultureInvariant(忽略区域)、Multline(多行模式)和SingleLine(单行模式);
例4,建立一个合法ISBN验证格式;
分析:ISBN格式为X-XXXXX-XXX-X;
正则表达式格式:\d-\d{5}-\d{3}-\d
构造该正则表达式函数Regex ISBNRegex = new Regex(表达式,参数为空)
详细代码:如图5所示;
C#正则表达式快速入门的更多相关文章
- [.net 面向对象程序设计进阶] (2) 正则表达式 (一) 快速入门
[.net 面向对象程序设计进阶] (2) 正则表达式 (一) 快速入门 1. 什么是正则表达式? 1.1 正则表达式概念 正则表达式,又称正则表示法,英文名:Regular Expression(简 ...
- Linux快速入门03-系统管理
这部分将涉及常用的各类linux命令和一些系统高级管理特性,尤其是shell script的创建,这部分在系统自动化运维时会很有作用. Linux系列文章 快速入门系列--Linux--01基础概念 ...
- Hadoop快速入门
目的 这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等. 先决条件 ...
- Yacc 与 Lex 快速入门
Yacc 与 Lex 快速入门 Lex 与 Yacc 介绍 Lex 和 Yacc 是 UNIX 两个非常重要的.功能强大的工具.事实上,如果你熟练掌握 Lex 和 Yacc 的话,它们的强大功能使创建 ...
- 程序员带你十天快速入门Python,玩转电脑软件开发(四)
本系列文章立志于从一个已经习得一门编程语言的基础之上,全面介绍Python的相关开发过程和相关经验总结.本篇文章主要是基于上一篇的程序员带你十天快速入门Python,玩转电脑软件开发(三)的基础之上, ...
- lex与yacc快速入门
lex与yacc快速入门 [原创] 声明:原创文章,转载注明出处http://www.cnblogs.com/lucasysfeng/ 联系作者:lucasysfeng@gmail.com 第一节.l ...
- Flask快速入门
flask快速入门 1.1.三种框架比较 Django: 重武器,内部包含了非常多组件:ORM.Form.ModelForm.缓存.Session.中间件.信号等 Flask:短小精悍,内部没有太多组 ...
- jumpservice配置:快速入门
快速入门 说明 到 Jumpserver 会话管理-终端管理 查看 Coco Guacamole 等应用是否在线 一.系统设置 1.1 基本设置 # 修改 url 的"localhost&q ...
- MySql基础笔记(一)Mysql快速入门
Mysql快速入门 一)基本概念 1)表 行被称为记录,是组织数据的单位.列被称为字段,每一列表示记录的一个属性. 2)主键 主键用于唯一的标识表中的每一条记录.可以定义表中的一列或者多列为主键, 但 ...
随机推荐
- 《Effective C++》学习笔记(一)
1.const成员函数不能更改成员变量 #include <bits/stdc++.h> using namespace std; class CtextBlock { public: s ...
- visual studio 高级选项及配置
visual studio 是一款强大的 IDE,所谓 IDE 即是将通过命令行(一系列复杂的参数选项)编译.链接等操作内置到 IDE 的界面按钮处. 为什么新建的工程,可以直接 #include & ...
- RTP 打包H264与AAC
static int h264_parse(Track *tr, uint8_t *data, size_t len) { h264_priv *priv = tr->private_data; ...
- bzoj 1006: 神奇的国度 MCS
题目大意: 弦图的最小染色. 题解: 裸题. #include <vector> #include <cstdio> #include <cstring> #inc ...
- 不重启linuxVMWare虚拟机添加虚拟磁盘
Vsphere Client找到要添加磁盘的虚机,如图所示 点击虚机右键,在出现的下列列表中选择“编辑设置”如图 在打开的虚拟机属性中,在”硬件对话框点击“添加"按钮,如图 在添 ...
- long long 与__int64使用总结
本文摘自网络.原文网址:http://blog.sina.com.cn/s/blog_6aa178410100vlwr.html 前言: 在16位环境下,int/unsigned int 占16位,l ...
- numpy.ones(shape, dtype=None, order='C')
Return a new array of given shape and type, filled with ones. Parameters: shape : int or sequence of ...
- [hdu4372]counting buildings
解题关键: n的环排列的个数与n-1个元素的排列的个数相等. 首先可以肯定,无论从最左边还是从最右边看,最高的那个楼一定是可以看到的,从这里入手. 假设最高的楼的位置固定,最高楼的编号为n,那么我们为 ...
- 树莓派 Learning 002 装机后的必要操作 --- 03 替换软件源
树莓派 装机后的必要操作 - 替换软件源 我的树莓派型号:Raspberry Pi 2 Model B V1.1 装机系统:NOOBS v1.9.2 树莓派的服务器实在太慢了!会导致你安装一个几M的东 ...
- VS编译器中设置 输出窗口 只显示error,不显示warning 要如何配置
VS编译器中设置 输出窗口 只显示error,不显示warning 要如何配置 在编译大型项目的时候,总是VS编译器的输出窗口总是会出现一堆warning警告,要想在里面找到error错误,要使用鼠标 ...