1.以 m// 进行匹配

  如:  m/roger/ ,  /roger/ 是它的简写;  在说明  qw// 时可以选择使用任何成对的定界符, 对应m//匹配也可以, 如写成:  m(roger)  m<roger>  m{roger}   m%roger% 或 m[roger] , 也可以使用非成对定界符.

  如果使用 // 作为定界符, 那么前面的m就可以省略, 基本的原则是选择模式中不会出现的符号作为定界符 , 如在写 http:// 的匹配模式时,就可以选用 m{}  作为定界符; 写作: m{^http://} , 否则需要对定界符转义 /^http:\/\//

  常见的定界符是花括号, 在编辑器中也可能具有花括号匹配的功能, 所以便于维护.

2.可选修饰符

  可选, 也称为开关, 可以成组附加在某个正则表达式结尾的定界符右边, 并改变正则表达式的默认行为.

   /i 使模式在匹配时不区分大小写字母

   /s 由于  . 号不能匹配换行符, 这个修饰符会将模式中的每个点号按字符集[\d\D]的效果处理, 即匹配任意字符.

   /x 可以在模式中加入任意空白字符, 匹配时所有空白符都会被忽略, 所以一般此时要匹配的空白符用 \s , 由于在Perl中注释也是一种空白, 所以还可以在模式里加上注释.  #号可以用\#匹配, 同时在注释里面不能有定界符.

$_ = "http://www.baidu\n\n.com/";
$str = "^http://(.)*\.com";
if(m{$str}s){
print "matched!\n"
}
$str2 = '{
-? # 正负
\d+ #整数部分
\.? #小数点
\d+ #小数部分
}x'; $_ = "3.14";
if($str2){
print "matched!\n";
}

  可以任意组合以上修饰符, 先后顺序不会影响结果.

3.锚位

   ^  $ 分别标示字符串的开头和结尾,  /^\s*$/ 可以匹配一个空行.

   \b  单词边界锚位, 匹配任何单词的首尾  /\broger\b/ 只能匹配单词roger, 在文字处理器搜索命令中, 称为整词搜索模式,这里的单词指由\w字符构成的字符集, 在模式中\b一定是偶数个.

4.绑定操作符  =~

  操作符用右边的模式来匹配左边的字符串,  如果没有这个绑定操作, 那么默认绑定$_

  绑定操作符优先级高于赋值符

$roger = "This is a string";
$result = "Roger" =~ /roger/i;
if($result){
print $result."\n";
}

5.模式串中的内插

  正则表达式中可以进行双引号形式的内插, 如果会发生冲突, 就想在双引号内内插一样, 可以为内插变量加上圆括号,例如当 $roger = "roger|hello" 时, 如果不对它加括号, 内插之后模式将变成 以 roger开头或匹配hello的字符串, 显然有语义错误.

$roger = "roger";
$_ = "Roger hello ";
if(/^$roger.*$/is){ #没有对内插变量加括号, 也能得出正确结果
print "matched!\n";
}

6.捕获变量

  当使用括号来对模式串进行分组时, 同时也启动了正则表达式处理引擎的捕获功能, 也就是把括号中模式所匹配的部分字符串暂时记下来的能力, 如果有一对以上的圆括号, 就会有一次以上的捕获, 每个被捕获的对象是原本的字符串, 而不是模式.

  捕获到的字符串都是标量, 保存在标量变量中, 第一个为 $1, $2(在这里也可以看出数字也可以作为变量名,但是只在perl内部使用) , 模式里括号有多少对(组),  匹配变量就有多少个.

$_ = "Hello there, neighbor";
if(/(\S+) (\S+), (\S+)/){
print $."\n";
print $."\n";
print $."\n";
}

  生命期: 捕获成功--> 下一次捕获成功,   失败的匹配不会影响上次的成功匹配内容.

  关闭部分捕获: 在不捕获的分组的括号的左括号前面加上  ?:  以表示这个分组不参与捕获

  命名捕捉:管理数字变量比较不方便的时候可以使用; 如:  /(?<label1>\w+) (?:and|or) (?<label2>\w+)/ , 此时反向引用也可以使用:  \g{label} 的写法.

  自动匹配变量:3个特殊的变量, 自动捕获存储. 变量名分别为:  $&  $` 和 $'

if("Hello there, neighbor" =~ /\s(\w+),/){
# 存放字符串里实际匹配模式的部分
print $&."\n"; # there,注意前面一个空格,后面一个逗号
# 保存匹配部分之前略过的部分
print $`."\n"; #Hello
# 保存匹配部分之后剩下的,从来没有进行匹配的部分
print $'."\n"; # neighbor 注意前面一个空格
# 将这3部分连接起来就会得到原串
print "$`$&$'\n"; #Hello there, neighbor
}

7.通用量词

  为了弥补原有的3个量词(? + * )的不足,可以使用通用量词 {m,n} 指定重复次数的范围, 常用量词可以看做是通用量词的简写.

8.元字符优先级

Perl 学习笔记-正则表达式应用篇的更多相关文章

  1. PERL学习笔记---正则表达式的应用

    使用m//匹配 //这是m//(模式匹配)的一种简写.同qw//操作一样,可以使用任何成对的分隔符.因此,可以使用m(fred), m<fred>, m{fred}, m[fred],或者 ...

  2. perl学习笔记——正则表达式

    正则表达式 简单模式:匹配$_中的内容,只需要将模式写在一对斜线(/)中就可以了. 如:#!/usr/bin/env perl use 5.010; $_="yabba dabba doo& ...

  3. PERL学习笔记---正则表达式

    要匹配某个模式(正则表达式)和$_的关系,可以将模式放在正斜线(//)之间,如下:$_ =“yabba dabba doo”;if(/abba/){print “It matched!\n”;} 表达 ...

  4. Noah的学习笔记之Python篇:命令行解析

    Noah的学习笔记之Python篇: 1.装饰器 2.函数“可变长参数” 3.命令行解析 注:本文全原创,作者:Noah Zhang  (http://www.cnblogs.com/noahzn/) ...

  5. Noah的学习笔记之Python篇:函数“可变长参数”

    Noah的学习笔记之Python篇: 1.装饰器 2.函数“可变长参数” 3.命令行解析 注:本文全原创,作者:Noah Zhang  (http://www.cnblogs.com/noahzn/) ...

  6. Noah的学习笔记之Python篇:装饰器

    Noah的学习笔记之Python篇: 1.装饰器 2.函数“可变长参数” 3.命令行解析 注:本文全原创,作者:Noah Zhang  (http://www.cnblogs.com/noahzn/) ...

  7. ASP.NET Core Web开发学习笔记-1介绍篇

    ASP.NET Core Web开发学习笔记-1介绍篇 给大家说声报歉,从2012年个人情感破裂的那一天,本人的51CTO,CnBlogs,Csdn,QQ,Weboo就再也没有更新过.踏实的生活(曾辞 ...

  8. PHP学习笔记之数组篇

    摘要:其实PHP中的数组和JavaScript中的数组很相似,就是一系列键值对的集合.... 转载请注明来源:PHP学习笔记之数组篇   一.如何定义数组:在PHP中创建数组主要有两种方式,下面就让我 ...

  9. c++学习笔记之封装篇(上)

    title: c++学习笔记之封装篇(上) date: 2017-03-12 18:59:01 tags: [c++,c,封装,类] categories: [学习,程序员,c/c++] --- 一. ...

  10. c++学习笔记之继承篇

    title: c++学习笔记之继承篇 date: 2017-03-26 16:36:33 tags: [c++,继承,public,virtual,private,protected] categor ...

随机推荐

  1. hdu 1576 A/B(拓展欧几里得)

    A/B Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...

  2. pyc是什么

    python是解释型语言,需要解释器对程序逐行做出解释,然后直接运行. C语言是编译型语言,PC不需要翻译,直接执行就可以了. java也是解释型语言,不过速度可以跟编译型媲美. 用java举例,ja ...

  3. 数据报表类(BI)项目测试应该如何去啃?

    测试工作是一项十分枯燥的工作,与之相对的测试人员必须有足够的耐心.绝对的细心等素质才能完美的完成这项工作. 从最初的瀑布模式,到如今风靡的敏捷,Devops等:从最初的最后一道关卡到渗透至各个流程,再 ...

  4. EFCodeFirst使用Nuget更新数据库

    在MVC开发中,习惯于使用EF作为数据库操作,相对于传统的Ado.Net的数据库操作方式,EF大大的节省了我们手写SQL语句的时间,即便是传统的使用代码生成的方式.EF操作数据库目前分为两种大的方式. ...

  5. 安装NFS服务,并挂载到开发板

    1.前言 由于嵌入式linux开发大多数使用的是交叉编译环境,难免很频繁的将文件在开发板和PC环境之间传递,最方便的当然是网络传递了,可以使用FTP,以及挂载NFS两种方式了,显然后者更为方便了. 2 ...

  6. 【POJ】2229 Sumsets(递推)

    Sumsets Time Limit: 2000MS   Memory Limit: 200000K Total Submissions: 20315   Accepted: 7930 Descrip ...

  7. IO模型之非阻塞IO

    1. IO模型非阻塞 IO Linux下,可以通过设置socket使其变为 non-blocking.当对一个non-blocking socket执行读操作时,流程是这个样子: 从图中可以看出,当用 ...

  8. Navicat use HTTP Tunnel

    Apply OS: Windows, macOS, Linux Apply Navicat Product: Navicat for MySQL, Navicat for PostgreSQL, Na ...

  9. Python 模块 - jieba

    安装 jieba pip3 install jieba jieba 支持三种分词模式: 精确模式:将句子最精确地切开,适合文本分析 全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不 ...

  10. GRE and VXLAN with Open vSwitch

    因为在OpenStack的Neutron中比较常用,所以参考别人的博客试了下OVS的一些隧道封装功能(GRE,VXLAN). 实验:实现两个host的Network namespace之间的通信,NS ...