grep
正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]    匹配不属于此集合的任意一个字符
[a-z]   (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
\(...\) 标记此模式为一个分组
\<    单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>    单词末尾定位符
x\{m\} 字符x重复匹配m次
x\{m,\} 字符x至少重复匹配m次,贪婪匹配原则
x\{m,n\} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 \{,\}
\|    匹配条件或
$     行尾定位符

练习:写一个正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255

解:

-255可分解如下:
-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)

整理,易得:

\<\(\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\)\>

运行结果:

egrep
扩展正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]   匹配不属于此集合的任意一个字符
[a-z] (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
(...)   标记此模式为一个分组
\<     单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>     单词末尾定位符
x{m}   字符x重复匹配m次
x{m,} 字符x至少重复匹配m次,贪婪匹配原则
x{m,n} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 {,}
?     等价于 {,}
+     等价于 {,}
|     匹配条件或
$     行尾定位符

由此易看出,扩展正则表达式与正则表达式之间的根本区别为,其增大了元字符的集合范围,增加的元字符有:

+ ? | { } ( )

这使得模式表现的更加简洁。

练习:写一个扩展正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255
解:

0-255可分解如下:
0-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

([-]|[-][-]|[-]{}|[-][-]|[-])

整理,易得:

\<(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]))\>

运行结果:

附录:

//grep options
-?
  同时显示匹配行上下的?行,如:grep - pattern filename同时显示匹配行的上下2行。
-b,--byte-offset
  打印匹配行前面打印该行所在的块号码。
-c,--count
  只打印匹配的行数,不显示匹配的内容。
-f File,--file=File
  从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。
-h,--no-filename
  当搜索多个文件时,不显示匹配文件名前缀。
-i,--ignore-case
  忽略大小写差别。
-q,--quiet
  取消显示,只返回退出状态。0则表示找到了匹配的行。
-l,--files-with-matches
  打印匹配模板的文件清单。
-L,--files-without-match
  打印不匹配模板的文件清单。
-n,--line-number
  在匹配的行前面打印行号。
-s,--silent
  不显示关于不存在或者无法读取文件的错误信息。
-v,--revert-match
  反检索,只显示不匹配的行。
-w,--word-regexp
  如果被\<和\>引用,就把表达式做为一个单词搜索。

正则表达式RE与扩展正则表达式ERE——grep与egrep的更多相关文章

  1. grep和egrep正则表达式

    Linux上文本处理三剑客 grep :文本过滤( 模式:pattern) 工具 grep, egrep, fgrep (不支持正则表达式搜索,但搜索纯文本的数据最快) sed :stream edi ...

  2. Shell基本正则表达式和扩展正则表达式

    BRE和ERE的区别 基本正则表达式(BRE)和扩展正则表达式(ERE)的区别仅仅是元字符(meta charactor)的区别而已. BRE: 只有^$.*[]是元字符 ERE: ^$.[]*+() ...

  3. Linux三剑客之grep 与 egrep

    grep: Linux上文本处理三剑客 grep:文本过滤(模式:pattern)工具; *(grep, egrep, fgrep) sed:stream editor,文本编辑工具: awk:Lin ...

  4. bash基础——grep、基本正则表达式、扩展正则表达式、fgrep

    grep grep全称:Globally search a Regular Expression and Print 全局搜索正则表达式 正规表达式本质上是一种"表示方法", 只要 ...

  5. Linux通配符与基础正则表达式、扩展正则表达式

    在Linux命令行操作或者SHELL编程中总是容易混淆一些特殊字符的使用,比如元字符‘*’号,作为通配符匹配文件名时表示0个到无穷多个任意字符.而作为正则表达式匹配字符串时,表示重复0个到无穷多个的前 ...

  6. egrep 及扩展正则表达式

    grep -E 表示支持扩展的正则表达式 grep -E = egrep 一.字符匹配: 扩展模式下的字符匹配与基本正则表达式的字符匹配相同,如: . 表示任意单个字符 [] 表示范围内人任意单个字符 ...

  7. linux正则表达式之-基础正则表达式(基于grep)

    linux正则表达式: 简单的说,正则表达式就是为处理大量的字符串而定义的一套规则和方法,如:假设@代表123456,!代表abcde.通过定义的这些特殊符号的铺助,系统管理员就可以快速的过滤,替换或 ...

  8. Linux正则表达式grep与egrep

    grep -io "http:/=[A-Z0-9]\{16\}" ./wsxf.txt >wsxf_urls.txt Linux正则表达式grep与egrep 正则表达式:它 ...

  9. grep与正则表达式,grep、egrep和fgrep

    grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同!正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串. ...

随机推荐

  1. .net core web 中使用app.UseRouter的几种使用方式

    public void Configure(IApplicationBuilder app, IHostingEnvironment env, ILoggerFactory loggerFactory ...

  2. FTRL笔记

    这篇笔记主要参考冯杨的五篇博客:在线最优化求解(Online Optimization).因为对于在线学习方法,稀疏性问题需要特别关注:每次在线学习一个新 instance 的时候,优化方向并不一定是 ...

  3. WPF 中使用附加属性,将任意 UI 元素或控件裁剪成圆形(椭圆)

    不知从什么时候开始,头像流行使用圆形了,于是各个平台开始追逐显示圆形裁剪图像的技术.WPF 作为一个优秀的 UI 框架,当然有其内建的机制支持这种圆形裁剪. 不过,内建的机制仅支持画刷,而如果被裁剪的 ...

  4. 《selenium2 python 自动化测试实战》(15)——调用js控制滚动条等操作

    看代码: # coding=utf-8 from time import sleepfrom selenium import webdriver driver = webdriver.Firefox( ...

  5. .OPF文件剖析

    OPF文档是epub电子书的核心文件,且是一个标准的XML文件,依据OPF规范,主要由五个部分组成: 1.<metadata>,元数据信息,由两个子元素组成: <dc-metadat ...

  6. LG1343 地震逃生

    题意 汶川地震发生时,四川**中学正在上课,一看地震发生,老师们立刻带领x名学生逃跑,整个学校可以抽象地看成一个有向图,图中有n个点,m条边.1号点为教室,n号点为安全地带,每条边都只能容纳一定量的学 ...

  7. ballerina 学习十四 values && types

    ballerina 包含的数据类型有string int map array record boolean ojbect function table tuple any 简单说明 数据类型和其他语言 ...

  8. scrapy docker 基本部署使用

    1. 简单项目 pip install scrapy scrapy startproject appdemo     2. 项目代码 a. 项目代码结构 ├── Dockerfile ├── READ ...

  9. 聊聊Oracle 11g的Snapshot Standby Database(下)

    3.Snapshot Standby行为研究 下面我们分析一下Snapshot Standby的工作性质和行为性质.我们在主库方向研究当前状态. --主库日志情况 SQL> select gro ...

  10. 最大开源代码sourceforge 简介 及视音频方面常用的开源代码

    所有的音视频凯源代码在这里:http://sourceforge.net/directory/audio-video/os:windows/,你可以下载分析,视频不懂请发邮件给我,帮你分析. 0.视频 ...