grep
正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]    匹配不属于此集合的任意一个字符
[a-z]   (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
\(...\) 标记此模式为一个分组
\<    单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>    单词末尾定位符
x\{m\} 字符x重复匹配m次
x\{m,\} 字符x至少重复匹配m次,贪婪匹配原则
x\{m,n\} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 \{,\}
\|    匹配条件或
$     行尾定位符

练习:写一个正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255

解:

-255可分解如下:
-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)

整理,易得:

\<\(\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\)\>

运行结果:

egrep
扩展正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]   匹配不属于此集合的任意一个字符
[a-z] (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
(...)   标记此模式为一个分组
\<     单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>     单词末尾定位符
x{m}   字符x重复匹配m次
x{m,} 字符x至少重复匹配m次,贪婪匹配原则
x{m,n} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 {,}
?     等价于 {,}
+     等价于 {,}
|     匹配条件或
$     行尾定位符

由此易看出,扩展正则表达式与正则表达式之间的根本区别为,其增大了元字符的集合范围,增加的元字符有:

+ ? | { } ( )

这使得模式表现的更加简洁。

练习:写一个扩展正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255
解:

0-255可分解如下:
0-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

([-]|[-][-]|[-]{}|[-][-]|[-])

整理,易得:

\<(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]))\>

运行结果:

附录:

//grep options
-?
  同时显示匹配行上下的?行,如:grep - pattern filename同时显示匹配行的上下2行。
-b,--byte-offset
  打印匹配行前面打印该行所在的块号码。
-c,--count
  只打印匹配的行数,不显示匹配的内容。
-f File,--file=File
  从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。
-h,--no-filename
  当搜索多个文件时,不显示匹配文件名前缀。
-i,--ignore-case
  忽略大小写差别。
-q,--quiet
  取消显示,只返回退出状态。0则表示找到了匹配的行。
-l,--files-with-matches
  打印匹配模板的文件清单。
-L,--files-without-match
  打印不匹配模板的文件清单。
-n,--line-number
  在匹配的行前面打印行号。
-s,--silent
  不显示关于不存在或者无法读取文件的错误信息。
-v,--revert-match
  反检索,只显示不匹配的行。
-w,--word-regexp
  如果被\<和\>引用,就把表达式做为一个单词搜索。

正则表达式RE与扩展正则表达式ERE——grep与egrep的更多相关文章

  1. grep和egrep正则表达式

    Linux上文本处理三剑客 grep :文本过滤( 模式:pattern) 工具 grep, egrep, fgrep (不支持正则表达式搜索,但搜索纯文本的数据最快) sed :stream edi ...

  2. Shell基本正则表达式和扩展正则表达式

    BRE和ERE的区别 基本正则表达式(BRE)和扩展正则表达式(ERE)的区别仅仅是元字符(meta charactor)的区别而已. BRE: 只有^$.*[]是元字符 ERE: ^$.[]*+() ...

  3. Linux三剑客之grep 与 egrep

    grep: Linux上文本处理三剑客 grep:文本过滤(模式:pattern)工具; *(grep, egrep, fgrep) sed:stream editor,文本编辑工具: awk:Lin ...

  4. bash基础——grep、基本正则表达式、扩展正则表达式、fgrep

    grep grep全称:Globally search a Regular Expression and Print 全局搜索正则表达式 正规表达式本质上是一种"表示方法", 只要 ...

  5. Linux通配符与基础正则表达式、扩展正则表达式

    在Linux命令行操作或者SHELL编程中总是容易混淆一些特殊字符的使用,比如元字符‘*’号,作为通配符匹配文件名时表示0个到无穷多个任意字符.而作为正则表达式匹配字符串时,表示重复0个到无穷多个的前 ...

  6. egrep 及扩展正则表达式

    grep -E 表示支持扩展的正则表达式 grep -E = egrep 一.字符匹配: 扩展模式下的字符匹配与基本正则表达式的字符匹配相同,如: . 表示任意单个字符 [] 表示范围内人任意单个字符 ...

  7. linux正则表达式之-基础正则表达式(基于grep)

    linux正则表达式: 简单的说,正则表达式就是为处理大量的字符串而定义的一套规则和方法,如:假设@代表123456,!代表abcde.通过定义的这些特殊符号的铺助,系统管理员就可以快速的过滤,替换或 ...

  8. Linux正则表达式grep与egrep

    grep -io "http:/=[A-Z0-9]\{16\}" ./wsxf.txt >wsxf_urls.txt Linux正则表达式grep与egrep 正则表达式:它 ...

  9. grep与正则表达式,grep、egrep和fgrep

    grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同!正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串. ...

随机推荐

  1. erlang http post 发送数据请求

    ibrowse:send_req("http://127.0.0.1/NativePhone.ashx", [{"Content-Type", "ap ...

  2. hiho 1515 : 分数调查 简单bfs

    时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi的学校总共有N名学生,编号1-N.学校刚刚进行了一场全校的古诗文水平测验. 学校没有公布测验的成绩,所以小Hi只能得 ...

  3. 【知识笔记】VS调试问题

    一.无法在web服务器上启动调试,您没有调试web服务器进程的权限,您需要以web服务器的用户账户身份运行,或者具有管理员权限. 现象:手动修改网站项目的启动端口号,调试报错 原因:从Windows ...

  4. 实例-QPSK的fpga实现

  5. 洛谷P2192HXY玩卡片

    题目大意 给你n个数,只包括5和0. 从中取一些数,要求组成的数是90的倍数. 如: 4 5 0 5 0 结果是0 题解 90=9*10,如果一个是90的倍数一定末尾有0,那么这个 数一定是10的倍数 ...

  6. Linux驱动开发基础知识

    常用命令 lsmod: list module,将模块列表显示),功能是打印出当前内核中已经安装的模块列表 insmod: install module,安装模块,功能是向当前内核中去安装一个模块,用 ...

  7. jest js 测试框架-简单方便人性化

    1. 安装 yarn global add jest-cli or npm install -g jest-cli 备注:可以安装为依赖不用全局安装 2. 项目代码 a. 项目初始化 yarn ini ...

  8. linux主次设备号【转载】

    一个字符设备或者块设备都有一个主设备号和次设备号.主设备号和次设备号统称为设 备号.主设备号用来表示一个特定的驱动程序.次设备号用来表示使用该驱动程序的各 设备.例如一个嵌入式系统,有两个LED指示灯 ...

  9. angularJS自定义一个过滤器

    ng允许我们自定义指令 下面来我们自己来定义一个过滤指令:filter,返回一个函数的形式 filter(name,callback(){//name:过滤器的名字,callback:匿名函数 ret ...

  10. RK3288 USB触摸屏无法使用,需要添加PID和VID

    RK3288  Android5.1 现象:USB 接口触摸屏插到板子上,触摸屏无法使用,有可能出现更奇葩的,同一套代码,有的板子可以用,有的板子不能用. 1.打开串口调试,插上触摸屏,读取触摸屏的 ...