0x00 正则表达式概述

正则表达式是描述一些字符串的模式,是由一些元字符和字符组成的字符串,而这些元字符是一些表示特殊意义的字符,即被正则表达式引擎表达的字符表示与其本意不同的一些字符。

0x01 正则表达式的分类

基本正则表达式
扩展正则表达式

# 这两种分类其支持的元字符不同;

0x02 基本正则表达式的元字符

1、匹配字符:

.: 匹配任意单个字符
[]: 匹配范围内的任意单个字符
[^]: 匹配范围外的任意单个字符
[:space:]: 空格
[:upper:]: 大写字母
[:lower:]: 小写字母
[:alpha:]: 所有字母
[:alnum:]: 所有的数字和字母
[:digit:]: 所有的数字
[:punct:]: 所有的标点符号

2、匹配个数:

*: 匹配其前字符任意次(包括0次)
\?: 匹配其前字符0或1次,即至多一次
\+: 匹配其前字符1次或多次,即至少一次
\{m\}: 匹配其前字符m次
\{m,n\}: 匹配其前字符至少m次,至多n次
\{0,n\}: 匹配其前字符至多n次
\{m,\}: 匹配其前字符至少m次

3、位置锚定:

^: 行首锚定
$: 行尾锚定
^PATTERN$: 用于PATTERN来匹配整行
^$: 空白行
^[[:space:]]*$: 空行或包含空白字符的行
单词:非特殊字符组成的连续字符(字符串)都称为单词
\<或\b: 词首锚定
\>或\b: 词尾锚定
\<PATTERN\>: 匹配完整单词

4、分组及引用:

\(\): 将括号内的内容作为一个整体进行匹配
正则表达式引擎会从左第一个左括号对应括号的分组匹配到的内容保存至变量\1中,第二个左括号中匹配到的内容保存至变量\2中,以此类推;
引用:引用是在一个正则表达式当中有可能出现要使用前面分组中所匹配到的内容,而每次分组中匹配到的内容可能不相同,此时要和分组中匹配的内容相同的话就得使用引用。利用\1,\2变量来引用前面对应括号内的PATTERN;
\1
\2
...

0x03 扩展正则表达式的元字符

1、匹配字符:

.: 匹配任意单个字符
[]: 匹配范围内的任意单个字符
[^]: 匹配范围外的任意单个字符
[:space:]: 空格
[:upper:]: 大写字母
[:lower:]: 小写字母
[:alpha:]: 所有字母
[:alnum:]: 所有的数字和字母
[:digit:]: 所有的数字
[:punct:]: 所有的标点符号

2、匹配个数:

*: 匹配其前字符任意次(包括0次)
?: 匹配其前字符0或1次,即至多一次
+: 匹配其前字符1次或多次,即至少一次
{m}: 匹配其前字符m次
{m,n}: 匹配其前字符至少m次,至多n次
{0,n}: 匹配其前字符至多n次
{m,}: 匹配其前字符至少m次

3、位置锚定:

^: 行首锚定
$: 行尾锚定
\<或\b: 词首锚定
\>或\b: 词尾锚定

4、分组及引用:

(): 将括号内的内容作为一个整体进行匹配
\1
\2
...

5、或:

|: |左边的整体或上右边的整体;
C|cat: 表示C或cat
(c|C)at: 表示cat或Cat

0x04 正则表达式的使用和grep的使用

正则表示一般和一些其他的命令一块使用,只要该命令支持正则表达式的引擎,那么就可以使用正则表达式;下面介绍的grep命令就是一个行处理文本工具,其配合正则表达式的使用,大大提高了文本处理的效率。

grep、egrep、fgrep命令的介绍

grep,egrep,fgrep这三个命令同属于一脉,它们的功能是输出模式匹配到的行,其原理是寻找从标准输入的文件中包含被给定模式所匹配到的行,grep命令,默认输出被模式匹配到的行;

  1. grep命令默认支持基本正则表达式;
  2. egrep命令默认支持扩展正则表达式,相当于grep -E;
  3. fgrep命令不支持正则表达式。

grep命令的使用

1、命令格式

grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

2、命令选项:

--color=auto: 对匹配到的文本着色后高亮显示
-i, --ignore-case: 忽略字符的大小写
-o: 显示模式匹配到的字符;
-v, --invert-match: 显示不能被模式匹配到的行;
-E: 支持使用扩展的正则表达式元字符;
-q, --quiet, --silent: 静默模式,即不输出任何信息;
-A #: 显示匹配到的行以及该行后#行
-B #: 显示匹配到的行以及该行前#行
-C #: 显示匹配到的行以及该行前后#行
egrep命令的使用和grep一样,命令选项也相同;
fgrep命令不支持正则表达式元字符;
当无需用到元字符去编写模式式,使用fgrep必能更好;

0x05 练习

1、显示/etc/passwd文件中以bash结尾的行

# grep "bash$" /etc/passwd

2、显示/etc/passwd文件中的两位数或三位数

# grep -E "(\<[1-9][0-9]\>)|(\<[1-9][0-9][0-9]\>)" /etc/passwd

3、显示netstat -tan命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行

# netstat -tan | grep "LISTEN[[:space:]]*$"

4、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名与其shell名相同的行

# grep -E "^([^:]+\>).*\1$" /etc/passwd

5、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)

# grep -E "^(\<root|centos|user1\>)" /etc/passwd | cut -d: -f 3,7

6、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行

# grep -E "\<.*\>\(\)" /etc/rc.d/init.d/functions

7、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名以及目录路径

# echo /etc/sysconfig/network-script/ifdown-eth0 | egrep -o "[[:alpha:]]+[^/]?[[:alnum:]]+$"

# echo /etc/sysconfig/network-script/ifdown-eth0 | egrep -o "(.*)/" | egrep -o "[[:alpha:]]+[^/]?[[:alpha:]]+/$" | egrep -o "[[:alpha:]]+[[:punct:]]?[[:alpha:]]+"

# echo /etc/sysconfig/network-script/ifdown-eth0 | egrep -o "/.*/" | egrep -o ".*[[:alnum:]]+"

8、找出ifconfig命令执行结果中1-255之间的数字

# ifconfig | grep -E -o “\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>”

9、取出ifconfig ens33命令结果中的ip地址

# ifconfig ens33 | grep -E -o "\<([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"

参考

Linux学习笔记之grep命令和使用正则表达式的更多相关文章

  1. linux shell编程学习笔记(二) --- grep命令

    Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达 ...

  2. Linux学习笔记:常用命令grep、iconv、cp、mv、rm

    本篇记录一些近期常用的命令. 一.grep过滤 grep过滤 不包含某些字符串 cat test.txt | grep -v '.jpg' 过滤jpg结尾的图片 cat test.txt | grep ...

  3. linux学习笔记28--监控命令vmstat,iostat, lsof

    linux的监控包括多个方面,常用的是进程,内存,I/O,磁盘空间这三个方面. vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存.进程. ...

  4. linux学习笔记27--监控命令ps和top,free

    Linux中的ps命令是Process Status的缩写.ps命令用来列出系统中当前运行的那些进程.ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信 ...

  5. Linux学习笔记之——基础命令学习

    1.find 按照名字查找:find / -name file_name   2.zip压缩 1) 我想把一个文件repartition.txt和一个目录invader压缩成为amateur.zip: ...

  6. Linux学习笔记15——GDB 命令详细解释【转】

    GDB 命令详细解释 Linux中包含有一个很有用的调试工具--gdb(GNU Debuger),它可以用来调试C和C++程序,功能不亚于Windows下的许多图形界面的调试工具. 和所有常用的调试工 ...

  7. 1)Linux学习笔记:crontab命令

    crond简介 crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程 配置文件 ``` SHELL=/bin/bash PATH=/sbin:/bin:/usr/sbin: ...

  8. Linux学习笔记:常用命令

    个人常用的Linux命令总结(持续更新): 切换目录:cd 列出目录下面的文件:ls 显示当前所在的目录:pwd 操作文件 新建文件:touch file01 查看文件内容:less more cat ...

  9. linux学习笔记30--网络命令ifconfig

    许多windows非常熟悉ipconfig命令行工具,它被用来获取网络接口配置信息并对此进行修改.Linux系统拥有一个类似的工具,也就是ifconfig(interfaces config).通常需 ...

随机推荐

  1. 7.redis 集群模式的工作原理能说一下么?在集群模式下,redis 的 key 是如何寻址的?分布式寻址都有哪些算法?了解一致性 hash 算法吗?

    作者:中华石杉 面试题 redis 集群模式的工作原理能说一下么?在集群模式下,redis 的 key 是如何寻址的?分布式寻址都有哪些算法?了解一致性 hash 算法吗? 面试官心理分析 在前几年, ...

  2. Linux的httpd服务搭建

    在服务搭建前,还要了解一下httpd的日志. 日志有助有工作人员,查看服务器出错状况,更能统计数据分析网页运行情况. PV和UV两大分析 PV  Page View 页面访问量 UV  User Vi ...

  3. Github清除历史提交,保留最新提交

    有时候,需要启动一个新的分支,同时想摒弃历史信息,那么可以使用下面的方法来实现 #克隆git仓库 git clone [URL] #进入git仓库 cd [仓库名] #创建一个名为 new_branc ...

  4. Android架构师吐槽腾讯王者荣耀的程序员,排位匹配算法怎么搞的,每次都输

    腾讯王者荣耀的开发来来来出来聊聊,真是日了狗了,多次离上王者还差两三颗星的时候队友就开始水的一塌糊涂,对面就牛逼的不行. 又连跪回去了,被对面把屎都打出来了,实在忍不住来吐槽,你们这个排位匹配算法到底 ...

  5. 20180606模拟赛T4——数学游戏

    数学游戏 题目描述: 小T又发脑残了,没错,她又要求奇怪的东西,这次她想知道[X,Y]之间整数有多少可以表示成K个不同的B的幂的和形势.如\(x,y,k,b=15,20,2,2\),则有: \[17= ...

  6. 01-docker入门-安装docker

    注意: ubuntu 安装 docker前提是要替换好 Ubuntu 的安装源. 安装步骤: P1:    正常开始 sudo apt-get update sudo apt-get -y insta ...

  7. MySQL 学习网站

    [大型网站] CSDN论坛MySQL版块 https://bbs.csdn.net/forums/MySQL MySlide搜索MySQL https://myslide.cn/slides/1758 ...

  8. Java 构造方法、final

    构造方法:构造(创建)对象时使用的方法. 方法名必须与类名称完全相匹配: 构造方法不需要返回类型: 构造方法不能被static.final等关键字修饰,且不能有return返回语句: 伴随着new被调 ...

  9. chrome-解决该扩展程序未列在 Chrome 网上应用店中

    1.win10添加策略组 复制以下内容到.bat文件中,右键-以管理员身份运行,即可添加策略组 pushd "%~dp0" dir /b C:\Windows\servicing\ ...

  10. spark基础知识四

    围绕spark的其他特性和应用.主要包括以下几个方面 spark自定义分区 spark中的共享变量 spark程序的序列化问题 spark中的application/job/stage/task之间的 ...