grep: Global search REgular expression and Print out the line.
  作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查;打印匹配到的行;
  模式:由正则表达式的元字符及文本字符所编写出的过滤条件;


  
正则表达式引擎;

  grep [OPTIONS] PATTERN [FILE...]
  grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

    OPTIONS:
      --color=auto:对匹配到的文本着色后高亮显示;
      -i:ignorecase,忽略字符的大小写;
      -o:仅显示匹配到的字符串本身;
      -v, --invert-match:显示不能被模式匹配到的行;
      -E:支持使用扩展的正则表达式元字符;
      -q, --quiet, --silent:静默模式,即不输出任何信息;

      -A #:after, 后#行
      -B #:before,前#行
      -C #:context,前后各#行

    基本正则表达式元字符:
      字符匹配:
      . :匹配任意单个字符;
      []:匹配指定范围内的任意单个字符;
      [^]:匹配指定范围外的任意单个字符;
        [:digit:]、[:lower:]、[:upper:]、[:alpha:]、[:alnum:]、[:punct:]、[:space:]

    匹配次数:用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数;默认工作于贪婪模式;
      *:匹配其前面的字符任意次;0,1,多次;
        例如:grep "x\+y"
             abxy
           aby
           xxxxxy
           yab
      .*:匹配任意长度的任意字符
      \?:匹配其前面的字符0次或1次;即其前面的字符是可有可无的;
      \+:匹配其前面的字符1次或多次;即其面的字符要出现至少1次;
      \{m\}:匹配其前面的字符m次;
      \{m,n\}:匹配其前面的字符至少m次,至多n次;
      \{0,n\}:至多n次
      \{m,\}:至少m次

    位置锚定:
      ^:行首锚定;用于模式的最左侧;
      $:行尾锚定;用于模式的最右侧;
      ^PATTERN$:用于PATTERN来匹配整行;
      ^$:空白行;
      ^[[:space:]]*$:空行或包含空白字符的行;

      单词:非特殊字符组成的连续字符(字符串)都称为单词;

      \< 或 \b:词首锚定,用于单词模式的左侧;
      \> 或 \b:词尾锚定,用于单词模式的右侧;
      \<PATTERN\>:匹配完整单词;

  练习:
    1、显示/etc/passwd文件中不以/bin/bash结尾的行;
      ~]# grep -v "/bin/bash$" /etc/passwd

    2、找出/etc/passwd文件中的两位数或三位数;
      ~]# grep "\<[0-9]\{2,3\}\>" /etc/passwd

    3、找出/etc/rc.d/rc.sysinit或/etc/grub2.cfg文件中,以至少一个空白字符开头,且后面非空白字符的行;
      ~]# grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg

    4、找出"netstat -tan"命令的结果中以'LISTEN'后跟0、1或多个空白字符结尾的行;
      ~]# netstat -tan | grep "LISTEN[[:space:]]*$"

  分组及引用
    \(\):将一个或多个字符捆绑在一起,当作一个整体进行处理;
      \(xy\)*ab

    Note:分组括号中的模式匹配 到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
    \1:模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
    \2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
    \3
    ...

      He loves his lover.
      He likes his lover.
      She likes her liker.
      She loves her liker.

      ~]# grep "\(l..e\).*\1" lovers.txt

    后向引用:引用前面的分组括号中的模式所匹配到的字符;

egrep:

  支持扩展的正则表达式实现类似于grep文本过滤功能;grep -E

  egrep [OPTIONS] PATTERN [FILE...]
    选项:
      -i, -o, -v, -q, -A, -B, -C
      -G:支持基本正则表达式

    扩展正则表达式的元字符:
    字符匹配:
      .:任意单个字符
      []:指定范围内的任意单个字符
      [^]:指定范围外的任意单个字符

    次数匹配:
      *:任意次,0,1或多次;
      ?:0次或1次,其前的字符是可有可无的;
      +:其前字符至少1次;
      {m}:其前的字符m次;
      {m,n}:至少m次,至多n次;
      {0,n}
      {m,}

    位置锚定
      ^:行首锚定;
      $:行尾锚定;
      \<, \b:词首锚定;
      \>, \b:词尾锚定;

    分组及引用:
      ():分组;括号内的模式匹配到的字符会被记录于正则表达式引擎的内部变量中;
      后向引用:\1, \2, ...
    或:
      a|b:a或者b;
        C|cat:C或cat
        (c|C)at:cat或Cat

    练习:
      1、找出/proc/meminfo文件中,所有以大写或小写S开头的行;至少有三种实现方式;
        ~]# grep -i "^s" /proc/meminfo
        ~]# grep "^[sS]" /proc/meminfo
        ~]# grep -E "^(s|S)" /proc/meminfo

      2、显示肖前系统上root、centos或user1用户的相关信息;
        ~]# grep -E "^(root|centos|user1)\>" /etc/passwd

      3、找出/etc/rc.d/init.d/functions文件中某单词后面跟一个小括号的行;
        ~]# grep -E -o "[_[:alnum:]]+\(\)" /etc/rc.d/init.d/functions

      4、使用echo命令输出一绝对路径,使用egrep取出基名;
        ~]# echo /etc/sysconfig/ | grep -E -o "[^/]+/?$"

      进一步:取出其路径名;类似于对其执行dirname命令的结果;

      5、找出ifconfig命令结果中的1-255之间的数值;
        ~]# ifconfig | grep -E -o "\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"

      6、课外作业:找出ifconfig命令结果中的IP地址;

      7、添加用户bash, testbash, basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
        ~]# grep -E "^([^:]+\>).*\1$" /etc/passwd

fgrep:不支持正则表达式元字符;
  当无需要用到元字符去编写模式时,使用fgrep必能更好;

【Linux】【Shell】【text】grep的更多相关文章

  1. 【Linux下自定义Shell终端提示符】

    目录 基本转义符 字体颜色 背景颜色 移动光标 @ Linux系统终端提示符的特征由系统环境变量 PS1(Prompt String One)定义. 我们可以通过命令echo $PS1来查看当前设置, ...

  2. 【Linux&amp;Unix--open/close/write/read系统调用】

    个人学习整理.如有不足之处,请不吝不吝赐教. 转载请注明:@CSU-Max 系列博文:      Linux&Unix学习第一弹 -- 文件描写叙述符与权限  Linux&Unix学习 ...

  3. 【Linux运维-集群技术进阶】Nginx+Keepalived+Tomcat搭建高可用/负载均衡/动静分离的Webserver集群

    额.博客名字有点长.. . 前言 最终到这篇文章了,心情是有点激动的. 由于这篇文章会集中曾经博客讲到的全部Nginx功能点.包含主要的负载均衡,还有动静分离技术再加上这篇文章的重点.通过Keepal ...

  4. 【linux之设备,分区,文件系统】

    一.设备 IDE磁盘的设备文件采用/dev/hdx来命名,分区则采用/dev/hdxy来命名,其中x表示磁盘(a是第一块磁盘,b是第二块磁盘,以此类推), y代表分区的号码(由1开始,..3以此类推) ...

  5. 【linux之挂载,Raid,LVM】

    一.挂载,卸载 挂载:将新的文件系统关联至当前根文件系统卸载:将某文件系统与当前根文件系统的关联关系移除 cat /etc/mtab 存储着已经挂载的文件系统 (跟 mount 一样) mount:显 ...

  6. 【linux之进程管理,系统监控】

    一.进程管理 前台进程:一般是指占据着标准输入和/或标准输出的进程后台进程:不占据默认开启的进程都是前台进程ctrl+C 中断ctrl+z 从前台转入后台bg 后台进程编号 让其在后台运行ls -R ...

  7. 【python中调用shell命令使用PIPE】使用PIPE作为stdout出现假卡死的情况——将stdout重定向为输出到临时文件

    在Python中,调用:subprocess.Popen(cmd, stdout = PIPE, stderr = PIPE, shell= true)的时候,如果调用的shell命令本身在执行之后会 ...

  8. 【Linux磁盘优化管理--RAID和LVM】

    在现阶段的企业环境中,为了数据的安全性及完整性必须要有一个合理的存储方案.面对着每秒可能产生超过几TB的数据,考虑到磁盘能不能实现 热冗余,及扩容,缩容.Linux给出了RAID(磁盘阵列)以及LVM ...

  9. 【Linux 内核网络协议栈源码剖析】网络栈主要结构介绍(socket、sock、sk_buff,etc)

    原文:http://blog.csdn.net/wenqian1991/article/details/46700177 通过前面的分析,可以发现,网络协议栈中的数据处理,都是基于各类结构体,所有有关 ...

  10. 【linux之链接,函数,随机数】

    一.链接 硬链接(hard link):同一个文件使用了多个别名.新建文件是已经存在的一个别名,,当原文件删除时,新建的文件仍然可以使用.硬链接和原来的文件没有什么区别,而且共享一个inode号.通过 ...

随机推荐

  1. Cain工具的使用

    这次是用windows xp当肉鸡,用Windows2003进行监听 这是一个基于ARP协议的漏洞的攻击 先要确认两个虚拟机之间能够互相ping通和都能正常访问网页 首先安装好Cain后,张这个样子: ...

  2. [源码解析] PyTorch 分布式(2) ----- DataParallel(上)

    [源码解析] PyTorch 分布式(2) ----- DataParallel(上) 目录 [源码解析] PyTorch 分布式(2) ----- DataParallel(上) 0x00 摘要 0 ...

  3. 03 | 变量的解构赋值 | es6

    变量的解构赋值 数组的解构赋值 基本用法 ES6 允许按照一定模式,从数组和对象中提取值,对变量进行赋值,这被称为解构(Destructuring). 以前,为变量赋值,只能直接指定值. let a ...

  4. 带你理解MST性质

    写在前面 最小生成树的引出 假设要在n个城市之间建立通信联络网,则连通n个城市需要n-1条线路.在这种情况下,我们自然需要考虑一个问题,如何在最节省经费的条件下建立这个网络? 很自然地我们会想到,将各 ...

  5. 通过大量实战案例分解Netty中是如何解决拆包黏包问题的?

    TCP传输协议是基于数据流传输的,而基于流化的数据是没有界限的,当客户端向服务端发送数据时,可能会把一个完整的数据报文拆分成多个小报文进行发送,也可能将多个报文合并成一个大报文进行发送. 在这样的情况 ...

  6. 『学了就忘』Linux软件包管理 — 45、yum源文件详细说明

    目录 1.yum源文件解析 2.查看yum源文件 3.搭建本地光盘yum源 第一步: 第二步: 第三步: 提示:RPM包的在线安装就是yum安装,yum安装需要依据yum源文件内容配置来寻找软件.本文 ...

  7. python 字符串和时间格式(datetime)相互转换-

    2019-03-17 11:00:00格式转化 import datetime # str转时间格式: dd = '2019-03-17 11:00:00' dd = datetime.datetim ...

  8. php 数组(2)

    数组排序算法 冒泡排序,是一种计算机科学领域的较简单的排序算法.它重复地访问要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们减缓过来.走访数列的工作室重复的进行直到没有再需要交换,也就是说该 ...

  9. AOP实现方式二

    applicationContext.xml <!--方法二 自定义类--> <bean id="diyPointCut" class="com.sha ...

  10. vcstool是什么?

    为什么会去了解vcstool,在想要手动编译并且获取ROS源码的时候,有一个Get ROS 2 code的章节中使用到了这个工具. mkdir -p ~/ros2_foxy/src cd ~/ros2 ...