grep: Global search REgular expression and Print out the line.
  作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查;打印匹配到的行;
  模式:由正则表达式的元字符及文本字符所编写出的过滤条件;


  
正则表达式引擎;

  grep [OPTIONS] PATTERN [FILE...]
  grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

    OPTIONS:
      --color=auto:对匹配到的文本着色后高亮显示;
      -i:ignorecase,忽略字符的大小写;
      -o:仅显示匹配到的字符串本身;
      -v, --invert-match:显示不能被模式匹配到的行;
      -E:支持使用扩展的正则表达式元字符;
      -q, --quiet, --silent:静默模式,即不输出任何信息;

      -A #:after, 后#行
      -B #:before,前#行
      -C #:context,前后各#行

    基本正则表达式元字符:
      字符匹配:
      . :匹配任意单个字符;
      []:匹配指定范围内的任意单个字符;
      [^]:匹配指定范围外的任意单个字符;
        [:digit:]、[:lower:]、[:upper:]、[:alpha:]、[:alnum:]、[:punct:]、[:space:]

    匹配次数:用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数;默认工作于贪婪模式;
      *:匹配其前面的字符任意次;0,1,多次;
        例如:grep "x\+y"
             abxy
           aby
           xxxxxy
           yab
      .*:匹配任意长度的任意字符
      \?:匹配其前面的字符0次或1次;即其前面的字符是可有可无的;
      \+:匹配其前面的字符1次或多次;即其面的字符要出现至少1次;
      \{m\}:匹配其前面的字符m次;
      \{m,n\}:匹配其前面的字符至少m次,至多n次;
      \{0,n\}:至多n次
      \{m,\}:至少m次

    位置锚定:
      ^:行首锚定;用于模式的最左侧;
      $:行尾锚定;用于模式的最右侧;
      ^PATTERN$:用于PATTERN来匹配整行;
      ^$:空白行;
      ^[[:space:]]*$:空行或包含空白字符的行;

      单词:非特殊字符组成的连续字符(字符串)都称为单词;

      \< 或 \b:词首锚定,用于单词模式的左侧;
      \> 或 \b:词尾锚定,用于单词模式的右侧;
      \<PATTERN\>:匹配完整单词;

  练习:
    1、显示/etc/passwd文件中不以/bin/bash结尾的行;
      ~]# grep -v "/bin/bash$" /etc/passwd

    2、找出/etc/passwd文件中的两位数或三位数;
      ~]# grep "\<[0-9]\{2,3\}\>" /etc/passwd

    3、找出/etc/rc.d/rc.sysinit或/etc/grub2.cfg文件中,以至少一个空白字符开头,且后面非空白字符的行;
      ~]# grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg

    4、找出"netstat -tan"命令的结果中以'LISTEN'后跟0、1或多个空白字符结尾的行;
      ~]# netstat -tan | grep "LISTEN[[:space:]]*$"

  分组及引用
    \(\):将一个或多个字符捆绑在一起,当作一个整体进行处理;
      \(xy\)*ab

    Note:分组括号中的模式匹配 到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
    \1:模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
    \2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
    \3
    ...

      He loves his lover.
      He likes his lover.
      She likes her liker.
      She loves her liker.

      ~]# grep "\(l..e\).*\1" lovers.txt

    后向引用:引用前面的分组括号中的模式所匹配到的字符;

egrep:

  支持扩展的正则表达式实现类似于grep文本过滤功能;grep -E

  egrep [OPTIONS] PATTERN [FILE...]
    选项:
      -i, -o, -v, -q, -A, -B, -C
      -G:支持基本正则表达式

    扩展正则表达式的元字符:
    字符匹配:
      .:任意单个字符
      []:指定范围内的任意单个字符
      [^]:指定范围外的任意单个字符

    次数匹配:
      *:任意次,0,1或多次;
      ?:0次或1次,其前的字符是可有可无的;
      +:其前字符至少1次;
      {m}:其前的字符m次;
      {m,n}:至少m次,至多n次;
      {0,n}
      {m,}

    位置锚定
      ^:行首锚定;
      $:行尾锚定;
      \<, \b:词首锚定;
      \>, \b:词尾锚定;

    分组及引用:
      ():分组;括号内的模式匹配到的字符会被记录于正则表达式引擎的内部变量中;
      后向引用:\1, \2, ...
    或:
      a|b:a或者b;
        C|cat:C或cat
        (c|C)at:cat或Cat

    练习:
      1、找出/proc/meminfo文件中,所有以大写或小写S开头的行;至少有三种实现方式;
        ~]# grep -i "^s" /proc/meminfo
        ~]# grep "^[sS]" /proc/meminfo
        ~]# grep -E "^(s|S)" /proc/meminfo

      2、显示肖前系统上root、centos或user1用户的相关信息;
        ~]# grep -E "^(root|centos|user1)\>" /etc/passwd

      3、找出/etc/rc.d/init.d/functions文件中某单词后面跟一个小括号的行;
        ~]# grep -E -o "[_[:alnum:]]+\(\)" /etc/rc.d/init.d/functions

      4、使用echo命令输出一绝对路径,使用egrep取出基名;
        ~]# echo /etc/sysconfig/ | grep -E -o "[^/]+/?$"

      进一步:取出其路径名;类似于对其执行dirname命令的结果;

      5、找出ifconfig命令结果中的1-255之间的数值;
        ~]# ifconfig | grep -E -o "\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"

      6、课外作业:找出ifconfig命令结果中的IP地址;

      7、添加用户bash, testbash, basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
        ~]# grep -E "^([^:]+\>).*\1$" /etc/passwd

fgrep:不支持正则表达式元字符;
  当无需要用到元字符去编写模式时,使用fgrep必能更好;

【Linux】【Shell】【text】grep的更多相关文章

  1. 【Linux下自定义Shell终端提示符】

    目录 基本转义符 字体颜色 背景颜色 移动光标 @ Linux系统终端提示符的特征由系统环境变量 PS1(Prompt String One)定义. 我们可以通过命令echo $PS1来查看当前设置, ...

  2. 【Linux&amp;Unix--open/close/write/read系统调用】

    个人学习整理.如有不足之处,请不吝不吝赐教. 转载请注明:@CSU-Max 系列博文:      Linux&Unix学习第一弹 -- 文件描写叙述符与权限  Linux&Unix学习 ...

  3. 【Linux运维-集群技术进阶】Nginx+Keepalived+Tomcat搭建高可用/负载均衡/动静分离的Webserver集群

    额.博客名字有点长.. . 前言 最终到这篇文章了,心情是有点激动的. 由于这篇文章会集中曾经博客讲到的全部Nginx功能点.包含主要的负载均衡,还有动静分离技术再加上这篇文章的重点.通过Keepal ...

  4. 【linux之设备,分区,文件系统】

    一.设备 IDE磁盘的设备文件采用/dev/hdx来命名,分区则采用/dev/hdxy来命名,其中x表示磁盘(a是第一块磁盘,b是第二块磁盘,以此类推), y代表分区的号码(由1开始,..3以此类推) ...

  5. 【linux之挂载,Raid,LVM】

    一.挂载,卸载 挂载:将新的文件系统关联至当前根文件系统卸载:将某文件系统与当前根文件系统的关联关系移除 cat /etc/mtab 存储着已经挂载的文件系统 (跟 mount 一样) mount:显 ...

  6. 【linux之进程管理,系统监控】

    一.进程管理 前台进程:一般是指占据着标准输入和/或标准输出的进程后台进程:不占据默认开启的进程都是前台进程ctrl+C 中断ctrl+z 从前台转入后台bg 后台进程编号 让其在后台运行ls -R ...

  7. 【python中调用shell命令使用PIPE】使用PIPE作为stdout出现假卡死的情况——将stdout重定向为输出到临时文件

    在Python中,调用:subprocess.Popen(cmd, stdout = PIPE, stderr = PIPE, shell= true)的时候,如果调用的shell命令本身在执行之后会 ...

  8. 【Linux磁盘优化管理--RAID和LVM】

    在现阶段的企业环境中,为了数据的安全性及完整性必须要有一个合理的存储方案.面对着每秒可能产生超过几TB的数据,考虑到磁盘能不能实现 热冗余,及扩容,缩容.Linux给出了RAID(磁盘阵列)以及LVM ...

  9. 【Linux 内核网络协议栈源码剖析】网络栈主要结构介绍(socket、sock、sk_buff,etc)

    原文:http://blog.csdn.net/wenqian1991/article/details/46700177 通过前面的分析,可以发现,网络协议栈中的数据处理,都是基于各类结构体,所有有关 ...

  10. 【linux之链接,函数,随机数】

    一.链接 硬链接(hard link):同一个文件使用了多个别名.新建文件是已经存在的一个别名,,当原文件删除时,新建的文件仍然可以使用.硬链接和原来的文件没有什么区别,而且共享一个inode号.通过 ...

随机推荐

  1. LeetCode 78. 子集 C++(位运算和回溯法)

    位运算 class Solution { public: vector<vector<int>> subsets(vector<int>& nums) { ...

  2. SQL告警,执行时间长?教你写一手好 SQL !

    博主(编码砖家)负责的项目主要采用阿里云数据库MySQL,最近频繁出现慢SQL告警,执行时间最长的竟然高达5分钟.导出日志后分析,主要原因竟然是没有命中索引和没有分页处理 . 其实这是非常低级的错误, ...

  3. [linux]centos7.4上升级python2版本到python3.6.5 【安装双版本,默认python3】

    版本声明 centos7.4 前言:linux上的python默认是版本2的,之前学django项目用的是3的版本 所以得升级下版本~ 1.下载python3.6.5 cd /usr/local/ w ...

  4. CefSharp-基于C#的客户端开发框架技术栈开发全记录

    CefSharp简介 源于Google官方 CefSharp用途 CefSharp开发示例 CefSharp应用--弹窗与右键 不弹出子窗体 禁用右键 CefSharp应用--High DPI问题 缩 ...

  5. 体验用yarp连接websocket

    前段时间一看yarp的仓库,wow,终于发布1.0版本了..net也升级到6版本了,之前一直只是用yarp做HTTP转发,今天刚好试试websocket 话不多说,直接开搞 配置集群 首先先配置集群信 ...

  6. Linux——搭建Samba(CIFS)服务器

    一.Samba的基本概念 Samba服务:是提供基于Linux和Windows的共享文件服务,服务端和客户端都可以是Linux或Windows操作系统.可以基于特定的用户访问,功能比NFS更强大. S ...

  7. Java包装类,以及Integer与int之间的比较

    一.Java的基本类型 Java语言中提供了八种基本类型,包括六种数字类型(四个整数型,两个浮点型),一种字符类型,还有一种布尔型. 整数型,包括byte.short.int.long,默认初始值是0 ...

  8. Exploring Matrix

    import java.util.Scanner; public class J714 { /** * @taking input from user */ public static void ma ...

  9. Dapr-发布/订阅

    前言 前篇文章对Dapr的状态管理进行了解,本篇继续对 订阅/发布 构建块进行了解. 一.定义: 发布订阅的概念来自于事件驱动架构(EDA)的设计思想,这是一种让程序(应用.服务)之间解耦的主要方式, ...

  10. [atAGC023F]01 on Tree

    对每一个节点维护一个序列,初始即自己(长度为1),并记$a_{i}$和$b_{i}$分别为第$i$个点序列上0和1的个数(也需要存储具体的序列) 考虑$\frac{b_{i}}{a_{i}}$最小中最 ...