文本处理工具:
 
  Linux上文本处理三剑客:
       文本过滤工具(模式:pattern)工具;
         1.grep:支持基本正则表达式;
         2.egrep:支持扩展正则表达式
         3.fgrep: 不支持正则表达式
     注:    同时这三个命令通过附加选项可以相互之间进行切换如下
              grep -E = egrep
              geep -F = fgrep
              egrep -G = grep
              egrp -F = fgrep
              fgrep -e = egrep
              fgrep -g = grep
 
正则表达式:Regual Expression,REGEXP
         
  由一类特殊字符及文本字符所编写的模式,其中有些字符不表示其字面意义,而是用与表示控制或通配的功能;
           
  同时正则也分两类:
                       基本正则表达式:BRE
                       扩展正则表达式:ERE
元字符(grep):
      grep: Global search REgular expression and print out the line.
      作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查;打印匹配到 行;
      模式 : 由正则表达式的元字符及文本字符所编写出的过滤条件;
正则表达式引擎:
     grep [options] PATTERN [FILE...]
     grep [options] [-e PATTERN | -f FILE] [FILE...]
   默认形式:    [root@localhost ~]# grep "UUID" /etc/fstab
                       UUID=c16f482c-99e1-4601-a295-895df929ef8e /boot                   xfs     defaults        0 0
下面是grep的常用选项的简要介绍            
 OPTIONS:
                       --color=auto:对匹配到的文章着色后高亮显示;
                                         -l  :  ignorecase,忽略字符的大小写;
                                         -o : 仅显示匹配到的字符串本身;
                  -v,--invert-match : 显示不能被模式匹配到的行;
                                          -E : 支持使用扩展的正则表达式元字符
                   -q,--qulet,--silent : 静默模式,即不输出任何信息;
                                        -A# : after,后#行
                                       -B# : before,前#行
                                       -C#:context
                     
 基本正则表达式元字符:
                      
  字符匹配:
                                . : 匹配任意单个字符;
                              [ ] : 匹配指定范围内的任意单个字符;
                           [^]:匹配指定范围外的任意单个字符;
                              [:digit:]、[:loewr:]、[:upper:]、[:alpha:]、[:alnum:]
针对位置锚定可以参考下面实例:
找出/etc/grub2.cfg文件中,以至少一个空白字符开头,且后面非空白字符的行
           [root@localhost ~]# grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg
           load_env
           set default="${next_entry}"
           set next_entry=
           save_env next_entry
           ......
 
  匹配次数:用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数;
                               *:匹配其前面的字符任意次;可以是0,也可以1或者n次;
                          例如:grep"x*y"
                                      abxy
                                      aby
                                      xxxxxy
                                      yab
                              . *  : 匹配任意长度的任意字符
                               \?  : 匹配其前面的字符0次或1次;即其前面的字符是可有可无的;
                               \+ : 匹配前面的字符1次或多次;即前面的字符要出现至少一次
                           \{m\} : 匹配其前面的字符m次;
                          \{m,n} : 匹配其前面的字符至少m次,至多n次;
                          \{0,n\}: 至多n次
                           \{m,\} : 至少m次  
    位置锚定:
                   ^:行首锚定:用于模式的最左侧;
                   $:行尾锚定:用于模式的最右侧;
                ^PATTERN$:用于PATTERN来匹配整行;
                               ^$ : 空白行;
                ^[[:space]]*$ : 空行或包含空白字符的行;
                             单词:非特殊字符组成的连续字符(字符串)都称为单词;
                         \<或\b : 词首锚定,用于单词模式的左侧;
                         \>或\b : 词尾锚定,用于单词模式的右侧
  针对位置锚定可以参考下面实例:
   例:找出/etc/passwd文件中不以/bin/bash结尾的行
         [root@localhost ~]# grep -v "/bin/bash$" /etc/passwd |tail
         chrony:x:993:990::/var/lib/chrony:/sbin/nologin  
         ntp:x:38:38::/etc/ntp:/sbin/nologin
         sssd:x:992:989:User for sssd:/:/sbin/nologin
         rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
         nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
         pulse:x:171:171:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
         gdm:x:42:42::/var/lib/gdm:/sbin/nologin
         postfix:x:89:89::/var/spool/postfix:/sbin/nologin
         sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
         tcpdump:x:72:72::/:/sbin/nologin
 
 
  分组及引用
                               \(\) : 将一个或多个字符捆绑在一起,当作一个整体进处理;
                                     例:\(xy\)*ab
                        注意:分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
                                \1:模式从左侧起,第一个左括号以及与之匹配的有括号之间的模式所匹配到的字符;
                                \2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
                                \3
                                  .......
                             如下面例子:
                               [root@localhost ~]# cat love.txt
                                  He loves his lover
                                  He likes his lover
                                  she likes her liker
                                  she loves her liker
  
                               
                该例的含义是,行段中左侧出现的以L开头e结尾的单词,后面也要匹配与前面一样的,所以可以把前面(l..e)后面加\1并以\1结尾,将(l..e)的值赋值给到\1。
                                                

文本处理工具(grep)的更多相关文章

  1. 三大文本处理工具grep、sed及awk的简单介绍

    grep.sed和awk都是文本处理工具,虽然都是文本处理工具单却都有各自的优缺点,一种文本处理命令是不能被另一个完全替换的,否则也不会出现三个文本处理命令了.只不过,相比较而言,sed和awk功能更 ...

  2. 【Linux】 字符串和文本处理工具 grep & sed & awk

    Linux字符串&文本处理工具 因为用linux的时候主要用到的还是字符交互界面,所以对字符串的处理变得十分重要.这篇介绍三个常用的字符串处理工具,包括grep,sed和awk ■ grep ...

  3. Linux 文本处理工具grep,sed,awk

    grep.sed和awk都是文本处理工具,虽然都是文本处理工具单却都有各自的优缺点,一种文本处理命令是不能被另一个完全替换的,否则也不会出现三个文本处理命令了.只不过,相比较而言,sed和awk功能更 ...

  4. shell之三大文本处理工具grep、sed及awk

    grep.sed和awk都是文本处理工具,虽然都是文本处理工具单却都有各自的优缺点,一种文本处理命令是不能被另一个完全替换的,否则也不会出现三个文本处理命令了.只不过,相比较而言,sed和awk功能更 ...

  5. 三大文本处理工具grep、sed及awk

    一.   用grep在文件中搜索文本 grep能够接受正则表达式,生成各种格式的输出.除此之外,它还有大量有趣的选项. 1.  搜索包含特定模式的文本行: 2.  从stdin中读取: 3.  单个g ...

  6. Linux--shell脚本之文本处理工具

    文本处理工具--grep.sed.awk Bash Shell提供了功能强大的文件处理工具:sed(流编辑器stream editor)和awk,都可使用正则表达式进行模式匹配. 而grep又有助于理 ...

  7. Linux的文本处理工具浅谈-awk sed grep

    Linux的文本处理工具浅谈 awk   老大 [功能说明] 用于文本处理的语言(取行,过滤),支持正则 NR代表行数,$n取某一列,$NF最后一列 NR==20,NR==30 从20行到30行 FS ...

  8. [linux] grep 文本搜索工具

    grep [option] pattern file Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular ...

  9. grep文本处理工具

    grep是一款文本过滤工具,基于正则表达式进行模式匹配sed:stream editor 流编辑器awk:linux上实现为gawk,文本报告生成器(格式化文本)文本搜索工具,根据用户指定的模式,对目 ...

随机推荐

  1. 201521123019 《Java程序设计》第3周学习总结

    1. 本周学习总结 2. 书面作业 (1)代码阅读 public class Test1 { private int i = 1;//这行不能修改 private static int j = 2; ...

  2. 201521123096《Java程序设计》第一周学习总结

    1. 本章学习总结: 对JAVA的发展有一定的了解.JAVA是一种高级语言,需要在JVM上执行.初步学会使用eclipse和NOtepad++. 2. 书面作业 Q1:为什么java程序可以跨平台运行 ...

  3. java课程设计--猜数字(团队博客)

    java课程设计--猜数字(团队博客) 1.团队名称以及团队成员介绍 团队名称:cz 团队成员:陈伟泽,詹昌锦 团队照片: 2.项目git地址 http://git.oschina.net/Devil ...

  4. 201521123069 《Java程序设计》 第14周学习总结

    1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多数据库相关内容. 2. 书面作业 1. MySQL数据库基本操作 建立数据库,将自己的姓名.学号作为一条记录插入.(截图,需出现自 ...

  5. JAVA课程设计 学生成绩管理

    学生成绩管理 可实现功能: 添加学生功能:姓名.学号.性别.出生年月日.(学号自动生成且唯一) 添加学生成绩功能:每个人都有数学.Java与体育四门课,可分课程输入成绩. 根据学生学号查找学生成绩功能 ...

  6. 201521123027<java程序设计>第14周作业总结

    1.本周作业总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多数据库相关内容. 2.书面作业 Q1. MySQL数据库基本操作 建立数据库,将自己的姓名.学号作为一条记录插入.(截图,需出现自己 ...

  7. pygame 弹力球及其变速的实现

    期望: 1.球体接触到框体后反弹 2.设置速度按键,按下后改变球体速度.颜色状态 具体实现: import pygame from pygame.locals import * import sys, ...

  8. 25个最基本的JavaScript面试问题及答案

    1.使用 typeof bar === "object" 来确定 bar 是否是对象的潜在陷阱是什么?如何避免这个陷阱? 尽管 typeof bar === "objec ...

  9. 从JS和jQuery浅谈DOM操作,当我们在获取时,究竟获取了什么

    0.写在前面的话 自己对前端的东西一直不是很熟,现在开始要想办法从前端各个地方去获取想要的属性值的时候,也基本是在网上现炒现卖,几周下来,发现自己还是迷迷糊糊,可以算是一无所获. 所以就抽时间,把这一 ...

  10. OSGi-入门篇之生命周期层(03)

    前言 生命周期层在OSGi框架中属于模块层上面的一层,它的运作是建立在模块层的功能之上的.生命周期层一个主要的功能就是让你能够从外部管理应用或者建立能够自我管理的应用(或者两者的结合),并且给了应用本 ...