文本处理三剑客之 grep/egrep
grep:文本过滤工具 支持BRE
egrep: 支持ERE
fgrep: 不支持正则
作用:根据用户指定的“模式”,对目标文本逐行进行匹配检查,打印匹配到的行
模式:由正则表达式字符及文本字符所编写的过滤条件
[OPTIONS] PATTERN [FILE...]
options:
-v:显示不被PATTERN匹配的行 排除
# 显示/etc/passwd文件中不以/bin/bash结尾的行 grep -v '/bin/bash$' /etc/passwd
-i:忽略字符大小写
-n:显示匹配的行号
-c:显示匹配的行数
-o:仅显示被匹配的字符串
-q:静默模式,不输出任何信息
-A #:after,后#行
-B #:before,前#行
-C #:context,前后各#行
-e:实现多个选择间的逻辑or关系
-w:整行匹配整个单词
-E:使用扩展的正则表达式 相当于egrep
-F:使用fgrep,不支持正则表达式 相当于fgrep
--color:将过滤出内容加上颜色显示
alias grep='grep --color=auto'
[root@centos6 ~ ::]#grep -i "^s" /proc/meminfo
SwapCached: kB
SwapTotal: kB
SwapFree: kB
Shmem: kB
Slab: kB
SReclaimable: kB
SUnreclaim: kB
[root@centos6 ~ ::]#grep "^[sS]" /proc/meminfo
基本正字表达式BRE:
字符匹配:
.:匹配任意单个字符
[]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
以下是元字符:
[:digit:]:数字
[:lower:]:小写字母
[:upper:]:大写字母
[:alpha:]:所有字母
[:space:]:空白字符
[:alnum:]:所有字母及数字
[:punct:]:所有标点符号
[:graph:]:可打印的非空白字符;
[:blank:]:水平空白字符(空格和制表符)
[:cntrl:]:不可打印的控制字符(退格、删除、警铃)
[:pirnt:]:打印字符
[:xdigit:]:十六进制数字
# 显示/etc/grub2.cfg文件中,至少一个空白字符开头的且后面存非空白字符的行
grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg # 找出“netstat -ant” 命令的结果中以“listen”后跟0,1或多个空白字符结尾的行 netstat -ant |grep "listen[[:space:]]*$" # 注意,使用元字符时,字符本身的中括号外,还需要加一层中括号 # 添加用户bash,testbash,basher以及nologin,而且找出/etc/passwd 文件中用户名同shell名的行
useradd bash
useradd testbash
useradd basher
useradd -s /sbin/nologin login
grep "^\([[:alnum:]]\+\>\).*\1$" /etc/passwd
# 显示/var目录下所有以L开头,以一个小写字母结尾,且中间出现至少以为数字的文件或目录 ls -d /var/L*[0-9]*[[:lower:]] # 显示/etc目录下,以任意一位数字开头,且以非数字结尾的文件或目录
ls -d /etc/[0-9]*[^0-9]
ls -d /etc/[[:digit:]]*[^[:digit:]] # 显示/etc目录下,以非字母开头,后面跟了一个字母及其其他任意长度任意字符的文件或目录
ls -d /etc/[^[:alpha:]][[:alpha:]]*
次数匹配:
用在要指定次数的字符后面,用于指定前面的字符要出现的次数
*:匹配前面的字符任意次
.*:匹配任意长度的任意字符
\?:匹配前面的字符0次或1次
\+:匹配前面的字符至少1次,至多不限
\{M\}:匹配前面的字符M次
\{M,\}:匹配前面的字符至少M次,至多不限
\{M,N\}:匹配前面的字符至少M次,至多N次
位置锚定:
^:行首锚定,用于模式的最左侧
$:行尾锚定,用于模式的最右侧
^$:空白行,连space也不允许出现
^[[:space:]]*$:空白行或包含空白字符的行
\<或\b:词首锚定,出现在单词的左侧
\>或\b:词尾锚定,出现在单词的右侧
\<PATTERN\>:完整匹配单词
# 去除nginx.conf里面的的空行和注释行 grep -Ev "^$|#" nginx.conf
^$ 空行
| 或者
# 注释行开头字符
分组及引用:
\(\):将一个或多个字符捆绑在一起,当作一个整体进行处理
后向引用:
引用前面的分组括号中的模式所匹配的字符
分组括号中的模式匹配到的内容会被正则表达式引擎记录与内部的变量中,这些变量的命名
方式为\1,\2,\3
\1: 从左侧起,第一个左括号以及与之匹配右括号之间的模式所匹配的字符
\(ab\+\(xy\)*\)
\1: ab\+\(xy\)*\
\2: xy
egrep及扩展正则表达式(Extandard RegExp):
字符匹配:
.:任意单个字符
[]:指定范围内的任意单个字符
[^]:指定范围外的任意单个字符
次数匹配:
*:任意次
?:0次或1次
+:其前一次最少一次或多次
{m}:匹配其前字符m次
{m,n}:匹配其前字符最少m次,最多n次
位置锚定:
^:行首锚定,用于模式的最左侧
$:行尾锚定,用于模式的最右侧
^$:空白行,连space也不允许出现
\<或\b:词首锚定,出现在单词的左侧
\>或\b:词尾锚定,出现在单词的右侧
分组及引用:
():分组;括号内的模式匹配到的字符会被记录到正则表达式引擎的内部变量中
后向引用:\1,\2,\3....
或:
| a|b a或者b
文本处理三剑客之 grep/egrep的更多相关文章
- Linux文本处理三剑客之grep及正则表达式详解
Linux文本处理三剑客之grep及正则表达式详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Linux文本处理三剑客概述 grep: 全称:"Global se ...
- Linux文本处理三剑客之——grep
一Linux文本处理三剑客之——grep Linux文本处理三剑客都支持正则表达式 grep :文本过滤( 模式:pattern) 工具,包括grep, egrep, fgrep (不支持正则表达式) ...
- shell 文本处理三剑客之 grep 和 egrep
shell 三剑客之 grep 命令语法格式 grep 参数 案例 显示file中有python的行 grep python file 显示没有python的行,不忽略大小写 grep -v pyth ...
- 文本处理三剑客之 grep
grep简介 grep(Global search REgular expression and Print out the line)是Linux上的文本处理三剑客之一,另外两个是sed和awk. ...
- 【Linux相识相知】文本处理工具之grep\egrep\fgrep及正则表达式
常说Linux上有文本处理的三剑客,grep.sed和awk,本文就grep做出详细的描述,并引出正则表达式. grep NAME:打印模式匹配的行 SYNOPISIS: grep [OPTIONS] ...
- Linux 文本处理三剑客之grep
文本处理都要使用正则表达式,正则表达式有: 基本正则表达式:grep或者egrep -G 扩展正则表达式:egreo或者grep -E Linux 文本处理三剑客: sed:stream editor ...
- linux文本处理三剑客之 grep
文本处理无非是对文本内容做查看.修改等操作.Linux三剑客: grep.sed 和 awk 命令. 处理文本内容,用 Vim 编辑器不是很好吗?Vim 允许我们使用键盘.鼠标来对文本内容进行交互性地 ...
- Linux文本处理三剑客之grep
简介 grep命令,用于在一个文本文件中或者从STDIN中,根据用户给出的模式(pattern)过滤出所需要的信息. grep以及三剑客中的另外两个工具sed和awk都是基于行处理的,它们会一行行读入 ...
- 文本处理三剑客之grep&正则表达式
grep是一个文本过滤工具,它支持正则表达式,能把搜索匹配到的行打印出来.grep的全称是Global Regular Expression Print(全局正则表达式)使用权限是所有用户. 一.gr ...
随机推荐
- Spring Boot—06集成前端模板thymeleaf
Spring Boot建议使用这些模板引擎,避免使用JSP,若一定要使用JSP将无法实现Spring Boot的多种特性 pom.xml <dependency> <groupId& ...
- demo.testfire.net 靶场测试流程记录
demo.testfire.net span::selection, .CodeMirror-line > span > span::selection { background: #d7 ...
- 网络 Internet 的发展
Internet源于美国军方,那时制定了TCP/IP协议. 互联网的典型应用有:www,FTP,E-mail. WWW:World Wide Web,简称Web,又称全球网.万维网等. 网页,c/s架 ...
- idea 自动导入包设置
- leetCode题解之寻找string中最后一个word的长度
1.题目描述 返回一个 string中最后一个单词的长度.单词定义为没有空格的连续的字符,比如 ‘a’,'akkk'. 2.问题分析 从后向前扫描,如果string是以空格‘ ’结尾的,就不用计数, ...
- 转:jquery validate.js表单验证
这里转载一篇前辈写的文章,在我自己的理解上修改了一下,仅作记录. 先贴一个国内某大公司的代码: 复制代码代码如下: <script type="text/javascript" ...
- 固定UIScrollView滑动的方向
固定UIScrollView滑动的方向 一般而言,我们通过这两个参数CGRectMake以及contentSize就可以自动的让UIScrollView只往一个方向滚动.但我遇到过非常奇葩的情况,那就 ...
- PowerShell管理SCOM_批量设置维护模式(上 )
#定义存储需要置为维护模式的计算机名称列表 $serverlist = "C:\scomm\servers.txt" #定义脚本执行结果的输出位置 $server_maintena ...
- Linux 开机启动流程
Linux的开机启动流程 1.开机BIOS自检 --> 检查CPU,硬盘等硬件信息 2.MBR[Major ...
- IE漏洞的调试心得
在调试漏洞的过程中,个人感觉最棘手的就是ie浏览器的漏洞和flash player的漏洞了.这里打算记录一下学习过程中的心得(主要是基于uaf类),以方便新人学习. 首先,ie漏洞与众不同的是,程序的 ...