一 什么是正则

正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。
  生活中处处都是正则:
  比如我们描述:4条腿
  你可能会想到的是四条腿的动物或者桌子,椅子等
  继续描述:4条腿,活的
  就只剩下四条腿的动物这一类了

在linux中,通配符是由shell解释的,而正则表达式则是由命令解释的,下面我们就为大家介绍grep文本处理命令,它也可以解释正则。

二 grep

参数

-n  :显示行号
-o  :只显示匹配的内容
-q  :静默模式,没有任何输出,得用$?来判断执行成功没有,即有没有过滤到想要的内容

-l  :如果匹配成功,则只将文件名打印出来,失败则不打印,通常-rl一起用,grep -rl 'root' /etc 
-A  :如果匹配成功,则将匹配行及其后n行一起打印出来
-B  :如果匹配成功,则将匹配行及其前n行一起打印出来
-C  :如果匹配成功,则将匹配行及其前后n行一起打印出来
--color
-c  :如果匹配成功,则将匹配到的行数打印出来
-E  :等于egrep,扩展
-i  :忽略大小写

-v  :取反,不匹配
-w:匹配单词,单词的意思是特殊符号隔开的英文字母组合,对象中的正则表达式都会当成单词(前后有特殊符号)。

[root@MiWiFi-R3-srv ~]# cat a.txt
root123
ROot asdf
Root_123
rOOtss
root
[root@MiWiFi-R3-srv ~]# grep -i "root" a.txt
root123
ROot asdf
Root_123
rOOtss
root
[root@MiWiFi-R3-srv ~]# grep -w "root" a.txt
root

三 grep种类
grep   全面搜索正则表达式并把行打印出来
fgrep   它搜索字符串而不是搜索匹配表达式的模式。fgrep 命令使用快速的压缩算法。$, *, [, |, (, )\等字符串被 fgrep 命令按字面意思解释。这些字符并不解释为正则表达式
pgrep   以名称为依据从运行进程队列中查找进程,并显示查找到的进程id。
egrep   用于在文件内查找指定的字符串。egrep执行效果与grep -E相似,使用的语法及参数可参照grep指令,与grep的不同点在于解读字符串的方法。

四 正则介绍

正则表达式

描述

示例

Basic RegEx

Extended RegEx

Python RegEx

Perl regEx

\

转义符,将特殊字符进行转义,忽略其特殊意义

a\.b匹配a.b,但不能匹配ajb,.被转义为特殊意义

\

\

\

\

^

匹配行首,awk中,^则是匹配字符串的开始

^tux匹配以tux开头的行

^

^

^

^

$

匹配行尾,awk中,$则是匹配字符串的结尾

tux$匹配以tux结尾的行

$

$

$

$

.

匹配除换行符\n之外的任意单个字符,awk则中可以

ab.匹配abc或bad,不可匹配abcd或abde,只能匹配单字符

.

.

.

.

[]

匹配包含在[字符]之中的任意一个字符

coo[kl]可以匹配cook或cool

[]

[]

[]

[]

[^]

匹配[^字符]之外的任意一个字符(不匹配字符组内的每个字符)

123[^45]不可以匹配1234或1235,1236、1237都可以

[^]

[^]

[^]

[^]

[-]

匹配[]中指定范围内的任意一个字符,要写成递增

[0-9]可以匹配1、2或3等其中任意一个数字

[-]

[-]

[-]

[-]

?

匹配之前的项1次或者0次

colou?r可以匹配color或者colour,不能匹配colouur

不支持

?

?

?

+

匹配之前的项1次或者多次

sa-6+匹配sa-6、sa-666,不能匹配sa-

不支持

+

+

+

*

匹配之前的项0次或者多次

co*l匹配cl、col、cool、coool等

*

*

*

*

()

匹配表达式,创建一个用于匹配的子串

ma(tri)?匹配max或maxtrix

不支持

()

()

()

{n}

匹配之前的项n次,n是可以为0的正整数

[0-9]{3}匹配任意一个三位数,可以扩展为[0-9][0-9][0-9]

不支持

{n}

{n}

{n}

{n,}

之前的项至少需要匹配n次

[0-9]{2,}匹配任意一个两位数或更多位数

不支持

{n,}

{n,}

{n,}

{n,m}

指定之前的项至少匹配n次,最多匹配m次,n<=m

[0-9]{2,5}匹配从两位数到五位数之间的任意一个数字

不支持

{n,m}

{n,m}

{n,m}

|

交替匹配|两边的任意一项

ab(c|d)匹配abc或abd

不支持

|

|

|

应用举例:

.* 所有字符

^[^] 非字符组内的字符开头的行

[a-z] 小写字母

[A-Z] 大写字母

[a-Z] 小写和大写字母

[0-9] 数字

\< 单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词

\> 单词尾

扩展正则 sed 加 -r 参数
或转义

grep 加 -E 或 egrep 或转义

 

sed -n '/roo\?/p' /etc/passwd

sed -rn '/roo?/p' /etc/passwd

abc|def abc或def

a(bc|de)f abcf 或 adef

x\{m\} x出现m次

x\{m,\} x出现m次至多次(至少m次)

x\{m,n\} x出现m次至n次

posix定义的字符分类

[:alnum:] Alphanumeric characters.

匹配范围为
[a-zA-Z0-9]

[:alpha:] Alphabetic characters.

匹配范围为
[a-zA-Z]

[:blank:] Space or tab characters.

匹配范围为 空格和TAB键

[:cntrl:] Control characters.

匹配控制键 例如 ^M 要按 ctrl+v 再按回车 才能输出

[:digit:] Numeric characters.

匹配所有数字 [0-9]

[:graph:] Characters that are both printable and visible. (A space
is print-

able, but not visible, while an a is both.)

匹配所有可见字符 但不包含空格和TAB 就是你在文本文档中按键盘上能用眼睛观察到的所有符号

[:lower:] Lower-case alphabetic characters.

小写 [a-z]

[:print:] Printable characters (characters that are not control
characters.)

匹配所有可见字符 包括空格和TAB

能打印到纸上的所有符号

[:punct:] Punctuation characters (characters that are not letter,
digits, con-

trol characters, or space characters).

特殊输入符号
+-=)(*&^%$#@!~`|\"'{}[]:;?/>.<,

注意它不包含空格和TAB

这个集合不等于^[a-zA-Z0-9]

[:space:] Space characters (such as space, tab, and formfeed, to
name a few).

[:upper:] Upper-case alphabetic characters.

大写 [A-Z]

[:xdigit:] Characters that are hexadecimal digits.

16进制数 [0-f]

使用方法:

[root@seker ~]# grep --color '[[:alnum:]]' /etc/passwd

定义变量名的边界

[root@MiWiFi-R3-srv ~]# rest_mem=
[root@MiWiFi-R3-srv ~]# echo ${rest_mem}%
%

五 运算符

算术运算符:+、-、*、/、%

[root@MiWiFi-R3-srv ~]# echo $[+]

关系操作:与(())连用

<    >     <=     >=     ==     !=     &&     ||

test命令相关,[]可以达到一样的效果
[root@MiWiFi-R3-srv ~]# x=
[root@MiWiFi-R3-srv ~]# [ $x -gt ]
[root@MiWiFi-R3-srv ~]# echo $?

赋值运算符

=     +=     *=     /=     %=

[root@MiWiFi-R3-srv ~]# x=
[root@MiWiFi-R3-srv ~]# ((x%))
[root@MiWiFi-R3-srv ~]# echo $x [root@MiWiFi-R3-srv ~]#
[root@MiWiFi-R3-srv ~]# ((x%=))
[root@MiWiFi-R3-srv ~]# echo $x

shell里的所有计算器
$[] (()) $(()) expr bc bc -l

浮点运算:yum install bc -y

[root@MiWiFi-R3-srv ~]# echo 'scale=2;1/3'|bc -l
.

测试操作

命令执行后会返回到一个系统变量中 $?
如果$?值为0 表示命令执行成功 否则为失败

测试命令 test [ ] [[ ]] (( ))
打开man test 逐一介绍每个参数

测试文件状态
-d 目录
-s 文件长度 > 、非空
-f 正规文件
-w 可写 -r 可读 -x 可执行 -L 符号连接 -u 文件有 suid 位设置

字符串测试

= 两个字符串相等
!= 两个字符串不相等
-z 空串
-n 非空串 [root@MiWiFi-R3-srv ~]# var1='abc'
[root@MiWiFi-R3-srv ~]# var2=''
[root@MiWiFi-R3-srv ~]# [ $var1 == $var2 ]
[root@MiWiFi-R3-srv ~]# echo $?

测试数值

-eq 等于
-ne 不等于
-gt 大于
-lt 小于
-ge 大于等于
-le 小于等于 [root@MiWiFi-R3-srv ~]# [ -gt ] #不要使用大于号小于号等于号等,要使用man test中规定的,详见下一小节4拓展
[root@MiWiFi-R3-srv ~]# echo $?

拓展测试符号 [[ ]] (())

数字测试符号
# [ < ] # 语法错误
-bash: : 没有那个文件或目录
# # [[ > ]] # 结果错误
# echo $? # [[ > ]] # 正确
# echo $? # (( < ))
# echo $? 字符测试
# [ "aa" = "aa" ]
# echo $? # [[ "aa" = "aa" ]]
# echo $? # (( "aa" = "aa" )) #结果错误
# echo $? 混合测试
# [ a = a -a < ]
-bash: : 没有那个文件或目录
[root@seker ~]# [[ a = a -a < ]]
-bash: syntax error in conditional expression
-bash: syntax error near `-a'
[root@seker ~]# [[ a = a && < ]]
[root@seker ~]# echo $? [root@seker ~]# [[ a = a || < ]]
[root@seker ~]# echo $? [root@seker ~]# (( a = a || < ))
[root@seker ~]# echo $? [root@seker ~]# (( a = a && < ))
[root@seker ~]# echo $? [root@seker ~]#
结论:
比较数字,使用(( ))
其他测试使用 [[ ]]
包含数字比较的混合测试,使用[[ expr1 && expr2 ]] (( expr1 || expr2 )) 两个文件的比较
FILE1 -ef FILE2
测试两个文件是否是相同的inode
有时为了找到同一个INODE号的文件 更倾向于使用 find 命令的 -inum 或 --samefile FILE1 -nt FILE2
FILE1 is newer (modification date) than FILE2 FILE1 -ot FILE2
FILE1 is older than FILE2

SHELL —— grep命令+正则表达式的更多相关文章

  1. [Shell]grep命令

    我是好文章的搬运工,原文来自ChinaUnix,博主scq2099yt,地址:http://blog.chinaunix.net/uid-22312037-id-4217835.html 一.基本用法 ...

  2. linux shell编程学习笔记(二) --- grep命令

    Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达 ...

  3. Linux Shell脚本入门--grep命令详解

    grep简介<摘自鸟哥,并加以整理.> grep (global search regular expression(RE) and print out the line,全面搜索正则表达 ...

  4. Linux学习——shell编程之正则表达式和字符处理命令

    shell编程之正则表达式 一 正则表达式 1 什么是正则表达式 正则表达式用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分隔.匹配.查找及替换操作. 2 shell编程之正则表达式 ...

  5. grep命令及基本正则表达式

    grep命令是Linux系统中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功 ...

  6. Linux - 结合正则表达式使用grep命令

    Grep with Regular Expression grep命令基本用法 grep [-acinv] [--color=auto] [-A n] [-B n] '搜寻字符串' 文件名参数说明: ...

  7. shell脚本--内容查找之grep命令

    grep命令可以检索文件中包含关键字(可以使用正则)的行,默认区分大小写. ubuntu@ubuntu:~/test$ cat test.txt this is linux this is Linux ...

  8. Shell常用命令find、grep总结

    一.find 命令 find 命令的常用形式可以简化为 find [path...][expression] path:find 命令查找的目录路径,其中 ./ 表示当前目录,/ 表示系统根目录 ex ...

  9. Linux Shell基础 管道符和grep命令

    概述 管道符:管道符使用"丨"代表.如"命令1丨命令2".表示命令 1 的正确输出作为命令 2 的操作对象.命令 1 必须有正确输出,而命令 2 必须可以处理命 ...

随机推荐

  1. IP代理软件

    IP代理软件 IP代理软件就是通过第三方网络协议传输数据的一种加密软件:跟VPN,代理服务器原理一样,是一种特殊的网络服务,允许一个网络终端(一般为客户端)通 过这个服务与另一个网络终端(一般为服务器 ...

  2. Swift基础--ijkplayer编译

    这篇与Swift基本上没有什么关系,只是之后会用到,这次编译是使用Mac编译IOS版本号的.以下是编译流程,最后是整个项目的下载地址.由于下载太慢了. 1.下载源代码 git clone https: ...

  3. jQuery-对Select的操作集合[终结篇]

    jQuery获取Select选择的Text和Value:  请选择 C# Javascript jQuery C++ Java VB 选择一项试试看语法解释:1. $("#select_id ...

  4. 常用cms

    最近,朋友要建站让我帮着推荐个好的CMS(内容管理系统),个人认为其实选择哪个CMS并不重要,除了对搜索引擎的亲好外,个人的使用操作习惯和对所选CMS系统的熟悉程度有很大关系. 这里为需要建站但又徘徊 ...

  5. Oracle启动中,startup nomount、 startup mount 有什么差别?

    Oracle启动中,startup nomount. startup mount 有什么差别? 解答: startup nomount:启动实例,读取参数文件,分配内存空间,启动后台进程,打开跟踪文件 ...

  6. Openstack(Kilo)安装系列之Keystone(五)

    Create OpenStack client environment scripts To create the scripts Create client environment scripts ...

  7. javascript汇总(转)

    字符串操作:http://www.cnblogs.com/magetu/archive/2012/12/18/javascript-string-methods-reference.html 几种对象 ...

  8. QT国际化,中英文等多语言界面显示的方法

    在网上学习了一下QT的国际化使用方法,最后将自己试成功的方法总结例如以下: 当中遇到的问题有:生成的ts文件里 代码中的中文 有的不显示,有的显示乱码.   步骤1: 生成.ts文件,在pro项目文件 ...

  9. PHP urlencode

    url get传参时,对参数值需要用urlencode()处理,防止参数中含有特殊字符&等 例如: 一产品名称为A&T Plastic,在产品列表中就产生了这样的一个联接<a h ...

  10. html空格字符

    一.使用全角空格IDEOGRAPHIC SPACE----  Encodings HTML Entity (decimal)   HTML Entity (hex)   How to type in ...