正则表达式 grep文本查询 sed流处理 应用
一、正则表达:
^:以什么什么开头,^a:以a字符开头
$:以什么什么结尾,b$:以b字符结尾
*:左边字符0~无穷个
+:左边字符1~无穷个
.:代表单字符
?:前导字符为零个或1个
{n}:左面字符有n个
{n}$:左面字符n个结尾
{n,m}:左面字符n到m个
{n,}:左面字符n到无穷个
[]:匹配中括号中的限定的1个字符,有特殊符号需要转义字符
[a-z]:a到z中任意单字符
[a-zA-Z]:a到z和A到Z中任意单字符
[a-Z]:就是[a-zA-Z]
[0-9]{t}:0到9中任意t个单字符,也就是[0-9][0-9]
^[0-9]:以0到9中单数字开头
^[^0-9]:除了0到9中单数字开头
二、grep:文本搜索,匹配内容
grep 选项参数 命令
例如:
#grep -n 'root' /etc/passwd #静默查询/etc/passwd文件中root字符
选项参数:
-n:显示行号
-o:只显示匹配内容
-q:静默匹配不打印内容通过"echo $?"确认执行是否成功
-l:打印文件名
-A 2:打印本行加下2行
-B 3:打印本行加上3行
-C 4:打印本行加上4行加下4行
-i:匹配忽略大小写
-iv:匹配内容取反
-c:统计行数
-w:匹配单词
-E:扩展的grep版本,等同egrep
'abc':匹配单引号中的字符
-e 'abcd' -e 'abce':匹配abcd的单词或者abce的单词
'abc(d|e)':匹配abcd或者abce的单词,同上
三、sed:流处理
sed 选项参数 命令
例如:
#sed -n '3p' test.txt #静默输出第3行内容,3为定位行位置,p为命令
#sed ‘4a abcd’ test.txt #第4行追加abcd字符,a为命令
其中,
选项参数:
-n:静默处理,不打印输出结果
命令:
p:打印
c:替换行内容
a:追加内容
i:插入内容
1,4d:删除1到4行内容
1d,4d:删除1行和4行内容
d:删除
//:命令中使用正则表达式放入//中
//d:删除正则匹配到的行
s:替换
s/aaa/bbb/g:将全部行中的aaa替换为bbb,不加g则每行只替换第一个aaa
s/()()/\1\2/g:匹配两个括号中的内容,\1\2表示将第一个括号和第二个括号内容显示
例如:
#sed 's/^(.)(.*)$/\2/' test.txt #test文件中任意行去掉第一个字符,^(.)任意单字符开始,(.*)任意0到无穷字符,\2只显示第二个括号部分
四、应用grep(正则表达式及字符处理)
目标文件:/etc/passwd,使用grep命令或egrep处理
1.显示出所有含有root的行
#egrep 'root' /etc/passwd
2.输出任何包含bash的所有行,还要输出紧接着这行的上下各两行的内容
#egrep -C 2 'bash' /etc/passwd
3.显示出有多少行含有nologin
#egrep -c 'nologin' /etc/passwd
4.显示出那些行含有root,并将行号一块输出
#egrep -n 'root' /etc/passwd
5.-
6.新建用户abominable、abominate、anomie、atomize编写正则表达式,将他们匹配出来
#egrep '^a[a-z]omi[a-z]*' /etc/passwd
7.建5个用户Alex213sb、Wpq2222b、yH438PIG、egon666、egon过滤出用户名组成是字母+数字+字母的行
#egrep '^[a-Z]+[0-9]+[a-Z]+' /etc/passwd
8.显示出/etc目录下所有包含root的文件名
#find /etc |egrep 'root'
9.过滤掉/etc/ssh/sshd_config内所有注释和所有空行
#egrep '^[^\#][.]*' /etc/ssh/sshd_config
五、应用Sed
以/etc/passwd文件为模板
1.删除文件每行的第一个字符
#sed -r 's/(.)(.*)/\2/g' /etc/passwd
2.删除文件每行的第二个字符
#sed -r 's/(.)(.)(.*)/\1\3/g' /etc/passwd
3.删除文件每行的最后一个字符
#sed -r 's/(.*)(.)$/\1/g' /etc/passwd
4.删除文件每行的倒数第二个字符。
#sed -r 's/(.*)(.)(.)$/\1\3/g' /etc/passwd
5.删除文件每行的第二个单词。
#sed -r 's/^([a-Z]*)([^a-Z]*)([a-Z]*)([^a-Z]*)/\1\2\4/g' /etc/passwd
6.删除文件每行的倒数第二个单词。
#sed -r 's/([^a-Z]*)([a-Z]*)([^a-Z]*)([a-Z]*)$/\1\3\4/g' /etc/passwd
7.删除文件每行的最后一个单词。
#sed -r 's/([^a-Z]*)([a-Z]*)$/\1/g' /etc/passwd
8.交换每行的第一个字符和第二个字符。
#sed -r 's/^(.)(.)/\2\1/g' /etc/passwd
9.交换每行的第一个字符和第二个单词。*
#sed -r 's/^(.)([a-Z]*)([^a-Z]*)([a-Z]*)([^a-Z]*)/\4\2\3\1\5/g' /etc/passwd
10.交换每行的第一个单词和最后一个单词。*
#sed -r 's/^([a-Z]*)([^a-Z]*)(^[a-Z]*)([a-Z])$/\3\2\1/g' /etc/passwd
11.删除一个文件中所有的数字。
#sed -r 's/[0-9]//g' /etc/passwd
12.删除每行开头的所有空格。
#sed -r 's/^[ ]*//g' /etc/passwd
13.用制表符替换文件中出现的所有空格。
#sed -r 's/[ ]/\t/g' /etc/passwd
14.把所有大写字母用括号()括起来。
#sed -r 's/[A-Z]/(&)/g' /etc/passwd
15.打印每行3次。
#sed -r '{p;p}' /etc/passwd
16.只显示每行的第一个单词。
#sed -r 's/^([][ ]*)([a-Z]*)(.*)/\2/g' /etc/passwd
17.打印每行的第一个单词和第三个单词。
#sed -r 's/^([ ]*)([a-Z]*)([^a-Z]*)([a-Z]*)([^a-Z]*)([a-Z]*)(.*)/\2\6/g' /etc/passwd
18.用命令获取格式为 mm/yy/dd 的日期格式,结合管道,将其换成 mm;yy;dd格式
#date ‘+%m/%y/%m’ | sed -r 's/[/]/;/g'
正则表达式 grep文本查询 sed流处理 应用的更多相关文章
- Linux基础正则表达式:grep,sed
先说明语系对正则表达式的影响 LANG=C:0,1,2,3,4...A,B,C,D...Z a b c d ... z LANG=zh_CN:0,1,2,3,4...a A b B c C ...
- centos 正则,grep,egrep,流式编辑器 sed,awk -F 多个分隔符 通配符 特殊符号. * + ? 总结 问加星 cat -n nl 输出文件内容并加上行号 alias放~/.bash_profile 2015-4-10 第十三节课
centos 正则,grep,egrep,流式编辑器 sed,awk -F 多个分隔符 通配符 特殊符号. * + ? 总结 问加星 cat -n nl 输出文件内容并加上行号 alias放~ ...
- shell脚本之正则表达和文本处理(文本处理三剑客:1、grep 2、sed 3、awk)
文本处理三剑客:1.grep 2.sed 3.awk 一.grep:(过滤) grep的使用,主要的参数有: -n :显示行号:-o :只显示匹配的内容-q :静默模式,没有任何输出,得用e ...
- Linux正则表达式,grep总结,sed用法
原文: 1.sed 流编辑器,实现对文字的增删改替换查(过滤.取行),能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件 输入到屏幕,可以把只匹配到模式的内容输入到屏幕上.还可以对原文件 ...
- Linux正则表达式grep与egrep
grep -io "http:/=[A-Z0-9]\{16\}" ./wsxf.txt >wsxf_urls.txt Linux正则表达式grep与egrep 正则表达式:它 ...
- grep与正则表达式,grep、egrep和fgrep
grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同!正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串. ...
- shell:正则表达式和文本处理器
1.什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 生活中处处都是正则: 比如我们描述:4条腿 你可能会想 ...
- Shell第二篇:正则表达式和文本处理工具
一 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 生活中处处都是正则: 比如我们描述:4条腿 ...
- BASH 正则表达式和文本处理工具
本节内容 1. 什么是正则 2. grep 3. sed 4. awk 5. 其他补充 一 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方 ...
随机推荐
- PHP 常用函数总结(二)
4.PHP处理数据库的常用函数. 汇总表 PHP 5 MySQLi 函数 函数 描述 mysqli_affected_rows() 返回前一个 Mysql 操作的受影响行数. mysqli_autoc ...
- linux 进程guanl管理的常用几个命令
执行中的程序在称作进程.当程序以可执行文件存放在存储中,并且运行的时候,每个进程会被动态得分配系统资源.内存.安全属性和与之相关的状态.可以有多个进程关联到同一个程序,并同时执行不会互相干扰.操作系统 ...
- CSS实现点击改变元素背景色
可通过使用css伪类实现点击元素变色的效果,两个伪类是:active, :focus :active :active选择器用于选择活动链接.当在一个链接上点击时,它就会成为活动的(激活的),:acti ...
- ubuntu 16.04 部署 pypy+nginx+uwsgi+django(详细)
1.nginx ...
- 关于IT个人看法
对于理科生来说,理论和技术都是相当重要的,我很爱钻牛角尖,但是请理解‘固执的我’, 本人选择IT行业,其实也是偶然,带着质疑的眼光,成为了众多IT男中毫无‘特色’的一员,回忆 学习阶段,逐渐认识了IT ...
- ReentrantLock详解 以及与synchronized的区别
ReentrantLock lock = new ReentrantLock(); //参数默认false,不公平锁 ReentrantLock lock = new ReentrantLock(tr ...
- The Best Path HDU - 5883(欧拉回路 && 欧拉路径)
The Best Path Time Limit: 9000/3000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Tot ...
- [BZOJ4556][Tjoi2016&Heoi2016]字符串 后缀数组+主席树
4556: [Tjoi2016&Heoi2016]字符串 Time Limit: 20 Sec Memory Limit: 128 MB Description 佳媛姐姐过生日的时候,她的小 ...
- 安装MySql出现Error Nr.1045的解决办法
如图,最后一步出现这个错误框 这是因为上次安装过MySql,其用户数据在卸载的时候没有被删除掉,解决办法如下: 显示隐藏的文件夹,打开C盘,找到下图文件删除之 删除之后再安装一遍MySQL,就可以了
- UIScrollView浏览一组图片,且图片与图片之间有间隔
---恢复内容开始--- UIScrollView是可以浏览一组view的,只要将其属性 pagingEnabled设置为true就可以了.具体过程是这样的, 1:将一组图片按照从左到右的顺序添加到U ...