awk和sed命令
sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。
sed命令的语法格式:
sed的命令格式: sed [option] 'sed command'filename
sed的脚本格式:sed [option] -f 'sed script'filename
sed命令的选项(option):
-n :只打印模式匹配的行
-e :直接在命令行模式上进行sed动作编辑,此为默认选项
-f :将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作
-r :支持扩展表达式
-i :直接修改文件内容
sed在文件中查询文本的方式:
1)使用行号,可以是一个简单数字,或是一个行号范围
x |
x为行号 |
x,y |
表示行号从x到y |
/pattern |
查询包含模式的行 |
/pattern /pattern |
查询包含两个模式的行 |
pattern/,x |
在给定行号上查询包含模式的行 |
x,/pattern/ |
通过行号和模式查询匹配的行 |
x,y! |
查询不包含指定行号x和y的行 |
2)使用正则表达式、扩展正则表达式(必须结合-r选项)
^ |
锚点行首的符合条件的内容,用法格式"^pattern" |
$ |
锚点行首的符合条件的内容,用法格式"pattern$" |
^$ |
空白行 |
. |
匹配任意单个字符 |
* |
匹配紧挨在前面的字符任意次(0,1,多次) |
.* |
匹配任意长度的任意字符 |
\? |
匹配紧挨在前面的字符0次或1次 |
\{m,n\} |
匹配其前面的字符至少m次,至多n次 |
\{m,\} |
匹配其前面的字符至少m次 |
\{m\} |
精确匹配前面的m次\{0,n\}:0到n次 |
\< |
锚点词首----相当于 \b,用法格式:\<pattern |
\> |
锚点词尾,用法格式:\>pattern |
\<pattern\> |
单词锚点 |
分组,用法格式:pattern,引用\1,\2 |
|
[] |
匹配指定范围内的任意单个字符 |
[^] |
匹配指定范围外的任意单个字符 |
[:digit:] |
所有数字, 相当于0-9, [0-9]---> [[:digit:]] |
[:lower:] |
所有的小写字母 |
[:upper:] |
所有的大写字母 |
[:alpha:] |
所有的字母 |
[:alnum:] |
相当于0-9a-zA-Z |
[:space:] |
空白字符 |
[:punct:] |
所有标点符号 |
- #######sed的匹配模式支持正则表达式#####################
- sed'5 q'/etc/passwd#打印前5行
- sed-n '/r*t/p'/etc/passwd#打印匹配r有0个或者多个,后接一个t字符的行
- sed-n '/.r.*/p'/etc/passwd#打印匹配有r的行并且r后面跟任意字符
- sed-n '/o*/p'/etc/passwd#打印o字符重复任意次
- sed-n '/o\{1,\}/p'/etc/passwd#打印o字重复出现一次以上
- sed-n '/o\{1,3\}/p'/etc/passwd#打印o字重复出现一次到三次之间以上
sed的编辑命令(sed command):
p |
打印匹配行(和-n选项一起合用) |
= |
显示文件行号 |
a\ |
在定位行号后附加新文本信息 |
i\ |
在定位行号后插入新文本信息 |
d |
删除定位行 |
c\ |
用新文本替换定位文本 |
w filename |
写文本到一个文件,类似输出重定向 > |
r filename |
从另一个文件中读文本,类似输入重定向 < |
s |
使用替换模式替换相应模式 |
q |
第一个模式匹配完成后退出或立即退出 |
l |
显示与八进制ACSII代码等价的控制符 |
{} |
在定位行执行的命令组,用分号隔开 |
n |
从另一个文件中读文本下一行,并从下一条命令而不是第一条命令开始对其的处理 |
N |
在数据流中添加下一行以创建用于处理的多行组 |
g |
将模式2粘贴到/pattern n/ |
y |
传送字符,替换单个字符 |
对文件的操作无非就是”增删改查“,怎样用sed命令实现对文件的”增删改查“,玩转sed是写自动化脚本必须的基础之一。
sed命令打印文件信息(查询):
- ####用sed打印文件的信息的例子的命令######
- sed -n '/^#/!p' /etc/vsftpd/vsftpd.conf
- sed -n '/^#/!{/^$/!p}' /etc/vsftpd/vsftpd.conf
- sed -e '/^#/d' -e '/^$/d' /etc/vsftpd/vsftpd.conf
- sed -n '1,/adm/p' /etc/passwd
- sed -n '/adm/,6p' /etc/passwd
- sed -n '/adm/,4p' /etc/passwd
- sed -n '/adm/,2p' /etc/passwd
- ###以下图片是对这些sed命令例子的解释和显示结果
sed命令实现对文件内容的添加:(对源文件添加的话就用-i参数):
- ####sed命令可以实现的添加######
- #1)匹配行的行首添加,添加在同行
- #2)匹配行的行中的某个字符后添加
- #3)匹配行的行尾添加字符
- #4)匹配行的行前面行添加
- #5)匹配行的行后面行添加
- #6)文件的行首添加一行
- [root@jie1 ~]# sed -i '1 i\sed command start' myfile
- #7)文件的行尾追加一行
- [root@jie1 ~]# sed -i '$a \sed command end' myfile
sed命令实现对文件内容的删除:(对源文件直接删除用-i参数):
sed的删除操作是针对文件的行,如果想删除行中的某个字符,那就用替换(别急,替换稍后就讲,而且替换是sed最常用的)
重点:sed命令实现对文件内容的替换(替换是在shell自动化脚本中用到最多的操作)
- #================源文件里面的内容===============================
- [root@jie1 ~]# cat test
- anonymous_enable=YES
- write_enable=YES
- local_umask=022
- xferlog_enable=YES
- connect_from_port_20=YES
- root:x:0:0:root:/root:/bin/bash
- bin:x:1:1:bin:/bin:/sbin/nologin
- daemon:x:2:2:daemon:/sbin:/sbin/nologin
- adm:x:3:4:adm:/var/adm:/sbin/nologin
- lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
- DEVICE="eth0"
- BOOTPROTO="static"
- HWADDR="00:0C:29:90:79:78"
- ONBOOT="yes"
- IPADDR=172.16.22.1
- NETMASK=255.255.0.0
- #======================================================================
- [root@jie1 ~]# sed -i '/DEVICE/c\Ethernet' test
- #匹配DEVICE的行,替换成Ethernet这行
- [root@jie1 ~]# sed -i 's/static/dhcp/' test
- #把static替换成dhcp(/,@,#都是前面所说的地址定界符)
- [root@jie1 ~]# sed -i '/IPADDR/s@22\.1@10.12@' test
- #匹配IPADDR的行,把22.1替换成10.12由于.号有特殊意义所有需要转义
- [root@jie1 ~]# sed -i '/connect/s#YES#NO#' test
- #匹配connect的行,把YES替换成NO
- [root@jie1 ~]# sed -i 's/bin/tom/2g' test
- #把所有匹配到bin的行中第二次及第二次之后出现bin替换成tom
- [root@jie1 ~]# sed -i 's/daemon/jerry/2p' test
- #把所有匹配到bin的行中第二次出现的daemon替换成jerry,并在生产与匹配行同样的行
- [root@jie1 ~]# sed -i 's/adm/boss/2' test
- #把所有匹配到adm的行中仅仅只是第二次出现的adm替换成boss
- [root@jie1 ~]# sed -i '/root/{s/bash/nologin/;s/0/1/g}' test
- #匹配root的行,把bash替换成nologin,且把0替换成1
- [root@jie1 ~]# sed -i 's/root/(&)/g' test
- #把root用括号括起来,&表示引用前面匹配的字符
- [root@jie1 ~]# sed -i 's/BOOTPROTO/#BOOTPROTO/' test
- #匹配BOOTPROTO替换成#BOOTPROTO,在配置文件中一般用于注释某行
- [root@jie1 ~]# sed -i 's/ONBOOT/#&/' test
- #匹配ONBOOT的行的前面添加#号,在配置文件中也表示注释某行
- [root@jie1 ~]# sed -i '/ONBOOT/s/#//' test
- #匹配ONBOOT的行,把#替换成空,即去掉#号,也一般用作去掉#注释
- #================执行以上sed命令之后文件显示的内容====================
- [root@jie1 ~]# cat test
- anonymous_enable=YES
- write_enable=YES
- local_umask=022
- xferlog_enable=YES
- connect_from_port_20=NO
- (root):x:1:1:(root):/(root):/bin/nologin
- bin:x:1:1:tom:/tom:/stom/nologin
- daemon:x:2:2:jerry:/sbin:/stom/nologin
- daemon:x:2:2:jerry:/sbin:/stom/nologin
- adm:x:3:4:boss:/var/adm:/sbin/nologin
- lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
- Ethernet
- #BOOTPROTO="dhcp"
- HWADDR="00:0C:29:90:79:78"
- ONBOOT="yes"
- IPADDR=172.16.10.12
- NETMASK=255.255.0.0
sed引用变量:(在自动化shell脚本 中也经常会使用到变量)
第一种当sed命令里面没有默认的变量时可以把单引号改成双引号;
第二种当sed命令里面有默认的变量时,那自己定义的变量需要加单引号,且sed里面的语句必须用单引
- [root@jie1 ~]# cat >> myfile << EOF
- > hello world
- > i am jie
- > how are you
- > EOF #先生成一个文件
- [root@jie1 ~]# cat myfile
- hello world
- i am jie
- how are you
- [root@jie1 ~]# name=li
- #定义一个变量,且给变量赋值
- [root@jie1 ~]# sed -i "s/jie/$name/" myfile
- #把匹配jie的字符替换成变量的值
- [root@jie1 ~]# cat myfile
- hello world
- i am li
- how are you
- [root@jie1 ~]# sed -i "$a $name" myfile
- #当sed命令也有默认变量时,在去引用自己定义的变量会出现语法错误
- sed: -e expression #1, char 3: extra characters after command
- [root@jie1 ~]# sed -i '$a '$name'' myfile
- #在引用自定义的变量时,sed语句必须用单引引住,然后把自定义的变量也用单引号引住
- [root@jie1 ~]# cat myfile
- hello world
- i am li
- how are you
- li
- [root@jie1 ~]#
sed的其它高级使用:
1)把正在用sed操作的文件的内容写到例外一个文件中
- [root@jie1 ~]# cat test #sed操作的文件中的内容
- Ethernet
- #BOOTPROTO="dhcp"
- HWADDR="00:0C:29:90:79:78"
- ONBOOT="yes"
- IPADDR=172.16.10.12
- NETMASK=255.255.0.0
- [root@jie1 ~]# sed -i 's/IPADDR/ip/w ip.txt' test
- #把sed操作的文件内容保存到另外一个文件中,w表示保存,ip.txt文件名
- [root@jie1 ~]# cat ip.txt #查看新文件的内容
- ip=172.16.10.12
- [root@jie1 ~]#
2)读取一个文件到正在用sed操作的文件中
- [root@jie1 ~]# cat myfile #文件内容
- hello world
- i am li
- how are you
- li
- [root@jie1 ~]# cat test #将用sed操作的文件的内容
- Ethernet
- #BOOTPROTO="dhcp"
- HWADDR="00:0C:29:90:79:78"
- ONBOOT="yes"
- IPADDR=172.16.10.12
- NETMASK=255.255.0.0
- [root@jie1 ~]# sed -i '/Ethernet/r myfile' test
- #在匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后
- [root@jie1 ~]# cat test #再次查看用sed命令操作的行
- Ethernet
- hello world
- i am li
- how are you
- li
- #BOOTPROTO="dhcp"
- HWADDR="00:0C:29:90:79:78"
- ONBOOT="yes"
- IPADDR=172.16.10.12
- NETMASK=255.255.0.0
- [root@jie1 ~]#
sed的经典例子:
- ##1)、处理以下文件内容,将域名取出并进行计数排序,如处理:
- http://www.baidu.com/index.<a target="_blank" href="http://www.2cto.com/kf/qianduan/css/" class="keylink" style="border:none; padding:0px; margin:0px; color:rgb(51,51,51); text-decoration:none; font-size:14px">html</a>
- http://www.baidu.com/1.html
- http://post.baidu.com/index.html
- http://mp3.baidu.com/index.html
- http://www.baidu.com/3.html
- http://post.baidu.com/2.html
- 得到如下结果:
- 域名的出现的次数 域名
- 3 www.baidu.com
- 2 post.baidu.com
- 1 mp3.baidu.com
- [root@localhost shell]# cat file | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn
- 3 www.baidu.com
- 2 post.baidu.com
- 1 mp3.baidu.com
- [root@codfei4 shell]# awk -F/ '{print $3}' file |sort -r|uniq -c|awk '{print $1"\t",$2}'
- 3 www.baidu.com
- 2 post.baidu.com
- 1 mp3.baidu.com
- ##2)、用grep结合sed取出网卡的ip地址
- [root@jie1 ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e 'N;s/eth[0−9].*\n.*addr:[0−9]{1,3}\.[0−9]{1,3}\.[0−9]{1,3}\.[0−9]{1,3}.*/\1 \2/p'
awk和sed命令的更多相关文章
- AWK与SED命令
linux系统比较常用的AWK与SED命令,这两个命令主要是格式化文本文件信息.接下来将详细介绍这两个命令的基本用法以及可以实现的功能. 一.AWK命令 AWK语言的基本功能是在文件或者字符串中基于指 ...
- linux中cut、printf、awk、sed命令
cut.printf.awk.sed在linux中都是用来处理文本的命令,接下来一个一个看. 一.cut命令 cut [选项] 文件名 选项: 主要使用一下两个参数,若是只使用 -f 则默认的分割符为 ...
- 处理海量数据的grep、cut、awk、sed 命令
grep.cut.awk.sed 常常应用在查找日志.数据.输出结果等等,并对我们想要的数据进行提取. 通常grep,sed命令是对行进行提取,cut跟awk是对列进行提取 处理海量数据之grep命令 ...
- awk与sed命令面试题整理
1.sed命令123abc456456def123567abc789789def567要求输出:456ABC123123DEF456789ABC567567DEF789答案:sed -r -i 's# ...
- linux之awk、sed命令
总结: 两个命令的正则表达式都用''单引号进行区分. 输出变量名用单引号,输出变量值用双引号,这个在bash脚本里一般是通用的. 在bash脚本里要使用变量值,都要加上双引号 awk用法: 参考网址: ...
- 【Shell】shell截取字符串方式(cut、awk、sed命令)
1.cut -b :以字节为单位进行分割.这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志.-c :以字符为单位进行分割. -d:自定义分隔符,默认为制表符. -f:与-d一起使用,指定显示 ...
- Linux学习--第十一天--source、环境变量目录、欢迎信息、正则、cut、awk、sed、sort、判断表达式、if、for、case、一些脚本
source source /root/.bashrc #让修改后的配置文件在不重启系统的情况下生效.source等同于. 环境变量目录 /etc/profile /etc/profile.d/*.s ...
- Linux字符串截取和处理命令 cut、printf、awk、sed、sort、wc
1. cut [选项] 文件名 -f 列号 #提取第几列(分隔符默认为\t) -d 分隔符 #指定分隔符 例如:cut -f 2 a.txt #截取文件a.txt内容的第二列(列号从1开始) cu ...
- grep,awk和sed的常用命令和语法
Grep的常用命令语法 1. 双引号引用和单引号引用在g r e p命令中输入字符串参数时,最好将其用双引号括起来.例如:“m y s t r i n g”.这样做有两个原因,一是以防被误解为 s h ...
随机推荐
- Git版本控制 Git、github,gitlab相关操作
目录 关于版本控制 版本管理工具 集中式管理 分布式管理 git版本管理 git介绍 软件安装 Git工作状态 原理流程步骤 git基本操作 对文件进行修改 分支 共享仓库 创建共享仓库: 共享仓库上 ...
- python中的列表和元组都有哪些区别
列表(list)和元组(tuple)的一些基础 list和tuple都是一个可以放置任意数据类型的有序集合,都是既可以存放数字.字符串.对象等 list和tuple都支持负索引 In [8]: num ...
- shell重定向输出的应用
shell重定向输出的应用 案例2:重定向输出的应用 2.1问题 本例要求编写一个脚本/root/out.sh,功能特性如下: 执行此脚本显示I love s ...
- Python:Day05-2
面向对象进阶 在前面的章节我们已经了解了面向对象的入门知识,知道了如何定义类,如何创建对象以及如何给对象发消息.为了能够更好的使用面向对象编程思想进行程序开发,我们还需要对Python中的面向对象编程 ...
- MTK Android ROM与RAM的区别
ROM与RAM 简单的说,一个完整的计算机系统是由软件和硬件组成的.其中,硬件部分由中央处理单元CPU(包括运算器和控制器).存储器和输入/输出设备构成.目前个人电脑上使用的主板一般只能支持到1GB的 ...
- hicharts中treemap添加超链接
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...
- python 网络编程---粘包
一.什么是粘包?(只有在TCP中有粘包现象,在UDP中永远不会粘包) 黏包不一定会发生. 如果发生 了:1.可能是在客户端已经粘了 2.客户端没有粘,可能是在服务端粘了. 所谓的粘包问题:主要是是因为 ...
- linux系统管理,查看系统资源
free 查看内存使用情况 -b ===> 以byte为单位 -k ===> 以Kb为单位 -m ===> 以Mb为单位 -g ===> 以Gb为单位 -t ...
- Flask 入门(九)
外键数据库 我们想想,所有的数据不可能这么简单,万一建的数据库有了外键呢?如何增加,如何查询? 承接上文: 先登录mysql数据库,把里面的表和数据都删了 执行语句: use data select ...
- 01-启动jmeter目录功能
1.bin :存储了jmeter的可执行程序,如启动脚本.配置程序 docs: api扩展文档存放 lib: lib\ext 存储了jmeter的整合的功能(如.jar文件程序,和第三方 ...