linux awk用法
awk是一个强大的文本分析工具,在对数据进行分析并生成报告时显得尤为强大。
使用方法:awk [options] 'BEGIN{ commands } pattern{ commands } END{ commands }' file,其中commands都包含在大括号内。
第一步:运行BEGIN{ commands }语句块中的语句
第二步:从文件或标准输入(stdin)读取一行,以空格为默认分隔符将每行切片,然后运行pattern{ commands }语句块,逐行读取直到文件被读取完毕
第三步:读至输入流末尾时运行END{ commands }语句块
1.一个简单的awk用法实例:
[root@oldboy ~]# awk -F: '{print $1,$6}' /etc/passwd
root /root
bin /bin
daemon /sbin
adm /var/adm
……
其中参数-F:指定原文件以:分片,print表示打印,$1和$6表示每一行的第1片和第6片($0表示整行内容),/etc/passwd表示要处理的文件。
2.使用pattern部分
上述例子表示对每一行进行处理,而使用pattern则可对满足条件的行进行处理。
例如创建一个文件b.txt
[root@oldboy ~]# cat b.txt
Alice girl
Bob boy dance bike
Jane girl
Lily girl tennis
[root@oldboy ~]# awk '$2>=20{print $1,$2}' b.txt
Bob
Lily
$2>=20表示第2片的值大于等于20时,才进行后续的打印操作。
3.begin语句块
begin语句块是在awk匹配文件之前运行的并且只执行一次,所以在begin语句块中$n是不可用的。一般情况下可以在begin语句块中做一些变量初始化的工作,或者一些只需要在开始打印一次的内容(例如输出表的表头)。
4.end语句块
end语句块是在awk循环执行完所有行的处理之后再执行的,end语句块中的内容也只执行一次,一般用于打印一些只需在末尾输出一次的内容。
注意begin语句块、pattern语句块和end语句块都在一个单引号内,并且单引号内的需要使用双引号。(尝试外层用双引号内层用单引号,有报错)
[root@oldboy ~]# awk 'BEGIN{print "name","age","gender"} $2>=20{print $1,$2,$3} END{print "end"}' b.txt
name age gender
Bob boy
Lily girl
end
5.awk使用变量
①awk中内置变量
FILENAME:awk浏览的文件名 NF:浏览记录的域的个数
NR:已读的记录数,如果有多个文件这个值不断累加 FNR:当前记录数,即自身文件的行号
FS:设置输入域分隔符,等价于-F参数 OFS:设置输出域分隔符
RS:输入的记录分隔符, 默认为换行符 ORS:输出的记录分隔符, 默认为换行符
ARGC:命令行参数个数 ARGV:命令行参数排列 ENVIRON:支持队列中系统环境变量的使用
[root@oldboy ~]# awk -v OFS='#' '{print "文件名:"FILENAME,"浏览记录数:"NR,"域个数:"NF,"行内容:"$1,$2} END{print "文件"FILENAME"处理完毕,行数为"NR}' b.txt
文件名:b.txt#浏览记录数:#域个数:#行内容:Alice#
文件名:b.txt#浏览记录数:#域个数:#行内容:Bob#
文件名:b.txt#浏览记录数:#域个数:#行内容:Jane#
文件名:b.txt#浏览记录数:#域个数:#行内容:Lily#
文件b.txt处理完毕,行数为4
②自定义变量
[root@oldboy ~]# a=
[root@oldboy ~]# b=
[root@oldboy ~]# awk -v x=$a -v y=$b 'BEGIN{print x+y}' [root@oldboy ~]# awk -F# 'BEGIN{COUNT=0} {count+=$2} END{print count}' a.txt
6.awk中的判断语句
[root@oldboy ~]# awk '$2>20{print}' b.txt
Lily girl tennis
[root@oldboy ~]# awk '{if($2>20) print}' b.txt
Lily girl tennis
[root@oldboy ~]# awk 'BEGIN{age=25;if(age>18){print "成年人"} else if(age==18){print "刚好18岁"} else{print "未成年人"} }'
成年人
7.awk中的循环语句
[root@oldboy ~]# awk 'BEGIN{sum=0;i=1;while(i<51){sum+=i;i++} print sum}' [root@oldboy ~]# awk 'BEGIN{sum=0;i=1;do{sum+=i;i++}while(i<51) print sum }' [root@oldboy ~]# awk 'BEGIN{sum=0;for(i=1;i<51;i++) {sum+=i} print sum}'
在判断语句和循环语句中,多条语句之间用分号隔开,复合语句块用大括号括起来。
awk循环语句中使用continue跳过当前循环,使用break退出整个循环。
8.awk使用数组
[root@oldboy ~]# cat test.txt
zhangsan
lisi
zhangsan
lisi
wangwu
[root@oldboy ~]# awk '{sum[$1]+=$2} END{for(k in sum) print k,sum[k]}' test.txt
zhangsan
lisi
wangwu
linux awk用法的更多相关文章
- linux awk的用法
linux awk的用法 <pre>[root@iZ23uewresmZ ~]# cat /home/ceshis.txtb 12 42 30 b 03 43 25 a 08 10 16 ...
- linux awk命令详解
linux awk命令详解 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
- awk 用法(使用入门)
转自:http://www.cnblogs.com/emanlee/p/3327576.html awk 用法:awk ' pattern {action} ' 变量名 含义 ARGC 命 ...
- 精通awk系列(4):awk用法入门
回到: Linux系列文章 Shell系列文章 Awk系列文章 awk用法入门 awk 'awk_program' a.txt awk示例: # 输出a.txt中的每一行 awk '{print $0 ...
- Linux awk命令 --三剑客老大
Linux awk命令 --三剑客老大 基本用法: awk [参数] ['找谁{干啥}'] 文件 参数: -F 分隔符 -v 创建或修改awk变量 OFS 输出分割符 awk显示每一列的时候分隔 ...
- linux awk命令详解,使用system来内嵌系统命令, awk合并两列
linux awk命令详解 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
- linux awk 命令实用手册
0,简介 Linux awk 是一个实用的文本处理工具,它不仅是一款工具软件,也是一门编程语言.awk 的名称来源于其三位作者的姓氏缩写,其作者分别是Alfred Aho,Peter Weinberg ...
- linux curl用法详解
linux curl用法详解 curl的应用方式,一是可以直接通过命令行工具,另一种是利用libcurl库做上层的开发.本篇主要总结一下命令行工具的http相关的应用, 尤其是http下载方面 ...
- awk用法小结(作者总结)
http://www.chinaunix.net/old_jh/24/691456.html http://wenku.baidu.com/view/ebac4fc658f5f61fb736664d. ...
随机推荐
- Ringo替换Paul
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
- 使用Dubbo的SPI扩展机制实现自定义LoadBalance——方法二 不改源码添加META-INF/dubbo元数据
一.官网提供的方法 参考官网 http://dubbo.apache.org/zh-cn/docs/dev/impls/load-balance.html 二.方法总结 在工程中创建类并实现LoadB ...
- js canvas游戏初级demo-上下左右移动
大概流程就是监听状态变化擦除画布重绘 由于js监听时间变化的函数addEventListener只能达到每秒触发20次左右,也就是每秒20帧,看起来有点卡卡的 所以用定时器搞到每秒30帧 按上下左右键 ...
- go/wiki/MutexOrChannel Golang并发:选channel还是选锁?
https://mp.weixin.qq.com/s/JcED2qgJEj8LaBckVZBhDA https://github.com/golang/go/wiki/MutexOrChannel M ...
- nginx上通过ssl证书将http转发为https
环境:阿里云linux,ngnix 1.16.0 ,ssl证书,XXXX.jar 0.自行在阿里云上下载免费的ssl证书.里面有2个文件.key和pem后面要用到. 1.首先将项目在linux上跑起来 ...
- JAVA RPC (三) 之thrift序列化协议入门杂谈
首先抱歉让大家久等了,最近工作的原因,再加上自己维护koalas rpc利用的大部分时间,一直没腾出空来写这篇文章. 先放出来自研的企业级RPC框架源代码地址,上面有使用方式和部署环境说明,说环境部署 ...
- 推送测试,生产环境无法打印log获取deviceToken,可以通过弹窗获取deviceToken
z- (void)application:(UIApplication *)application didRegisterForRemoteNotificationsWithDeviceToken:( ...
- golang的包管理---vendor/dep等
首先关于vendor 1 提出问题 我们知道,一个工程稍大一点,通常会依赖各种各样的包.而Go使用统一的GOPATH管理依赖包,且每个包仅保留一个版本.而不同的依赖包由各自的版本工具独立管理,所以当所 ...
- SpringBoot单元测试
一.Service层Junit单元测试 需要的jar包 <dependency> <groupId>org.springframework.boot</groupId&g ...
- 剑指offer-扑克牌顺子
题目描述 LL今天心情特别好,因为他去买了一副扑克牌,发现里面居然有2个大王,2个小王(一副牌原本是54张^_^)...他随机从中抽出了5张牌,想测测自己的手气,看看能不能抽到顺子,如果抽到的话,他决 ...