awk是一个强大的文本分析工具,在对数据进行分析并生成报告时显得尤为强大。

使用方法:awk [options]  'BEGIN{ commands } pattern{ commands } END{ commands }'  file,其中commands都包含在大括号内。

第一步:运行BEGIN{ commands }语句块中的语句

第二步:从文件或标准输入(stdin)读取一行,以空格为默认分隔符将每行切片,然后运行pattern{ commands }语句块,逐行读取直到文件被读取完毕

第三步:读至输入流末尾时运行END{ commands }语句块

1.一个简单的awk用法实例:

[root@oldboy ~]# awk -F: '{print $1,$6}' /etc/passwd
root /root
bin /bin
daemon /sbin
adm /var/adm
……

其中参数-F:指定原文件以:分片,print表示打印,$1和$6表示每一行的第1片和第6片($0表示整行内容),/etc/passwd表示要处理的文件。

2.使用pattern部分

上述例子表示对每一行进行处理,而使用pattern则可对满足条件的行进行处理。

例如创建一个文件b.txt

[root@oldboy ~]# cat b.txt
Alice girl
Bob boy dance bike
Jane girl
Lily girl tennis
[root@oldboy ~]# awk '$2>=20{print $1,$2}' b.txt
Bob
Lily

$2>=20表示第2片的值大于等于20时,才进行后续的打印操作。

3.begin语句块

begin语句块是在awk匹配文件之前运行的并且只执行一次,所以在begin语句块中$n是不可用的。一般情况下可以在begin语句块中做一些变量初始化的工作,或者一些只需要在开始打印一次的内容(例如输出表的表头)。

4.end语句块

end语句块是在awk循环执行完所有行的处理之后再执行的,end语句块中的内容也只执行一次,一般用于打印一些只需在末尾输出一次的内容。

注意begin语句块、pattern语句块和end语句块都在一个单引号内,并且单引号内的需要使用双引号。(尝试外层用双引号内层用单引号,有报错)

[root@oldboy ~]# awk 'BEGIN{print "name","age","gender"} $2>=20{print $1,$2,$3} END{print "end"}' b.txt
name age gender
Bob boy
Lily girl
end

5.awk使用变量

①awk中内置变量

FILENAME:awk浏览的文件名  NF:浏览记录的域的个数  

NR:已读的记录数,如果有多个文件这个值不断累加  FNR:当前记录数,即自身文件的行号 

FS:设置输入域分隔符,等价于-F参数  OFS:设置输出域分隔符

RS:输入的记录分隔符, 默认为换行符  ORS:输出的记录分隔符, 默认为换行符

ARGC:命令行参数个数  ARGV:命令行参数排列  ENVIRON:支持队列中系统环境变量的使用

[root@oldboy ~]# awk -v OFS='#' '{print "文件名:"FILENAME,"浏览记录数:"NR,"域个数:"NF,"行内容:"$1,$2} END{print "文件"FILENAME"处理完毕,行数为"NR}'  b.txt
文件名:b.txt#浏览记录数:#域个数:#行内容:Alice#
文件名:b.txt#浏览记录数:#域个数:#行内容:Bob#
文件名:b.txt#浏览记录数:#域个数:#行内容:Jane#
文件名:b.txt#浏览记录数:#域个数:#行内容:Lily#
文件b.txt处理完毕,行数为4

②自定义变量

[root@oldboy ~]# a=
[root@oldboy ~]# b=
[root@oldboy ~]# awk -v x=$a -v y=$b 'BEGIN{print x+y}' [root@oldboy ~]# awk -F# 'BEGIN{COUNT=0} {count+=$2} END{print count}' a.txt

6.awk中的判断语句

[root@oldboy ~]# awk '$2>20{print}' b.txt
Lily girl tennis
[root@oldboy ~]# awk '{if($2>20) print}' b.txt
Lily girl tennis
[root@oldboy ~]# awk 'BEGIN{age=25;if(age>18){print "成年人"} else if(age==18){print "刚好18岁"} else{print "未成年人"} }'
成年人

7.awk中的循环语句

[root@oldboy ~]# awk 'BEGIN{sum=0;i=1;while(i<51){sum+=i;i++} print sum}'

[root@oldboy ~]# awk 'BEGIN{sum=0;i=1;do{sum+=i;i++}while(i<51) print sum }'

[root@oldboy ~]# awk 'BEGIN{sum=0;for(i=1;i<51;i++) {sum+=i} print sum}'

在判断语句和循环语句中,多条语句之间用分号隔开,复合语句块用大括号括起来。

awk循环语句中使用continue跳过当前循环,使用break退出整个循环。

8.awk使用数组

[root@oldboy ~]# cat test.txt
zhangsan
lisi
zhangsan
lisi
wangwu
[root@oldboy ~]# awk '{sum[$1]+=$2} END{for(k in sum) print k,sum[k]}' test.txt
zhangsan
lisi
wangwu

linux awk用法的更多相关文章

  1. linux awk的用法

    linux awk的用法 <pre>[root@iZ23uewresmZ ~]# cat /home/ceshis.txtb 12 42 30 b 03 43 25 a 08 10 16 ...

  2. linux awk命令详解

    linux awk命令详解 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...

  3. awk 用法(使用入门)

    转自:http://www.cnblogs.com/emanlee/p/3327576.html awk 用法:awk ' pattern {action} '  变量名    含义 ARGC   命 ...

  4. 精通awk系列(4):awk用法入门

    回到: Linux系列文章 Shell系列文章 Awk系列文章 awk用法入门 awk 'awk_program' a.txt awk示例: # 输出a.txt中的每一行 awk '{print $0 ...

  5. Linux awk命令 --三剑客老大

    Linux awk命令 --三剑客老大 基本用法: awk  [参数]  ['找谁{干啥}']  文件 参数: -F 分隔符 -v 创建或修改awk变量 OFS 输出分割符 awk显示每一列的时候分隔 ...

  6. linux awk命令详解,使用system来内嵌系统命令, awk合并两列

    linux awk命令详解 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...

  7. linux awk 命令实用手册

    0,简介 Linux awk 是一个实用的文本处理工具,它不仅是一款工具软件,也是一门编程语言.awk 的名称来源于其三位作者的姓氏缩写,其作者分别是Alfred Aho,Peter Weinberg ...

  8. linux curl用法详解

    linux ‍‍curl用法详解 ‍‍curl的应用方式,一是可以直接通过命令行工具,另一种是利用libcurl库做上层的开发.本篇主要总结一下命令行工具的http相关的应用, 尤其是http下载方面 ...

  9. awk用法小结(作者总结)

    http://www.chinaunix.net/old_jh/24/691456.html http://wenku.baidu.com/view/ebac4fc658f5f61fb736664d. ...

随机推荐

  1. 获取APP应用的包名信息

    语言: python 3.7 需求:获取APP的包名和程序入口信息,以便在 Appium 脚本中配置 appPackage 和 appActivity 参数. 场景一 资源:已有APP应用的apk安装 ...

  2. OO第一单元总结与心得体会

    一.结构度量 1. UML类图 第一次作业 第二次作业 第三次作业 2. 复杂度分析 (1)方法复杂度 ​ ev, iv, v这几栏,分别代指基本复杂度(Essential Complexity (e ...

  3. Excel文件导入导出(基于Nodejs、exceljs)

    Excel导入.导出是大多数项目的管理后台必备功能.几年来使用过多个该功能的实现包,最近一次开发该功能,突然发现一个人气极高(3000+)的包,这里记录一下使用方法. 大凡厉害的技术的文档咋一看都想字 ...

  4. 理解 Memory barrier(内存屏障)无锁环形队列

    原文:https://www.cnblogs.com/my_life/articles/5220172.html Memory barrier 简介 程序在运行时内存实际的访问顺序和程序代码编写的访问 ...

  5. 虚拟机中linux系统的安装教程

    虚拟机是什么? 虚拟机(Virtual Machine)是指一种特殊的软件,可以在计算机和用户之间创建一种环境,用户可以用这个软件所创建的环境来操作.虚拟机就像像真实机器一样运行程序,满足用户的需求. ...

  6. 【托业】【怪兽】TEST01

    101. respectable 值得尊敬的(形容人或事物) respectful 态度恭敬的(形容人) respecting 关于…… respective 各自的 102. hardly 几乎没有 ...

  7. SharePoint 已在此服务器场中安装 ID 为 XXXXXXXXX 的功能。请使用强制属性显式地重新安装此功能。解决方法

    图1: 图2: 解决方法: stsadm -o deploysolution -name ***.wsp -immediate -allowGacDeployment -url http://*** ...

  8. 学号20175313 《实现Linux下od -tx -tc XXX的功能》第九周

    目录 MyOD 一.题目要求 二.题目理解 三.需求分析 四.设计思路 五.代码链接 六.代码实现过程中遇到的问题 七.运行结果截图 八.参考资料 MyOD 一.题目要求 编写MyOD.java 用j ...

  9. Linux安装常见问题

    目录 1. SSL connect error 2. ERROR: certificate error 1. SSL connect error # fatal: unable to access ' ...

  10. python 批量ping脚本不能用os.system

    os.system(cmd)通过执行命令会得到返回值. ping通的情况下返回值为0. ping不通的情况: 1.请求超时,返回值1 2.无法访问目标主机,返回值为 0,和ping通返回值相同   所 ...