day16 Linux三剑客之awk

1、什么是awk,主要作用是什么?

什么是awk,主要作用是什么?
awk 主要用来处理文件,将文本按照指定的格式输出。其中包含变量,循环以及数组。

2、awk的格式

awk的格式:
awk [选项] '匹配规则和处理规则' [处理文本路径]
[root@localhost ~]# awk -F: '{print $1}' /etc/passwd # 打印第一行 标准输出 | awk [选项] '匹配规则和处理规则'
[root@localhost ~]# cat /etc/passwd | awk -F: '{print $1}' # 打印第一行 常用命令选项:
-F fs fs指定输入分隔符,fs可以是字符串或正则表达式,如-F:
-v var=value 赋值一个用户定义变量,将外部变量传递给awk
-f scripfile 从脚本文件中读取awk命令
-m[fr] val 对val值设置内在限制,-mf选项限制分配给val的最大块数目;-mr选项限制记录的最大数目。这两个功能是Bell实验室版awk的扩展功能,在标准awk中不适用。 匹配规则主要是正则表达式
处理规则就有很多了:
设置变量
设置数组
数组循环
加减乘数运算
字符串拼接 匹配规则:
1、字符串
2、正则表达式 处理规则:
BEGIN{} : BEGIN是在awk处理文本之前运行 # 注:所有的变量的定义都应该放在BEGIN里面
// : 使用的匹配规则
{} :循环(每次只处理一行数据)
END{} :当所有的处理全部执行完毕之后,执行END中的相关操作 案例1:把/etc/passwd中的包含root的行打印出来
[root@localhost ~]# awk -F: '/root/' /etc/passwd 案例2:把/etc/passwd中以root开头的行打印出来
[root@localhost ~]# awk -F: '/^root/' /etc/passwd 案例3:将/etc/passwd中匹配第三列和第五列的数据
[root@localhost ~]# awk -F: '{print $3,$5}' /etc/passwd 案例4:打印以root或者ntp开头的行的解析器
[root@localhost ~]# awk -F: '/^(root|ntp)/{print $7}' /etc/passwd

3、awk的工作原理

    (1)awk会接收一行作为输入,并将这一行赋给awk的内部变量$0,每一行也可称为一个记录,行的边界是以换行符作为结束(表明:awk是一行一行的去处理文本的)

    (2)然后,刚刚读入的行被以:为分隔符分解成若干字段(或域),每个字段存储在已编号的变量中,编号从$1开始,最多达100个字段
# 注意:如果未指定行分隔符,awk将使用内置变量FS的值作为默认的行分隔符,FS默认值为空格,如果说要指定分隔符,需要使用-F参数或者重新定义FS变量 (3)使用print函数打印,如果$1$3之间没有逗号,它俩在输出时将贴在一起,应该在$1,$3之间加逗号,该逗号与awk的内置变量OFS保持一致,OFS默认为空格,于是以空格为分隔符输出$1和$3
我们可以指定:awk -F: 'BEGIN{OFS="-"}{print $1,$3}' /etc/passwd (4)输出之后,将从文件中获取另一行,然后覆盖给$0,继续(2)的步骤将该行内容分隔成字段。。。继续(3)的步骤
该过程一直持续到所有行处理完毕

4、awk中的变量

awk中的变量:
$0: 保存当前行的内容 # 打出所有
NR: 记录号(行号),每处理完一条记录,NR值加1 # 行号
NF: 保存记录的字段数,$1,$2...$100
FS: 输入字段分隔符,默认空格 # 'BEGIN{FS=":"}
OFS:输出字段分隔符 # 'BEGIN{OFS="+"}{print $3,$7}' 案例1:输出/etc/passwd中的所有内容包括行号。
[root@localhost ~]# awk -F: '{print NR,$0}' /etc/passwd 案例2:要求把第7行之后的内容输出出来,包括行号。
[root@localhost ~]# awk -F: 'NR>7 {print NR,$0}' /etc/passwd # 可以用条件来完成,NR代表行号 案例3:要求输出第7行之后的内容且第14行之前的内容输出出来,包含行号
[root@localhost ~]# awk -F: 'NR>7 && NR<14 {print NR,$0}' /etc/passwd 案例4:由案例3,要求输出每行的UID增加1
[root@localhost ~]# awk -F: 'NR>7 && NR<14 {print $3,$3+1}' /etc/passwd 案例5:要求输出倒数第3列
[root@localhost ~]# awk -F: '{print $(NF-2)}' /etc/passwd # 在这里NF代表最后一列 案例6:要求不使用-F参数,以:分割,并输出第3列和第5列
[root@localhost ~]# awk 'BEGIN{FS=":"}{print $3,$5}' /etc/passwd 案例7:要求实验证明-F 和 FS的优先级
[root@localhost ~]# awk -F/ 'BEGIN{FS=":"}{print $3,$5}' /etc/passwd # FS优先级>-F 案例8:要求以:分割,并输出第3列和第7列,第三列和第五列之间使用+号分割
[root@localhost ~]# awk -F: 'BEGIN{OFS="+"}{print $3,$7}' /etc/passwd

5、格式化输出

格式化输出
printf格式:
awk -F: '{printf "用户名:%s 用户id:%s\n",$1,$3}' /etc/passwd
awk -F: '{printf "|%-15s| %-10s| %-15s|\n", $1,$2,$3}' /etc/passwd
%s 字符类型
%d 数值类型
占15格的字符串
- 表示左对齐,默认是右对齐
printf默认不会在行尾自动换行,加\n
[root@localhost ~]# awk -F: 'BEGIN{OFS=" "}{printf "%-4d %s\n", $3,$7}' /etc/passwd 案例1:要求输出第1列和最后一列,排版整齐
第一种方法:
[root@localhost ~]# awk -F: '{printf "%-15s %s\n",$1,$NF}' /etc/passwd 第二种方法:适用于字符特别长的
[root@localhost ~]# awk -F: '{print length($1)}' /etc/passwd # 得到最长字符的个数
[root@localhost ~]# awk -F: '{printf "%-15s %s\n",$1,$NF}' /etc/passwd

6、操作模式

1)、正则模式
[root@localhost ~]#awk -F: '/^root/' /etc/passwd # //包含 2)、比较模式
> <
[root@localhost ~]# awk -F 'NR > 7' /etc/passwd # 比较> 3)、条件模式
[root@localhost ~]# awk -F: 'NR>7 && NR<14 {print NR,$0}' /etc/passwd # 达成条件执行 4)、算数运算
[root@localhost ~]# awk -F '{print $3,$3+1}' /etc/passwd # 给uid加1 5)、范围模式
[root@localhost ~]# awk -F: '/root/,/ftp/{print $1}' /etc/passwd # root到ftp的范围

7、流程控制

if

if判断:
单分支
if () {} 双分支
if () {} else {} 多分支
if(){} else if() {} else{} 案例1:打印奇数行的数据
[root@localhost ~]# awk -F: '{if(NR%2){print NR,$0}}' /etc/passwd 案例2:打印偶数行的数据
[root@localhost ~]# awk -F: '{if(NR%2==0){print NR,$0}}' /etc/passwd
[root@localhost ~]# awk -F: 'NR%2==0{print $0}' /etc/passwd # 单分支不加if也可以
注:单分支情况下是可以省略if,多分支情况下不能省略 案例3:要求打印出偶数行中的包含bash的行
[root@localhost ~]# awk -F: '/bash/{if(NR%2==0){print NR,$0}}' /etc/passwd 案例4:要求在奇数行前输出奇数,偶数行前输出偶数
[root@localhost ~]# awk -F: '{if(NR%2){printf "奇数行:%s\n",$0}else{printf "偶数行:%s\n",$0}}' /etc/passwd 案例5:在前7行前加7, 前14行前加14,其他原样输出
[root@localhost ~]# awk -F: '{if(NR<=7){printf "7 %s\n",$0,NR}else if(NR<=14){printf "14 %s\n",$0}else{print $0}}' /etc/passwd

for循环

for循环:
for (变量 in 数组) {语句}
for (变量;条件;表达式){语句} 知识储备:
++ : 每次加1
-- : 每次减1 案例1:将/etc/nginx/nginx.conf中的所有的词的个数
[root@localhost ~]# egrep -o '[0-9a-zA-Z]+' /etc/nginx/nginx.conf | awk '{arr[$1]++}END{for (i in arr){printf "%-15s %d\n", i,arr[i]}}' 案例2:要求统计以#开头的行中包含的词的格式
[root@localhost ~]# egrep '^ *#' /etc/fstab | egrep -o '[0-9a-zA-Z]+' /etc/nginx/nginx.conf | awk '{arr[$1]++}END{for (i in arr){printf "%-15s %d\n", i,arr[i]}}' 案例3:输入一个文件路径,要求打印出它的数字权限(不允许使用stat)
[root@localhost ~]# ll /etc/fstab | awk 'BEGIN{FS=""}{if($2=="r"){u+=4} if($3=="w"){u+=2} if($4=="x"){u+=1} if($5=="r"){g+=4} if($6=="w"){g+=2} if($7=="x"){g+=1} if($8=="r"){o+=4} if($9=="w"){o+=2} if($10=="x"){o+=1}}END{print u,g,o}'

while循环

while循环
格式:while(判断条件) {} 案例1:统计/etc/passwd中每个解析器的用户数
[root@localhost ~]# awk -F: '{arr[$NF]++}END{for (i in arr){print i,arr[i]}}' /etc/passwd 案例2:把/etc/passwd/中的每一行都重复打印3遍
[root@localhost ~]# awk -F: '{i=0;while (i<3){print $0;i++}}' /etc/passwd 案例3:要求把/etc/passwd中第10行中每一列都打印出来
[root@localhost ~]# awk -F: 'NR==10{i=0;while(i<=NF){print $i;i++}}' /etc/passwd

day16 Linux三剑客之awk的更多相关文章

  1. Linux实战教学笔记18:linux三剑客之awk精讲

    Linux三剑客之awk精讲(基础与进阶) 标签(空格分隔): Linux实战教学笔记-陈思齐 快捷跳转目录: * 第1章:awk基础入门 * 1.1:awk简介 * 1.2:学完awk你可以掌握: ...

  2. (转)不看绝对后悔的Linux三剑客之awk实战精讲

    原文:http://blog.51cto.com/hujiangtao/1923930 一.Linux三剑客之awk命令精讲 第1章 awk基础入门 1.1 awk简介 awk不仅仅时linux系统中 ...

  3. 磁盘分区 & Linux 三剑客之 awk

    今日内容 磁盘分区 Linux 三剑客之 awk 内容详细 一.磁盘分区 磁盘分区 --> 挂载 步骤 1.关机 2.添加硬盘 3.创建分区 fdisk /dev/sdb or gdisk /d ...

  4. Linux 三剑客之 awk 实战详解教程

    我们知道 Linux 三剑客,它们分别是:grep.sed.awk.在前边已经讲过 grep 和 sed,没看过的同学可以直接点击阅读,今天要分享的是更为强大的 awk. sed 可以实现非交互式的字 ...

  5. 一篇文章带你学会Linux三剑客之一:awk

    awk是一种用于处理文本.模式匹配的编程语言.与sed和grep,俗称Linux下的三剑客.学会 awk 等于你在 Linux 命令行里,又多了一种处理文本的选择.这篇文章重点教你如何使用,看完这篇文 ...

  6. Linux三剑客之awk命令

    awk简介 awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK 的确拥有自己的语言: AWK 程 ...

  7. 详解Linux三剑客之awk

    第一篇 awk简介与表达式实例 一种名字怪异的语言 模式扫描和处理,处理数据和生成报告. awk不仅仅是linux系统中的一个命令,而且是一种编程语言:它可以用来处理数据和生成报告(excel):处理 ...

  8. Linux三剑客之awk精讲(基础与进阶)

    第1章 awk基础入门 要弄懂awk程序,必须熟悉了解这个工具的规则.本实战笔记的目的是通过实际案例或面试题带同学们熟练掌握awk在企业中的用法,而不是awk程序的帮助手册. 1.1 awk简介 一种 ...

  9. Linux三剑客之awk

    awk awk是linux下的一个命令,他对其他命令的输出,对文件的处理都十分强大,其实他更像一门编程语言,他可以自定义变量,有条件语句,有循环,有数组,有正则,有函数等.他读取输出,或者文件的方式是 ...

随机推荐

  1. 非对称加密和linux上的 ssh-keygen 工具使用

    rsa :创造非对称加密的三个人名.原理是两个1024到2048之间的素数,以此为乘积.等... a*b=c  一般a*b为私钥端,c为公钥端.因为 c非常难算出a和b. ssh-keygen -t ...

  2. PE节表详细分析

    目录 PE节表详细分析 0x00 前言 0x01 PE节表分析 节表结构 节表数量 节表名字 节表大小 节位置 节表属性 0x02 代码编写 PE节表详细分析 0x00 前言 上一篇文章我们学习了PE ...

  3. OSI模型 & TCP/IP模型

    分层思想 分层思想:将复杂 的流程分解 为几个功能相对单一 的子过程 整个流程更加清晰 ,复杂问题简单化 更容易发现问题并针对性的解决问题 分层思想在网络中的应用 OSI模型 国际标准化组织(Inte ...

  4. node 中第三方模块的加载过程原理

    node 中第三方模块的加载过程原理 凡是第三方模块都必须通过 npm 来下载 使用的时候就可以通过require('包名') 的方式来进行加载才可以使用 不可能有任何一个第三方包和核心模块的名字是一 ...

  5. go闭包使用

    1.带参数闭包函数 func main() { //先调用闭包外面的方法传给变量 add_func := add(1, 2) //再调用里面的方法,因为有了i++ 同一个内存地址 在一次编译中i的值会 ...

  6. SqlServer新建表操作DDL

    创建新表:1,五要素 2,not null 3,默认值 4,字段注释,表名称 5,索引 6,指定约束名称 -- ------------------------------ Table structu ...

  7. 【SVG】SVG的夺命利器——path

    [SVG]SVG的夺命利器--path 博客说明 文章所涉及的资料来自互联网整理和个人总结,意在于个人学习和经验汇总,如有什么地方侵权,请联系本人删除,谢谢! 说明 昨天一发布,突然看到有朋友留言,希 ...

  8. dart系列之:dart语言中的异常

    目录 简介 Exception和Error Throw和catch Finally 总结 简介 Exception是程序中的异常情况,在JAVA中exception有checked Exception ...

  9. Flink 实践教程:入门(6):读取 PG 数据写入 ClickHouse

    作者:腾讯云流计算 Oceanus 团队 流计算 Oceanus 简介 流计算 Oceanus 是大数据产品生态体系的实时化分析利器,是基于 Apache Flink 构建的具备一站开发.无缝连接.亚 ...

  10. Python知识整理(二)

    6.高级特性--简化代码量 1.切片 L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3.即索引0,1,2,正好是3个元素. 如果第一个索引是0,还可以省略:L[:3] Python支持 ...