(1)awk工作原理
#awk -F: '{print $1,$3}' /etc/passwd
1)awk使用一行作为输入,并将这一行赋给内部变量$0,每一行也可称为一个记录,已换行符结束
2)然后行被:分割成字段,每个字段存储在已编号的变量中,从$1开始,最多达100个字段
3)awk如何知道用空格来分隔字段的呢,因为有一个内部变量FS来确定字段分割符。初始时FS被赋予空格
4)awk打印字段时,将以设置的方法使用print函数打印,awk在打印字段间加上空格,因为$1,$3之间有个逗号,逗号比较特殊,它映射为另一个内部变量,称为输出字段分割符OFS,OFS默认为空格
5)awk输出之后,将从文件中获取另一行,并将其存储在$0中,覆盖原来的内容,然后将新的字符串分割成字段并进行处理,该过程将持续到所有行处理完毕
(2)awk语法格式
1)语法格式:awk [options] 'command' filename
2)options
-F :定义输入字段分割符,默认的分隔符是空格或制表符(tab键)
3)command
BEGIN{}通常用于定义一些变量,例如BEGIN{FS=":";OFS="----"}
BEGIN{} {} END{}
行处理前 行处理 行处理后
# awk 'BEGIN{print 1/2}{print "ok"}END{print "-------"}' /etc/hosts
0.5
ok
ok
-------

4)命令格式:
awk 'pattern' filename 示例: awk -F:'/root/' /etc/passwd
awk '{action}' filename 示例:awk -F: '/root/{$1,$3}' /etc/passwd
awk 'pattern {action}' 示例:awk -F: '/root/{print $1,$3}' /etc/passwd
awk 'BEGIN{FS=":"}/root/{print $1,$3}' /etc/passwd
command | awk 'pattern{action}' 示例:df -P | grep "/" | awk '$4 > 25000 {print $0}'

(3)内部变量
$0:整行记录 示例:awk -F: '{print $0}' passwd
NR:行尾加个序号 示例:awk -F: '{print $0,NR}' passwd
FNR:行首加个序号 示例:awk -F: '{print FNR,$0}' passwd
NF:统计每行的字段数量 示例:awk -F: '{print $0,NF}' passwd
$NF:行最后一个字段 示例:awk -F: '{print $NF }' passwd awk -F: '{print $(NF-1)}' passwd
FS:输入字段分割符 示例:awk 'BEGIN{FS=":"}{print $1,$3}' /etc/passwd
  awk -F'[ :\t]' '/root/{print $1,$3}' /etc/passwd
  awk -F: '/root/{print $1,$3}' /etc/passwd
OFS:输出字段分隔符 示例:awk -F: '{print $1,$2,$3,$4}' /etc/passwd \\默认逗号就是空格
  awk 'BEGIN{FS=":";OFS="+++"}{print $1,$2,$3,$4}' /etc/passwd
ORS :输出行分隔符 示例:awk 'BEGIN{ORS=" "}{print $0}' passwd \\将文件合并成一行,ORS默认输出一条记录应该是回车,这里改成输出一条使用空格而不是换行符
RS:输入行分隔符 示例: # cat /etc/passwd | head -1 >passwd1
  awk 'BEGIN{RS=":"}{print $0}' passwd1 \\把一行内容根据分隔符输出成多行

总结:
字段分割符:FS OFS 默认空格或tab
行分隔符:RS ORS 默认换行符

(4)格式化输出
1)print函数
date | awk '{print "Mount:"$2 "\nYear:" $NF}'
awk -F: '{print "Username:" $1 "\tUid:" $3}' /etc/passwd
awk -F: '{print "Username,Uid:" $1,$3"!"}' /etc/passwd

2)printf函数
awk -F: '{printf "%-15s %-10s %-14s\n",$1,$2,$3}' /etc/passwd
%s:字符类型
%d:数值类型
%f:浮点类型
15:表示占用15个字符
- :表示左对齐,默认为右对齐
printf默认不会再行尾自动换行,加\n

(5)awk模式和动作
任何awk语句都由模式和动作组成,模式部分决定动作语句何时触发,模式可以是正则表达式,条件语句,复合语句
1)正则表达式
匹配整行:
#awk '/^root/' /etc/passwd
# awk '!/^root/' /etc/passwd
匹配字段:操作符(~ 或 ~!)
# awk -F: '$NF !~ /^bash/' /etc/passwd
# awk -F: '$1 ~ /^root/' /etc/passwd

2)关系运算符:< <= == != >= > 字符串比较需要双引号
awk -F: '$3 == 0' /etc/passwd
awk -F: '$3 < 10' /etc/passwd
awk -F: '$7 == "/bin/bash"' /etc/passwd
awk -F: '$1 ~ /root/' /etc/passwd
awk -F: '$1 !~ /root/' /etc/passwd
df -P | awk '$4 > 25000'
3)条件表达式
awk -F: '$3>300{print $0}' /etc/passwd
awk -F: '{if($3>300)print $0}' /etc/passwd
awk -F: '{if ($3>300){print $0}}' /etc/passwd
awk -F: '{if($3>300){print $3}else{print$1}}' /etc/passwd
4)算术运算:+ - * / % ^
awk -F: '{if($3*10 > 140 ){print $0}}' /etc/passwd
5)逻辑运算符:&&与 ||或 !
awk '$1~/root/ && $3<15' /etc/passwd
awk '!($1~/root/ && $3<15)' /etc/passwd
(6)awk脚本编程之条件判断
1)if语句 语法格式:{if(表达式){语句;语句;...}}
awk -F":" '{if($3 == 0){print $1,"is administrator!"}}' /etc/passwd
awk -F":" '{if($3>0 && $3<1000){count++;}} END{print count}' /etc/passwd \\统计系统用户数
2)if..else语句
语法格式:{if(表达式){语句;} else{语句;}}
awk -F":" '{if($3 == 0){count++;}else{i++;}} END{print "管理员个数:"count;print "系统用户数:"i}' /etc/passwd
3)if..else if..else语句 {if(表达式){语句} else if(表达式){语句} else{语句}}
awk -F":" '{if($3 == 0){count++;} else if($3>0 && $3<1000){i++;} else{j++}} END{print "管理员个数:"count;print "系统用户数:"i;print "普通用户数:"j}' /etc/passwd
(7)awk脚本编程之while循环
1)语法:{初始值;while(条件){语句;语句}}
awk 'BEGIN{i=1;while(i<=10){print i;i++}}' \\打印1到10
awk -F":" '{i=1;while(i<=7){print $i;i++}}' /etc/passwd
awk '{i=1;while(i<=NF){print $i;i++}}' /etc/hosts \\打印每行的字段

(8)awk脚本编程之for循环
1)语法:{for(条件){语句}}
awk 'BEGIN{for(i=1;i<=10;i++){print i}}'
awk '{for(i=1;i<=NF;i++){print $i}}' /etc/hosts 等同于awk '{i=1;while(i<=NF){print $i;i++}}' /etc/hosts

(9)awk脚本编程之数组:把需要遍历的对象作为数组的索引
awk '{数组名[遍历对象]++} END{for(i in 数组名){print i,数组名[i]}}'

统计shell种类: awk -F":" '{shells[$NF]++} END{for(i in shells){print i,shells[i]}}' /etc/passwd
统计网站状态:netstat -ant | grep '\b192.168.1.253:80\b' | awk '{status[$NF]++} END{for(i in status){print i,status[i]}}'
ss -an | grep "\b192.168.1.2:80\b" | awk '{status[$1]++} END{for(i in status){print i,status[i]}}'
统计当前访问的每个ip数量:
netstat -ant| grep "\b192.168.1.2:80\b" | awk -F '[ :]+' '{ip_count[$6]++} END{for(i in ip_count){print i,ip_count[i]}}'| sort -k2 -rn

(10)awk函数:
统计用户名是4个字符
#awk -F: '$1 ~ /^....$/{count++;print $1} END{print "count is:"count}' /etc/passwd
#awk -F: 'length($1)==4{count++;print $1} END{print "count is:"count}' /etc/passwd
(11)awk引用外部变量
打印挂载分区使用容量超过10%的分区 ,这里int($5)取整数
df -h | awk -v i=10 '{if(int($5) > i){print $6":"$5}}'

(4)三剑客之awk的更多相关文章

  1. Linux实战教学笔记18:linux三剑客之awk精讲

    Linux三剑客之awk精讲(基础与进阶) 标签(空格分隔): Linux实战教学笔记-陈思齐 快捷跳转目录: * 第1章:awk基础入门 * 1.1:awk简介 * 1.2:学完awk你可以掌握: ...

  2. (转)不看绝对后悔的Linux三剑客之awk实战精讲

    原文:http://blog.51cto.com/hujiangtao/1923930 一.Linux三剑客之awk命令精讲 第1章 awk基础入门 1.1 awk简介 awk不仅仅时linux系统中 ...

  3. shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计

    shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计 shell中的数组的用法: shell数组中的下标是从0开始的 array=("Allen" & ...

  4. shell编程系列20--文本处理三剑客之awk常用选项

    shell编程系列20--文本处理三剑客之awk常用选项 awk选项总结 选项 解释 -v 参数传递 -f 指定脚本文件 -F 指定分隔符 -V 查看awk的版本号 [root@localhost s ...

  5. shell编程系列19--文本处理三剑客之awk中的字符串函数

    shell编程系列19--文本处理三剑客之awk中的字符串函数 字符串函数对照表(上) 函数名 解释 函数返回值 length(str) 计算字符串长度 整数长度值 index(str1,str2) ...

  6. shell编程系列18--文本处理三剑客之awk动作中的条件及if/while/do while/for循环语句

    shell编程系列18--文本处理三剑客之awk动作中的条件及if/while/do while/for循环语句条件语句 if(条件表达式) 动作1 else if(条件表达式) 动作2 else 动 ...

  7. shell编程系列17--文本处理三剑客之awk动作中的表达式用法

    shell编程系列17--文本处理三剑客之awk动作中的表达式用法 awk动作表达式中的算数运算符 awk动作中的表达式用法总结: 运算符 含义 + 加 - 减 * 乘 / 除 % 模 ^或** 乘方 ...

  8. shell编程系列16--文本处理三剑客之awk模式匹配的两种方法

    shell编程系列16--文本处理三剑客之awk模式匹配的两种方法 awk的工作模式 第一种模式匹配:RegExp 第二种模式匹配:关系运算匹配 用法格式对照表 语法格式 含义 RegExp 按正则表 ...

  9. shell编程系列15--文本处理三剑客之awk格式化输出printf

    shell编程系列15--文本处理三剑客之awk格式化输出printf printf的格式说明符 格式符 含义 %s 打印字符串 %d 打印十进制数 %f 打印一个浮点数 %x 打印十六进制数 %o ...

  10. shell编程系列14--文本处理三剑客之awk的概述及常用方法总结

    shell编程系列14--文本处理三剑客之awk的概述及常用方法总结 awk是一个文本处理工具,通常用于处理数据并生成结果报告 awk的命名是它的创始人 Alfred Aho.Peter Weinbe ...

随机推荐

  1. 页面加载时给的子元素的第一个元素加class

    HTML代码: <div id="xiao"> <ul> <li></li> </ul> </div> js ...

  2. Struts2-part1

    作者:禅楼望月(http://www.cnblogs.com/yaoyinglong) 1. Struts2应用的开发步骤: ① 在web.xml中配置核心的Filter来拦截用户的请求. <w ...

  3. [剑指Offer] 24.二叉树中和为某一值的路径

    [思路] ·递归先序遍历树, 把结点加入路径. ·若该结点是叶子结点则比较当前路径和是否等于期待和. ·弹出结点,每一轮递归返回到父结点时,当前路径也应该回退一个结点 注:路径定义为从树的根结点开始往 ...

  4. 【bzoj1951】[Sdoi2010]古代猪文 费马小定理+Lucas定理+中国剩余定理

    题目描述 求  $g^{\sum\limits_{k|n}C_{n}^{\frac nk}}\mod 999911659$ 输入 有且仅有一行:两个数N.G,用一个空格分开. 输出 有且仅有一行:一个 ...

  5. 在VS2012中设置默认启动

    Visual Studio 2012一个解决方案中多个项目,如果想选择哪个项目就设置哪个项目为启动项就好了. 第一种方法,工具===〉〉选项===〉〉〉项目解决方案===〉〉〉对于新的解决方案,使用单 ...

  6. 2017 Multi-University Training Contest - Team 2 Puzzle

    题目大意: 给定n, m, p.然后按照一个规则往n*m的方格里填数,最后一个方格是空格,然后玩拼图游戏,问能否复原 规则是:把1~n*m-1的排列中的第1,p+1,2*p+1.....个数依次取出来 ...

  7. Windows查看进程CMD命令和终止进程CMD命令

    将小米路由器3刷机成openwrt的方法,请参考上篇文章< 家庭宽带多运营商接入方案>这里介绍怎么在已经刷成openwrt系统的小米路由器3上安装私有云nextcloud openwrt开 ...

  8. ZOJ 3229 Shoot the Bullet | 有源汇可行流

    题目: 射命丸文要给幻想乡的居民照相,共照n天m个人,每天射命丸文照相数不多于d个,且一个人n天一共被拍的照片不能少于g个,且每天可照的人有限制,且这些人今天照的相片必须在[l,r]以内,求是否有可行 ...

  9. maven与gradle的对比

    Java世界中主要有三大构建工具:Ant.Maven和Gradle.经过几年的发展,Ant几乎销声匿迹.Maven也日薄西山,而Gradle的发展则如日中天.笔者有幸见证了Maven的没落和Gradl ...

  10. ansible+docker

    1.准备镜像: 1007 docker run -itd --name client2 ff37bc5ab732 1008 docker run -itd --name client ff37bc5a ...