awk命令的基本使用

命令主要用法
　　-格式1:前置命令 | awk [选项] '[条件]{编辑指令}'
　　-格式2:awk [选项] '[条件]{编辑指令}' filename

常用命令选项
　　-F:指定分隔符,可省略(默认空格或者Tab位)
　　-f:调用awk脚本尽心个处理
　　-V:调用外部shell变量

内置变量
　　变量　　　　　　用途
　　FS 　　　　　　保存或设置字段分隔符,如FS=":"
　　$n 　　　　　　指定分隔的第n个字段,例如$1,$4分别表示第1例,第4例
　　$0 　　　　　　当前读入的整行文本内容
　　NF 　　　　　　记录当前处理行的字段个数(有多少列)
　　FNR 　　　　　　记录当前处理行在原文本内的行号
　　NR 　　　　　　记录当前已经读入行的数量(多个文本一起读取时,行数累加)
　　FILENAME　　当前处理的文件名
　　ENVIRON 　　调用shell环境变量,格式:ENVIRON["变量名"]

awk过滤的时机
　　BEGIN{}
　　　　读入第一行文本之前执行
　　　　一般用来初始化操作
　　逐行处理{}
　　　　逐行读入文本执行相应的处理
　　　　是最常见，用得最多的编辑指令块

　　END{}
　　　　处理完最后一行文本后执行
　　　　一般用来统计或处理结果
　　　　

[root@localhost ~]# awk '{print "第" FNR"行" ,"有"NF"列"}' a.txt

第1行 有2列

第2行 有4列

第3行 有2列

第4行 有3列

1）输出当前用户的UID

[root@localhost ~]# awk -F: '$1==ENVIRON["USER"]{print $3}' /etc/passwd

2）预处理

[root@localhost ~]# awk 'BEGIN{a=10;print a+10}'

3）统计使用bash的用户数量

[root@localhost ~]# awk 'BEGIN{x=0}/\<bash$/{x++}END{print x}' /etc/passwd

awk处理条件概述
　　格式
　　　　awk [选项] '[条件]{指令}' filename
　　条件的表现形式
　　　　正则表达式
　　　　　　/正则内容/
　　　　　　~匹配，!~不匹配
　　　　数值/字符串比较
　　　　　　==,!=,>=,<=,>,<等
　　　　逻辑比较
　　　　　　&&逻辑与：期望多条件都成立
　　　　　　||逻辑或：只要有一个条件成立即满足要求
　　　　运算符
　　　　　　-,+,*,/,%,++,--,+=,-=,*=,/=

1）正则内容

[root@localhost ~]# awk -F: '/^root/{print}' /etc/passwd

root:x:::root:/root:/bin/bash

2）~匹配，!~不匹配

[root@localhost ~]# awk -F: '$7!~/nologin/{print}' /etc/passwd

root:x:::root:/root:/bin/bash

sync:x:::sync:/sbin:/bin/sync

shutdown:x:::shutdown:/sbin:/sbin/shutdown

halt:x:::halt:/sbin:/sbin/halt

3）==,!=,>=,<=,>,<等，输出第二行文本

[root@localhost ~]# awk 'NR==2{print}' /etc/passwd

bin:x:::bin:/bin:/sbin/nologin

4）&&逻辑与：期望多条件都成立

[root@localhost ~]# awk -F: '$3>=0&&$3<=10{print $1,$3}' /etc/passwd

root

bin

daemon

adm

lp

sync

shutdown

halt

mail

uucp

5）运算符，统计文本总字段数量

[root@localhost ~]# awk -F: 'BEGIN{i=0}{i+=NF}END{print i}' /etc/passwd

awk流程控制
　　单分支
　　　　if(条件){指令}
　　双分支
　　　　if(条件){指令}else{指令}
　　多分支
　　　　if(条件){指令}else if{指令}else{指令}

　　while循环
　　　　while(条件){指令}
　　do while
　　　　do{指令}while(条件)

　　for循环
　　　　for(初始值;条件;步长){指令}

1）统计UID小于或等于500的用户个数

[root@localhost ~]# awk -F: 'BEGIN{i=0;j=0}{if($3<=500){i++}else{j++}}END{print i,j}' /etc/passwd

2）统计root出现次数

[root@localhost ~]# awk -F[:/] '{i=1}{while(i<=NF){if($i~/root/){j++};i++}}END{print j}' /etc/passwd

3）for循环

[root@localhost ~]# awk 'BEGIN{for(i=0;i<=10;i++){print i}}'

数组
　　定义数组
　　　　格式：数组名[下标]=元素值
　　调用数组
　　　　格式：数组名[下标]
　　遍历数组
　　　　用法：for(变量 in 数组名){print 数组名[变量]}
　　数组的经典使用
　　　　去除文本重复行：awk '!a[$2]++{print $2}' filename
　　　　逐行分析，遇到重复行就跳过

1）去重

[root@localhost ~]# cat a.txt 

[root@localhost ~]# awk '!a[$2]++{print $2}' a.txt

2）列出用户登陆shell的种类

[root@localhost ~]# awk -F: '!shell[$7]++{print $7}' /etc/passwd

/bin/bash

/sbin/nologin

/bin/sync

/sbin/shutdown

/sbin/halt

3）列出用户登陆shell的种类及个数，类似的可以统计web访问ip及访问次数

[root@localhost ~]# awk -F: '{shell[$7]++}END{for(i in shell){print i,shell[i]}}' /etc/passwd

/bin/sync

/bin/bash

/sbin/nologin

/sbin/halt

/sbin/shutdown

[root@localhost ~]# awk -F: '{shell[$7]++}END{for(i in shell){print i,shell[i]}}' /etc/passwd | sort -nr -k2

/sbin/nologin

/bin/bash

/sbin/shutdown

/sbin/halt

/bin/sync

4）统计nginx访问最多的ip

[root@ nginx]$ sudo awk '{ip[$1]++}END{for(i in ip) {print i,ip[i]}}' access.log | sort -nr -k2

146.145.196.170

111.7.10.21

124.25.17.151

47.92.114.243

11.7.100.24

111.7.100.22

111.7.100.20

106.14.217.247

47.92.126.167

11.7.100.23

111.7.10.19

111.7.100.25

111.7.10.18

111.7.100.27

111.7.10.26

80.82.70.187

83.143.86.62

80.82.78.104

awk命令的基本使用的更多相关文章

linux awk命令详解
linux awk命令详解简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
awk命令详解
搜索纠正错误添加实例 awk 文本和数据进行处理的编程语言补充说明 awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理.数据可以来自标准输入(stdin).一个或多个文件 ...
Linux安全基础：awk命令的使用
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...
AWK命令学习
使用方法 awk 'pattern {action}' {filenames} 尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到 ...
awk 命令
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...
AWK命令的用法
1.awk命令简介: awk是一种可以处理数据.产生格式化报表的语言,功能十分强大. awk的工作方式是读取数据,将每一行数据视为一条记录(record)每笔记录以字段分隔符分成若干字段,然后输出各个 ...
[Linux] linux awk命令详解
reference : http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.html 简介 awk是一个强大的文本分析工具,相对于g ...
awk命令简单介绍
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...
Linux的awk命令
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...
awk命令--update20150120
简介 awk是一个强大的文本分析工具,把文件逐行读入,以空格为默认分隔符分割成field,切开的部分再进行各种分析处理. 模式和动作: 任何awk语句都是由模式和动作组成,模式部分决定动作语句何时触发 ...

随机推荐

Rsync实现多台Windows工作电脑文件同步
你要准备的软件有: 最新版 Rsync for windows 服务端:cwRsync_Server_2.1.5_Installer.zip 客户端:cwRsync_2.1.5_Installer.z ...
thinkphp5---如何使用公共类
在进行项目开发的时候,有很多的类是前后台以及其他模块都会使用的,例如验证码,上传类,密码加密的类等以及一些其他的第三方类库,如何在项目中提取这些公共的类呢? 具体方法: 例如:我在这里定义上传的类,里 ...
db first和code first
1. db first 是现有数据库,再写代码.根据数据库的表生成类. django里面:python manage.py inspectdb 2. code first 是先写代码,后创建数据库. ...
DataProtection设置问题引起不同ASP.NET Core站点无法共享用户验证Cookie
这是这两天ASP.NET Core迁移中遇到的一个问题.2个ASP.NET Core站点(对应于2个不同的ASP.NET Core Web应用程序),2个站点都可以登录,但在其中任1个站点登录后,在当 ...
jdbc--------JdbcUtilDao 类
2018-12-14 目标:做成一个比较通用的 sql 操作 import com.ljs.util.JDBCUtil; 类名:JdbcUtilDao 1: 更新操作, 针对任何表,增加,删除,更新操 ...
CH 3401 - 石头游戏 - [矩阵快速幂加速递推]
题目链接:传送门描述石头游戏在一个 $n$ 行 $m$ 列 ($1 \le n,m \le 8$) 的网格上进行,每个格子对应一种操作序列,操作序列至多有 $10$ 种,分别用 $0 \sim 9$ ...
[No0000D6]端口-进程查询.bat
@echo off color a Title XP端口-进程查询 setlocal enabledelayedexpansion echo ╔- -╗ echo 本机开放的端口及使用该端口的进程 e ...
MyCAT 在 Cobar 的基础上，完成了彻底的 NIO 通讯，并且合并了两个线程池
研读: 1.http://www.mycat.io <Mycat权威指南> 第 2 章 Mycat 前世今生: 浏览: 深度认识 Sharding-JDBC:做最轻量级的数据库中间层 - ...
广播消费：允许一个 Group ID 所标识的所有 Consumer 都会各自消费某条消息一次。
什么是消息队列 RocketMQ?_消息队列 RocketMQ-阿里云 https://help.aliyun.com/document_detail/29532.html 2019-01-30 16 ...
http协议-https协议-相对协议
http协议.https协议.相对协议 http://www.baidu.com (使用http协议访问百度) https://wwww.badu.com (使用https协议访问百度) //www. ...

awk命令的基本使用

awk命令的基本使用的更多相关文章

随机推荐

热门专题