Linux日常之命令awk
参考:http://www.zsythink.net/archives/tag/awk/
一. 命令awk简介
1. awk是一种编程语言,用于对文本和数据进行处理的
2. 具有强大的文本格式化能力
3. 利用命令awk,可以将一些文本整理成为我们想要的样子
4. 命令awk是逐行进行处理的
二. grep、sed、awk的简单比较
1. 命令grep,更适合单纯的查找或匹配文本
2. 命令sed,更适合对匹配到的文本进行编辑
3. 命令awk,更适合文本格式化,对文本进行较复杂的格式处理
三. 命令awk基本语法
awk [options] 'pattern{action}' file
1. 在没有options和pattern的情况下,使用命令awk

2. pattern包括两种特殊模式,分别是BEGIN和END
(1)BEGIN模式,是指命令在处理文本之前执行

(2)END模式,是指命令在处理文本之后执行

(3)BEGIN模式和END模式同时存在时,其中,BEGIN与END之间的{}相当于一个循环体,对文件中的每一行进行处理

3. 常用的参数
(1)-F,用于指定输入分隔符

(2)-v,用于设置变量的值


从文件中输入变量

四. 变量
awk中的变量分为内置变量和自定义变量两种
1. 内置变量
| FS | 输入字段分隔符,默认为空白字符 |
| OFS | 输出字段分隔符,默认为空白字符 |
| RS | 输入记录分隔符(输入换行符),指定输入时的换行符 |
| ORS | 输出记录分隔符(输出换行符),指定输出时的换行符 |
| NF | 当前行的字段数(当前行被分隔符分割成了几段) |
| NR | 当前行的行号 |
| FNR | 不同文件分别计数 |
| FILENAME | 当前文件名 |
| ARGV | 数组,保存的是命令行所给定的各参数 |
| ARGC | ARGC数组的个数 |
(1)FS:以“:”为字段输入分隔符,输出第1列和第2列
1)使用-F选项指定输入分隔符

2)使用内置变量FS指定输入分隔符,需要注意的是,使用变量时,要使用-v选项来指定对应的变量

(2)OFS:以“#”为字段输出分隔符,输出第1列和第2列

(3)RS:以“:”为行输入分隔符,输出对应的行号和当前行内容。
需要注意的是,两个红框中的内容,由于Jack和DEF、Alice和GHI之间没有“:”,所以在awk中被认作为同一行

(4)ORS:以“---”为行输出分隔符

(5)NF:当前行的字段数
其中,$NF表示的是最后一个字段的内容,$(NF-1)表示的是倒数第二个字段的内容
(6)NR:当前行号
(7)FNR:不同文件分别计数

(8)FILENAME:显示当前行的文件名

(9)ARGV:数组,保存的是命令行所给定的各参数

(10)ARGC:保存的是ARGV数组的个数

2. 自定义变量
(1)使用-v来自定义变量(在上第三节已介绍)
(2)在awk中直接定义

五. 格式化中,awk使用printf时需要注意的问题
1. 使用printf输出的文本不会换行,如果需要换行,可以在对应的“格式替换符”后加入“\n”进行转义
2. 使用printf输出时,“指定的格式”与“被格式化的文本”之间,要用“,”隔开
3. 使用printf输出时,“格式”中的“格式替换符”必须与“被格式化的文本”一一对应(个数要相同)
六. awk中的pattern模式
当awk进行逐行处理时,会把pattern作为条件,判断当前行是否满足条件,若跟pattern匹配,则进行后面的处理,否则,跳过当前行。

1. 正则表达式
awk下的正则表达式与grep下的区别:
1)awk下: awk '/正则表达式/{print}' /etc/passwd
2)grep下: grep "正则表达式" /etc/passwd

需要注意的是
1)在awk的正则表达式中,若出现"/",则需要进行转义,在其前面加"\"
2)当使用{x,y}类型次数匹配的正则表达式时,需要使用--posix选项或--re-interval选项
2. 行范围匹配
awk '/正则表达式1/,/正则表达式2/{action}' file
表示的是,从被正则表达式1匹配到的行开始,到被正则表达式2匹配到的行结束,之间所有的行都会执行对应的动作。
七. 关系运算符
| 关系运算符 | 含义 | 用法实例 |
| < | 小于 | x<y |
| <= | 小于等于 | x<=y |
| > | 大于 | x>y |
| >= | 大于等于 | x>=y |
| == | 等于 | x==y |
| != | 不等于 | x!=y |
| ~ | 匹配 | x~/正则表达式/ |
| !~ | 不匹配 | x!~/正则表达式/ |
八. 条件判断
if(表达式)
{语句1}
else if(表达式)
{语句2}
else
{语句3}
实例
awk 'BEGIN{
test=100;
if(test>90){
print "very good";
}
else if(test>60){
print "good";
}
else{
print "no pass";
}
}'
九. 循环语句
1. while循环语句
while(表达式)
{语句}
实例
awk 'BEGIN{
test=100;
total=0;
while(i<=test){
total+=i;
i++;
}
print total;
}'
2. for循环语句
1)第一种
for(变量 in 数组)
{语句}
2)第二种
for(变量;条件;表达式)
{语句}
3. do循环语句
do
{语句}
while(条件)
Linux日常之命令awk的更多相关文章
- 一个不会coding的girl Linux日常之命令awk
Linux日常之命令awk 参考:http://www.zsythink.net/archives/tag/awk/ 一. 命令awk简介 1. awk是一种编程语言,用于对文本和数据进行处理的 2. ...
- 10 程序员必备:Linux日常维护命令
一.服务器硬件配置 1.查看硬盘及分区情况 # fdisk -l 2.查看分区空间使用情况 可以查看各分区大小.已使用.可用.已使用百分比.挂载情况 1)默认单位为K # df 2)可读性更好的显示, ...
- Linux日常维护命令
对于程序员来说,掌握一些基本的Linux命令是必不可少的,即使现在用不到,在不久的将来也应该会用到.由于Linux有很多命令,每个命令基本可以用一篇文章介绍,所以本文仅总结一些常用命令的常用用法,如有 ...
- Linux日常使用命令
pwd 当前目录的路径ls -a 显示隐藏文件ls -l h* 显示所有以h开头的文件ls -d b* 显示所有以b开头的文件夹ls -l *.log 所有后缀是.log 的文件dir 显 ...
- Linux 日常维护命令
1 防火墙配置 1)重启后生效 开启: chkconfig iptables on 关闭: chkconfig iptables off 或者 /sbin/chkconfig --level ...
- Linux文本分析命令awk的妙用
基本用法 awk是一个强大的文本分析工具,简单来说awk就是把文件逐行读入,(空格,制表符)为默认分隔符将每行切片,切开的部分再进行各种分析处理 awk命令格式如下 awk [-F field-sep ...
- linux日常常用命令分析
日志处理: 测试网络路由: xargs使用方法: tcpdump命令分析: dd 写入磁盘测试 cpu个数: 查看网卡流量 查看端口联通情况,临时加端口 ntpdate同步: 可以取出变动的密码: 导 ...
- Linux日常之命令sort
素材借鉴:https://www.cnblogs.com/51linux/archive/2012/05/23/2515299.html 命令sort 是Linux中常用的排序命令,属于管道命令. 常 ...
- Linux日常之命令grep
命令grep简介 利用该命令在文本中查找指定的字符串,是Linux中最常用的文本处理工具之一. 命令grep与正则表达式结合使用时,功能会非常强大. 命令grep会在文本文件中按照指定的正则表达式进行 ...
随机推荐
- Docker监控容器资源的占用情况
启动一个容器并限制资源 启动一个centos容器,限制其内存为1G ,可用cpu数为2 [root@localhost ~]# docker run --name os1 -it -m 1g --cp ...
- A smooth collaborative recommender system 推荐系统-浅显了解
characteristic: 1.Tracking user 2.personliza 3.面对的问题类似于分形学+混沌学(以有观无+窥一管而知全貌) 4.Data:high-volume.spar ...
- 并查集 --以cogs259为例
题目链接:http://cogs.pro:8081/cogs/problem/problem.php?pid=pySmxSVgP [问题描述] 或许你并不知道,你的某个朋友是你的亲戚.他可能是 ...
- 二、Linux用户身份
0.介绍: 管理员UID为0:系统的管理员用户. 系统用户UID为1-999: Linux系统为了避免因某个服务程序出现漏洞而被黑客提权至整台服务器,默认服务程序会有独立的系统用户负责运行,进而有效控 ...
- Mac下安装SecureCRT客户端并激活
1. 先下载SecureCRT和破解文件 默认下载到了当前用户的”下载”目录中 2. 在”Finder”中 打开 “scrt-7.3.0-657.osx_x64.dmg” 并将 SecureCRT复制 ...
- 【记录】看见的一些很好的博客x存一下
[字符串] AC自动机:https://www.cnblogs.com/cjyyb/p/7196308.html
- CentOS7-部署kubernetes
1 环境准备 节点 主机名 IP OS Master k8s-master 192.168.57.1 centos 7 Node1 k8s-nod ...
- Spring 的 AOP 概述和底层实现
Spring 的 AOP 概述和底层实现 1. 什么是 AOP AOP (Aspect Oriented Programing),即面向切面编程 AOP 采取横向抽取机制,取代了传统纵向继承体系重复性 ...
- C#面向对象16 访问修饰符
C# 访问修饰符 public:公开的公共的 private:私有的,只能在内部类中访问 protected:受保护的,子类可以访问和类的内部 internal:只能在当前项目/程序集中访问.在同一项 ...
- 你真的知道em和rem的区别吗?
前言 em 和 rem 都是相对单位,在使用时由浏览器转换为像素值,具体取决于您的设计中的字体大小设置. 如果你使用值 1em 或 1rem,它可以被浏览器解析成 从16px 到 160px 或其他任 ...