Shell基本语法---处理海量数据的awk命令

awk命令

其实是一门编程语言，支持条件判断，数组，循环等功能，与grep，sed被称为linux三剑客
之所以叫AWK是因为取其三位创始人 Alfred Aho，Peter Weinberger, 和 Brian Kernighan 的Family Name的首字符
awk的应用场景：通常对数据进行列的提取
语法：
- awk '条件 {执行动作}' 文件名
- awk '条件1 {执行动作} 条件2 {执行动作} ...' 文件名
- awk [选项] '条件1 {执行动作} 条件2 {执行动作} ...' 文件名
常用变量和命令：
- $0 #代表一整行 $1 #代表第一列 $2 #代表第二列
- NR：行号
- FS：分隔符
- BEGIN：在读取所有行内容前就开始执行，常常被用于修改内置变量的值
- END：结束的时候执行
- /xxx/：xxx表示正则表达式的规则
- printf #格式化输出，不会自动换行
  - %ns：字符串型，n代表有多少个字符
  - %ni：整型，n代表输出几个数字
  - %.nf：浮点型，n代表的是小数点后有多少个小数
- print #打印出内容，默认会自动换行
- \t #制表符
- \n #换行符

 printf '%s\t%s\t%s\t%s\t%s\t%s\n'      

 #打印第一列和第三列

 cat /etc/passwd | awk -F ":" '{print $1 $2}'

三剑客的区别：
- grep 更适合单纯的查找或匹配文本
- awk 更适合格式化文本，对文本进行较复杂格式处理
- sed 更适合编辑匹配到的文本
if、while以及for的使用和C语言类似，需要注意的是语句要整体包含在大括号类

 cat /etc/passwd | awk -F ":" '{if (NR == 20) {print $1} else if(NR == 21) {print $2} else {print $3}}'

 #手动格式化后，如下：

 {  #最外面的大括号不能少

     if (NR == )

     {

         print $

     }

     else if(NR == )

     {

         print $

     }

     else

     {

         print $

     }

 }

Shell基本语法---处理海量数据的awk命令的更多相关文章

Shell基本语法---处理海量数据的sed命令
sed命令 shell脚本三剑客之一处理时,把当前处理的行存储在临时缓冲区中,称为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕.接着处理下一行,这样不断重复,直到 ...
Shell基本语法---处理海量数据的grep命令
grep命令 shell脚本三剑客之一 grep应用场景:通常对数据进行行的提取语法:grep [选项] [内容] [file] -v 对内容进行取反提取 -n 对提取的内容显示行号 -w 精确匹 ...
Shell基本语法---处理海量数据的cut命令
cut命令 cut应用场景:通常对数据进行列的提取语法:cut [选项] [file] -d #指定分割符 -f #指定截取区域 -c #以字符为单位进行分割 # 以':'为分隔符,截取出/etc/ ...
shell基础 -- grep、sed、awk命令简介
在 shell 编程中,常需要处理文本,这里介绍几个文本处理命令. 一.grep 命令 grep 命令由来已久,用 grep 命令来查找文本十分方便.在 POSIX 系统上,grep 可以在两种正则 ...
【转】Awk 命令学习总结、AWk命令系列学习（linux shell)
前面的话学习linux 的同人,都知道linux shell文本处理能力非常强大.有一组强大的文本处理工具:grep,sed,awk . 其中grep 经常用作查找匹配文本.sed用作文本编辑替换. ...
Awk 命令学习总结、AWk命令系列学习（linux shell)
AWK基本语法下面没有提到awk命令怎么使用了,你可以通过运行:awk –h 查询到所有命令及参数!下面把awk作为一门语言分节介绍. linux awk 内置变量使用介绍 awk语言中,怎么 ...
linux awk命令详解
linux awk命令详解简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
AWK命令学习
使用方法 awk 'pattern {action}' {filenames} 尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到 ...
awk 命令
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...

随机推荐

深入理解跨域SSO单点登录原理与技术
[本文版权归微信公众号"代码艺术"(ID:onblog)所有,若是转载请务必保留本段原创声明,违者必究.若是文章有不足之处,欢迎关注微信公众号私信与我进行交流!] 一:SSO体系结 ...
01MySQL内核分析-The Skeleton of the Server Code
摘要这个官方文档一段对MySQL内核分析的一个向导.是对MySQL一条insert语句写入到MySQL数据库的分析. 但是,对于MySQL 5.7版本来说,基本上都是写入到innodb引擎.但也还是 ...
leetcode 力扣两数之和
class Solution: def addTwoNumbers(self, l1, l2): n1 = [] n2 = [] nl = [] while l1.next and l2.next: ...
7-4 List Leaves (25分) JAVA
Given a tree, you are supposed to list all the leaves in the order of top down, and left to right. I ...
使用 nuget server 的 API 来实现搜索安装 nuget 包
使用 nuget server 的 API 来实现搜索安装 nuget 包 Intro nuget 现在几乎是 dotnet 开发不可缺少的一部分了,还没有用过 nuget 的就有点落后时代了,还不快 ...
入门大数据---Flume整合Kafka
一.背景先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合 ...
Mariadb之事务隔离级别
上一篇我们聊到了mariadb的锁,以及怎么手动加锁和解锁等等,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/13196905.html:今天我们来聊一聊mar ...
博弈论Nim取子问题，困扰千年的问题一行代码解决
本文始发于个人公众号:TechFlow,原创不易,求个关注今天是算法与数据结构专题26篇文章,我们来看看一个新的博弈论模型--Nim取子问题. 这个博弈问题非常古老,延续长度千年之久,一直到20世纪 ...
ionic2/Angularjs cordova node.js
ionic 和 cordova 的区别环境的搭建{node.js,jdk1.8/jdk1.7,android sdk,intellijIdea,ionic,cordova} nodejs+ionic ...
mysql主从搭建操作
1.搭建说明准备工作:主从库已安装mysql软件以及xtracbackup备份工具.具体操作可参见mysql rpm安装文档. 介质版本操作系统 Red Hat Enterprise Linux S ...

Shell基本语法---处理海量数据的awk命令

Shell基本语法---处理海量数据的awk命令的更多相关文章

随机推荐

热门专题