二:awk--将一行分为数个字段处理

PS:awk [option] '条件类型 {动作1} 条件类型{动作2} ...' filename

PS: awk ‘Pattern {action}’ filename

option 条件类型Pattern 动作
-F: 默认为空格
awk -F ':' '{print $3}' passwd
正则表达式或逻辑判断式 内置函数:print(),printf(),getline..
控制指令:if(){...}else{...};while(){...}等等

awk工作原理:

1:awk读取一条记录作为(文件中的一行)作为输入,并将这条记录赋值给内部变量$0
2:记录被分隔为多个字段,每一个字段都被存储到指定编号的变量中,从$1开始
3:对于每一条记录,按照给定的Pattern匹配,匹配成功则执行对应的Action,如匹配失败,则不执行Action
#Pattern和Action必须提供其中的一个,如果Action为{},则表示不做任何动作
4:重复上面的1-3步骤,直到文件结束

一:基本使用


1:awk处理文本是以一行为单位,它会遍历记录
[root@localhost tmp]# awk '{print $0}' passwd #$0代表一条记录,注意要用----单引号 2:输出指定列(字段)
[root@localhost tmp]# cat test.txt
aaa bbb ccc ddd
eee fff hhh iii
jjj kkk lll mmm
nnn ooo ppp qqq
[root@localhost tmp]# awk '{print $1,$3}' test.txt #默认分隔符就是空格
aaa ccc
eee hhh
jjj lll
nnn ppp 3:修斯一下表头和表尾
[root@localhost tmp]# awk -F ':' 'BEGIN{print "Line Col User "} {print NR,NF,$1}END{print "--------"FILENAME"--------"}' passwd
Line Col User
1 7 root
2 7 bin
3 7 daemon
4 7 adm
5 7 lp
6 7 sync
7 7 shutdown
--------passwd-------- [root@localhost tmp]# awk -F ':' 'BEGIN{print "User-UID-GID "} {print $1,$3,$4} END {print " "}' passwd
User-UID-GID
root 0 0
bin 1 1
daemon 2 2
adm 3 4
lp 4 7
sync 5 0
shutdown 6 0
##注意:print的字符串要用双引号括起来,不要忘记写被处理的文件
##BEGIN和END都不参与循环过程
##:BEGIN:表示在awk对文件处理之前---首先被执行
##:END:表示在awk对所有文件行处理完之后--才被执行 4:巧妙的显示奇数行/偶数行
[root@localhost tmp]# awk 'NR%2==0{next} {print NR,$0}' passwd
1 root:x:0:0:root:/root:/bin/bash
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
9 mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
...
##:NR内部变量,代表当前处理的行数;next:忽略后面指定的动作,直接进入下一行进行处理 [root@localhost tmp]# awk 'NR%2==1 {next}{print NR,$0}' passwd #输出偶数行 5:固定行数并合并
[root@localhost tmp]# cat -n input
1 one
2 two
3 three
4 four
5 five
6 six
7 seven
8 eight
9 nine
10 ten [root@localhost tmp]# awk 'NR%3!=0{T=(T " " $0);next} {print T, $0;T=""}' input
one two three
four five six
seven eight nine
###
● 首先,上面式子由两部分组成:
◇ 第一部分:NR%3!=0{T=(T""$0);next}。
◇ 第二部分:{print T,$0;T=""}。
● 第一部分,表示当NR(文件的当前的行号)不是3的倍数时,先执行{T=(T""$0);next},然后执行第二部分的内容。当NR是3的倍数时,直接执行第二部分的内容。
● 语句{T=(T""$0);next}中的T=(T""$0)表示将字符型变量T、空格和变量$0三者的值进行连接,然后再赋值给变量T。也就是说,awk语句每读取一行都把这行的内容追加到变量T中。
● 而next的作用很关键,它表示不再执行第二部分的语句,而是直接进行下一行的处理,这样就能保证awk把每3行一组的内容都存储到变量T中。
● 第二部分{print T,$0;T=""}表示输出变量T和$0的内容,并且把变量T的内容清空。
● 通过第一部分和第二部分的语句,可以实现3行一组的前两行内容会存放到变量T中,当处理到第三行时,就会把所有之前存储的内容都输出出来,然后就会清空变量T,再进行下一组数据的处理。 [root@localhost tmp]# awk 'NR%3!=0{T=(T " " $0);next} {print T, $0;T=""} END{print " "$0} ' input
###输出最后一行 5:不定行数合并----用到正则表达式
[root@localhost tmp]# cat -n input2.txt
1 xiaoming worktime is
2 89
3 88
4 87
5 86
6
7 xiaoqiang worktime is
8 77
9 78
10 79
11 80
12
13 xiaohong worktime is
14 69
15 68
16 66
[root@localhost tmp]# awk 'BEGIN{print T=""} /worktime/{print T;T=$0;next} {T=T " " $0} END{print T}' input2.txt xiaoming worktime is 89 88 87 86
xiaoqiang worktime is 77 78 79 80
xiaohong worktime is 69 68 66 ###分为4个部分:1:BEGIN{print T=""}:开始awk处理每行记录是,先执行的action
2: /worktime/ 模式匹配,匹配成功则执行{print T;T=$0;next}
3: 匹配不成功则执行{T=T " " $0}
4:END{print T}:awk处理完之后,最后执行的。 6:合并所有的行
[root@localhost tmp]# awk '{T=T " " $0}END{print T}' input.txt
one two three four five six seven eight nine ten

二:内置变量

name description
NR 每行的记录号---行号
NF 字段数量的变量--字段总数,列好
FILENAME 正在处理的文件名
1:打印内置变量
[root@localhost tmp]# awk -F ':' '{print NR,NF,FILENAME}' passwd
1 7 passwd
2 7 passwd
3 7 passwd
4 7 passwd
5 7 passwd
6 7 passwd
7 7 passwd
2:打印行号,列数和用户名
[root@localhost tmp]# awk -F ':' '{print "Line: "NR,"Col: "NF,"User:" $1}' passwd
Line: 1 Col: 7 User:root
Line: 2 Col: 7 User:bin
Line: 3 Col: 7 User:daemon
Line: 4 Col: 7 User:adm
Line: 5 Col: 7 User:lp
Line: 6 Col: 7 User:sync
Line: 7 Col: 7 User:shutdown
[root@localhost tmp]# awk -F ':' '{printf("Line: %s,Col: %s,User: %s\n",NR,NF,$1)}' passwd #方法二 3:显示passwd种用户ID大于100的行号和用户名
[root@localhost tmp]# awk -F ':' '{if($3>100){printf("Line: %s,Col: %s,User: %s\n",NR,NF,$1)}}' passwd
Line: 15,Col: 7,User: polkitd
Line: 17,Col: 7,User: avahi-autoipd
Line: 20,Col: 7,User: oracle

三:逻辑判断式

name description
,! 匹配正则表达式
==,!=,<,> 判断逻辑表达式
1:~使用,匹配以o开头用户id
[root@localhost tmp]# awk -F ':' '$1~/^o.*/{print $1}' passwd
operator
oracle
2:判断用户id大于100的用户
[root@localhost tmp]# awk -F ':' '$3>100{print $1}' passwd
polkitd
avahi-autoipd
oracle
[root@localhost tmp]#

四:案列

1:统计当前文件夹下的文件和文件夹的大小
1:[root@localhost usr]# du -sh * | sort -h ###文件实际占用的空间
2:[root@localhost usr]# ls -l | awk 'BEGIN{size=0}{size+=$5}END{print size/1024/1024 "M"} '
###du == disk usage (磁盘使用量,占用的磁盘空间)
###一个文件占用的磁盘空间和一个文件的大小是两码事情
###通常情况下,ls 显示的文件大小比du显示的磁盘占用空间小,比如文件系统的block是4K,一个13K的文件占用的空间是 13k/4k = 3.25 个block,一个block只能被一个文件占用,因此实际占用空间就是4个block,就是16K 2:统计当前passwd中的用户人数
[root@localhost tmp]# awk -F ':' 'BEGIN{count=0} $1!~/^$/{count++} END{print "count = " count}' passwd
count = 20
3:统计UID大于100的用户的UID
[root@localhost tmp]# awk -F ':' 'BEGIN{count=0} $3>100{count++;print $1} END{print "count = " count}' passwd
polkitd
avahi-autoipd
oracle
count = 3
###动作可以用;分开 方法2:
[root@localhost tmp]# awk -F ':' 'BEGIN{count=0} {if($3>100){name[count++]=$1}} END{for(i=0;i<count;i++)print i,name[i]}' passwd
0 polkitd
1 avahi-autoipd
2 oracle 4:杀死11005端口的所有进程
[root@localhost tmp]# ps -ef | grep 11005 | grep -v grep | awk '{print "kill -9 " $2 }' | sh

awk--基本操作的更多相关文章

  1. Linux awk学习

    零.awk标准语法 [root@wohaoshuai1 bbb]# echo "abcd" |awk 'BEGIN{print "wohaoshuai"} /a ...

  2. awk简单用法-(1)

    一.awk基本操作 awk指定多个分割符,分隔符中有:和空格,还有:和空格的组合,这个时候需要指定多个分隔符 -F'[ :]+',[ :]表示分隔符为:和空格,一个或者多个+号表示空格和:的组合也为一 ...

  3. sed与awk

    sed 格式 sed 选项 控制命令 文件或标准输入 sed 流程: (循环打印) sed是将文件里的每一行读入模式空间进行操作, sed选项 -r 支持正则表达 -n 取消默认打印 清空当前模式空间 ...

  4. Shell脚本之awk篇

    目录:一.概述二.awk基本语法格式三.awk基本操作四.awk条件及循环语句五.awk函数六.awk演示示例(源自于man手册) 一.概述 1. 产品概述: awk是一种编程语言,用于在linux/ ...

  5. 最全的三剑客和linux正则符号讲解

    第2章 linux符号系列与三剑客    194 2.1 特殊符号系列    194 2.1.1 普通符号系列    194 2.1.2 引号符号系列    196 2.1.3 定向符号    197 ...

  6. MySQL-->基础-->001-->MySQL基本操作

    一.MySQL安装 卸载mysql 第一步 sudo apt-get autoremove --purge mysql-server-5.0 sudo apt-get remove mysql-ser ...

  7. 【Linux】awk详细介绍

    awk简介 awk是一种使用方便且表现力很强的编程语言,它可以应用在多种不同的计算与数据处理任务中.由于awk天生提供对文件中文本分列进行处理,所以如果一个文件中的每行都被特定的分隔符(常见的是空格) ...

  8. AWK入门指南

    一. AWK入门指南 Awk是一种便于使用且表达能力强的程序设计语言,可应用于各种计算和数据处理任务.本章是个入门指南,让你能够尽快地开始编写你自己的程序.第二章将描述整个语言,而剩下的章节将向你展示 ...

  9. OSX终端 命令行的一些基本操作

    本文转载至 http://blog.csdn.net/xdrt81y/article/details/24058959 osx终端命令 OSX终端 命令行的一些基本操作终端 命令行的一些基本操作很多朋 ...

  10. AWK程序设计语言

    一. AWK入门指南 Awk是一种便于使用且表达能力强的程序设计语言,可应用于各种计算和数据处理任务.本章是个入门指南,让你能够尽快地开始编写你自己的程序.第二章将描述整个语言,而剩下的章节将向你展示 ...

随机推荐

  1. HTTP中GET与POST的区别颠覆式的理解

    关于http中的get和post你轻轻松松的给出了一个“标准答案”: GET在浏览器回退时是无害的,而POST会再次提交请求. GET产生的URL地址可以被Bookmark,而POST不可以. GET ...

  2. (八)C语言之printf

  3. LeetCode 145. 二叉树的后序遍历(Binary Tree Postorder Traversal)

    题目描述 给定一个二叉树,返回它的 后序 遍历. 示例: 输入: [1,null,2,3] 1 \ 2 / 3 输出: [3,2,1] 进阶: 递归算法很简单,你可以通过迭代算法完成吗? 解题思路 后 ...

  4. 前端使用pdf.js预览pdf文件,超级简单

    现在的浏览器基本都支持直接把pdf文件拖到浏览器就可以打开了,不用安装额外的插件.但是不同的浏览器显示的页面不一样.如果我们想在网页上统一预览pdf怎样实现呢? Mozilla开源了一个插件pdf.j ...

  5. OpenCV学习笔记(14)——轮廓的性质

    提取一些经常使用的对象特征 1.长宽比 边界矩形的宽高比                                       x,y,w,h = cv2.boundingRect(cnt) a ...

  6. re 模块, 正则表达式 \w+\d+ 的重复问题引发的题目解析

    题目 计算以下代码的结果 s = "?!.18)dajslj$12.15613sdadw.123sdasda35615.168sndsda$15.6sdasd.sdfsdgw123.156s ...

  7. 使用Navicat Premium 客户端绕过白名单限制mysql数据库

    针对有些数据库有白名单限制,但如果IP经常浮动的话,会要经常加白名单,但如果知道可以连接数据库的linux用户密码就能 通过SSH通道代理来连接数据库.保存密码后,这样就能直接连接数据库,减省很多麻烦 ...

  8. redis(3)主从与集群

    一.主从架构 yum安装的redis cd /etc/ cp redis.conf /etc/slave.conf vim slave.conf bind 192.168.42.7 slaveof p ...

  9. Oracle数据库提高sql查询效率总结

    我们要做到不但会写SQL,还要做到写出性能优良的SQL语句. (1)选择最有效率的表名顺序(只在基于规则的优化器中有效): Oracle的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句 ...

  10. SAS数据挖掘实战篇【一】

    SAS数据挖掘实战篇[一] 1数据挖掘简介 1.1数据挖掘的产生 需求是一切技术之母,管理和计算机技术的发展,促使数据挖掘技术的诞生.随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量.复 ...