linux-awk-3

awk

基础语法
Awk –Fs ‘/pattern/ {action}’ input-file
(或者)
Awk –Fs ‘{action}’ input-file

-F 为字段分界符。如果不指定，默认会使用空格作为分界符。
/pattern/和{action}9-AWk需要用单引号引起来。
/pattern/是可选的。如果不指定，awk 将处理输入文件中的所有记录。如果指定一个模式，awk 则只处理匹配指定的模式的记录。

Awk 程序结构(BEGIN,body,END)区域

BEGIN 区域
Begin 区域的语法:
BEGIN { awk-commands }
BEGIN 区域的命令只最开始、在 awk 执行 body 区域命令之前执行一次。
BEGIN 区域很适合用来打印报文头部信息，以及用来初始化变量。
BEGIN 区域可以有一个或多个 awk 命令
关键字 BEGIN 必须要用大写
BEGIN 区域是可选的
BODY区域
/pattern/ {action}
每次读取一行，执行一行

END 区域
END { awk-commands } 只执行一次

    awk  -F ":"  '/^root/{print }' passwd

内置变量
awk ‘BEGIN {FS=”,”} {print $2,$3}’ employee.txt
awk 'BEGIN {print "test1","test2"}'
不使用逗号是，awk 将不会使用 OFS，其输出变量之间没有任何空格

$ gawk 'BEGIN {print "Hello World!"} {print $0} END {print "byebye"}' data1
内建变量
$0 整条记录
$1 记录中的第1个数据字段
$2 记录中的第2个数据字段
$n 记录中的第n个数据字段
FIELDWIDTHS 一列由空格分隔的数字，定义了每个字段具体宽度
FS 输入字段分隔符
RS 输入记录分隔符
OFS 输出字段分隔符
ORS 输出字段分隔符

    ARGC 当前命令行参数个数
    ARGIND 当前文件在ARGV中的索引
    ARGV 包含命令行参数的数组
    CONVFMT 数字的转换格式（参见printf语句），默认值为%.6g
    ENVIRON 由当前shell环境变量及其值组成的关联数组
    ERRNO 当读取或关闭输入文件发生错误时的系统错误号
    FILENAME 用作gawk输入的数据文件的文件名
    FNR 当前数据文件中的记录数
    IGNORECASE 设成非零时，忽略gawk命令中出现的字符串的字符大小写
    NF 数据文件中的字段总数
    NR 已处理的输入记录数
    FNR  文件记录数
    OFMT 数字的输出格式，默认值为%.6g
    RLENGTH 由match函数所匹配的子串的长度
    RSTART 由match函数所匹配的子串的起始位置

   示例：
   命令行参数个数
   awk '{print ARGC}’ /etc/fstab /etc/inittab
   命令行各参数
   awk ‘BEGIN {print ARGV[0]}’ /etc/fstab /etc/inittab

awk '{print FILENAME, "record number is",NR,"FNR IS" ,FNR }' awk passwd

变量

Awk 变量以字母开头，后续字符可以是数字、字母、或下划线。关键字不能用作 awk 变量
awk 变量可以直接使用而不需事先声明。如果要初始化变量，最好在BEGIN 区域内作，它只会执行一次。

自定义变量
-v 或直接定义

  printf  格式化输出
  格式化输出：printf “FORMAT”, item1, item2, .
   (1) 必须指定FORMAT
   (2) 不会自动换行，需要显式给出换行控制符，\n
   (3) FORMAT中需要分别为后面每个item指定格式符

一元操作符
操作符         描述
+                  取正，数字本身返回
-                   取反
++
 -- 

 算术操作符

 操作符        描述
 +
 -
 *
 /
 %

 awk  'NR%2 == 0 {print  NR,$0}' passwd

 字符串操作符

    赋值操作符
    操作符             描述
    =
    +=
    -=
    *=
    /=
    %=

    比较操作符

    >
    >=
    <
    <=
    ==
    !=
    &&            且
    ||              或

    正则表达式

    操作符             描述
    ~                       匹配
    ！~                     不

   awk  -F:  '$1~"ro"'  passwd        第一个字段包含ro

    $ awk  'BEGIN   { FS=":";print  "begin  test"   }   {print  $1}   END  {print   "itis  end "}  '   passwd

匹配操作符
$1 ~ /^data/

gawk -F: '$4 == 0{print $1}' /etc/passwd

行范围
awk -F: ‘/^root\>/,/^nobody\>/ {print $1}'  /etc/passwd
awk -F: ‘(NR>=10&<=20){print NR,$1}' /etc/passwd  （小括号加不加都行） 

awk结构化命令
   if
   单条语句
   if(conditional-expression )   {statements ;.......}

   多条
    if (conditional-expression)
    {
        action1;  #依次执行
        action2;
    }

    if   else
    if (conditional-expression)
        action1
    else
        action2

        if(condition) {statements;…} else {statements;…}

     三元操作符
     codintional-expression ? action1 : action2 ;

     while
     while (codition)
            {                   

               Actions

              }

            while(conditon) {statments;…}    

      do-while  

      do
    {
        action
      }
     while(condition)

        for 

        for(initialization;condition;increment/decrement)
            for(expr1;expr2;expr3) {statements;…}

            if-then-else语句：
         if (condition) statement1; else statement2
        while语句：
         while (condition)
         {
         statements
         }
        do-while语句：
         do {
         statements
         } while (condition)
        for语句：
         for(variable assignment; condition; iteration process)
   示例
  seq  10 | awk  'i=0{print  $0}'     i=0不打印
  seq  10 | awk  'i=1{print  $0}'     =1  打印  与大括号无关
  seq  10 | awk  'i=!i{print i, $0}'   开始i未赋值,!i 为真（即1），打印，之后为假（0），不打印，只打印奇数行
  seq  10 | awk  '!(i=!i){print i, $0}'  同上，打印偶数行

  取磁盘利用率并显示
   df  -h  | awk  -F "[[:space:]]+|%"  '/^\/dev\/sd/{  if ($5>10)  print  $1, $5}'

   awk  '/^[[:space:]]*linux16/  {i=1;while (i<= NF) {print $i,length($i);i++} }'  /boot/grub2/grub.cfg

   for

   for(variable assignment;condition;iteration process)
      {for-body}

    awk  'BEGIN{wkd["mo"]="monday";wkd["fr"]="friday";wkd["sat"]="satday" ; for( i  in wkd ){ print i,wkd[i]}}'       

   awk  'BEGIN{sum=0; for (i=1;i<=100;i++){ sum+=i}  print sum  }'

    next:
    提前结束对本行处理而直接进入下一行处理（awk自身的循环）

    数组

    array[index-expression]
     index-expression:
(1) 可使用任意字符串；字符串要使用双引号括起来
(2) 如果某数组元素事先不存在，在引用时，awk会自动创建此元素，并将其值初始化为“空串”
(3) 若要判断数组中是否存在某元素，要使用“index in array”格式进行遍历

查看状态数
netstat -tan | awk '/^tcp/ {state[$NF]++} END{for(i in state) { print i,state[i] }} '

access.log  取前十ip   ,并加入防火墙

awk  '{ip[$1]++} END{for (i in  ip ){print  i, "连接数 " ip[i]}} '  access_log   | sort  -nr  -k 3   | head 

 加入iptables防火墙

 iptables -A INPUT -s IP -j REJECT

本机连接的ip 取前十

 awk '{split($5,ip,":");count[ip[1]]++;print ip[1],"链接数" , count[ip[1]]}'  ss.log |  sort  -nr  -k 3 | head 

 awk   -F "[[:space:]]+|:"  '{ ip[$6]++}END{for(i in ip) { print "summery", i,"links ",  ip[i] } }   '  ss.log  | sort  -nr  -k4     

取日志里ip ,以数字开头的，
 awk   '/^[0-9]/ {ip[$1]++ }  END{for (i  in ip )  print  i,ip[i]  } '  aess_log

 连接数大于100添加至防火墙
    while  true  ;  do

awk '/^[0-9]/ {ip[$1]++ } END{for (i in ip ) { if (ip[i]>100) print i} } ' access_log | while read line ;do echo " $line" ; done
sleep 10
done

do    iptables -A INPUT -s $line  -j  REJECT

取随机数
awk 'BEGIN{srand(); for(i=1;i<=10;i++){print rand()} }'

字符串操作
• length([s])：返回指定字符串的长度
• sub(r,s,[t])：对t字符串搜索r表示模式匹配的内容，并将第一个匹配内容替换为s
echo "2008:08:08 08:08:08" | awk 'gsub(/:/,"-",$0)'

作业：

        1 blog.magedu.com
        2 www.magedu.com
        3 hhhh.magedu.com
        4 dddd.magedu.com
        5 b333.magedu.com
        6 bkkk.magedu.com
        7 ssss.magedu.com
        8 wog.magedu.com
        9 ulog.magedu.com
        取主机名
        awk   -F "[ .]"   '{print $2}'  soho.txt   ：确定分隔符后取域

        取fstab 文件系统类型 出现次数
        awk  '/^UUID/{fs[$3]++} END{for (i in fs) {print i,fs[i] }  } '  fstab

        fstab 单词出现次数
        grep -wEo  "[[:alpha:]]+"   fstab   |  awk  '{word[$1]++}  END{for (i  in  word)   {print  i,word[i]  }   } '

        提取数字
        echo  "Yd$C@M05MB%9&Bdh7dq+YVixp3vpw"   |  awk  'gsub(/[^[:digit:]]/," ",$0 ) '

         产生随机数
         awk  'BEGIN{srand(); for (i=1;i<=200;i++)  { if (i==200 ) {printf "%d", int(rand()*100) ;}else   {printf "%d,", int(rand()*100) }} }'

         取如上随机数最大最小
           awk  -F ","    ' { MAX=$1;MIN=$1;  for (i=1;i<=NF;i++) {if  ( $i>= MAX  ) { MAX=$i } ;  if ( $i <= MIN) {  MIN=$i }  }  }  END{ print  "MAX=",MAX, "MIN=" ,MIN } '  soho.txt

        http://mail.magedu.com/index.html
        http://www.magedu.com/test.html
        http://study.magedu.com/index.html
        http://blog.magedu.com/index.html
        http://www.magedu.com/images/logo.jpg

       取完全限定域名
       确定分割符，选择域，计数打印
      awk   -F"/"  '{FQ[$3]++} END{ for(i  in  FQ )   print  i,FQ[i] }'  soho.txt   | sort  -rn  -k 2

 例题：

     inode|beginnumber|endnumber|counts|
    106|3363120000|3363129999|10000|
    106|3368560000|3368579999|20000|
    310|3337000000|3337000100|101|
    310|3342950000|3342959999|10000|
    310|3362120960|3362120961|2|
    311|3313460102|3313469999|9898|
    311|3313470000|3313499999|30000|
    311|3362120962|3362120963|2|

    输出格式
    310|3337000000|3362120961|10103|
    311|3313460102|3362120963|39900|
    106|3363120000|3368579999|30000|

     awk -F'|' -v OFS='|' '/^[0-9]/{inode[$1]++; if(!bn[$1]){bn[$1]=$2} else  if(bn[$1]>$2){bn[$1]=$2}; if(en[$1]<$3)en[$1]=$3;cnt[$1]+=$(NF-1)} E{for(i in inode)print i,bn[i],en[i],cnt[i]}'   soho.txt

用awk命令，计算一个目录下文件大小的总和
find  .     -maxdepth 1   -type  f -ls   | awk  '{sum+=$7}  END {print  sum} '

   统计链接到本地数最大的IP10个

     netstat  -an  | head   | awk  -F "[[:space:]]+|:"   ' NR> 2 {print $6}'

     netstat  -an  | head   | awk  -F "[[:space:]]+|:"   ' NR> 2 {ip[$6]++}  END{for (i in ip ) print i,ip[i] }' | sort -nr -k 2|head

linux-awk-3的更多相关文章

linux awk命令详解
linux awk命令详解简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
linux awk 中 RS,ORS,FS,OFS 区别与联系【转】
linux awk 中 RS,ORS,FS,OFS 区别与联系 http://blog.csdn.net/jesseen/article/details/7992929
Linux awk命令常见使用方法介绍
Linux awk命令常见使用方法介绍 By:授客 QQ:1033553122 awk运行方式有三种,其中常用的为命令行方式 awk [-F field_separator] '{patter ...
linux awk的用法
linux awk的用法 <pre>[root@iZ23uewresmZ ~]# cat /home/ceshis.txtb 12 42 30 b 03 43 25 a 08 10 16 ...
Linux awk命令 --三剑客老大
Linux awk命令 --三剑客老大基本用法: awk [参数] ['找谁{干啥}'] 文件参数: -F 分隔符 -v 创建或修改awk变量 OFS 输出分割符 awk显示每一列的时候分隔 ...
linux awk命令详解，使用system来内嵌系统命令， awk合并两列
linux awk命令详解简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
linux awk 命令实用手册
0,简介 Linux awk 是一个实用的文本处理工具,它不仅是一款工具软件,也是一门编程语言.awk 的名称来源于其三位作者的姓氏缩写,其作者分别是Alfred Aho,Peter Weinberg ...
linux awk 一看就懂
awk是什么 awk是linux环境下的一个命令行工具,但是由于awk强大的能力,我们可以为awk工具传递一个字符串,该字符串的内容类似一种编程语言的语法,我们可以称其为Awk语言,而awk工具本身则 ...
Linux awk命令详解??????????(研究)
http://blog.chinaunix.net/uid-25120309-id-3801250.html 一. AWK 说明 awk是一种编程语言,用于在linux/unix下对文本和数据进行 ...
linux awk浅析（转）
Awk 是一种非常好的语言,同时有一个非常奇怪的名称.在本系列(共三篇文章)的第一篇文章中,Daniel Robbins 将使您迅速掌握 awk 编程技巧.随着本系列的进展,将讨论更高级的主题,最后将 ...

随机推荐

vue--过滤器(私有，全局)
过滤器概念:Vue.js 允许你自定义过滤器,可被用作一些常见的文本格式化.过滤器可以用在两个地方:mustache 插值和 v-bind 表达式.过滤器应该被添加在 JavaScript 表达式的 ...
k8s-kubernetes-configmap存储
存储 configMap configMap描述信息 ConfigMap功能在Kubernetes1.2版本中引入,许多应用程序会从配置文件.命令行参数或环境变量中读取配置信息. ConfigMap ...
springboot基于方法级别注解事务的多数据源切换问题
springBoot多数据源配置配置读数据源 @Component @ConfigurationProperties(prefix = "jdbc.read") @Propert ...
springboot笔记-文件上传
使用 Spring Boot 和 Thymeleaf 上传文件 Spring Boot 利用 MultipartFile 的特性来接收和处理上传的文件,本示例前端页面使用 Thymeleaf 来处理. ...
[转载]Linux内核编译
原文地址:https://blog.csdn.net/qq_34247099/article/details/50949720 写在前面的话: 本人大二,东南大学一个软工狗,正在修一门名为<操作 ...
MySql 5.7关键字和保留字-附表
现在使用navicat图形界面或者Hibernate做映射生成表的时候,渐渐的会忽视掉关键字这个问题,而后续也会不断的产生错误提示,一遍遍的查询代码无果,甚至开始怀疑人生,但是其实很多情况下只是使用了 ...
使用html2canvas实现屏幕截图
相关文件(vue3.0) <script src="https://cdn.jsdelivr.net/bluebird/latest/bluebird.js">< ...
Delphi 字符串运算符
nacos集群搭建
nacos介绍 Nacos 支持基于 DNS 和基于 RPC 的服务发现(可以作为springcloud的注册中心).动态配置服务(可以做配置中心).动态 DNS 服务. 1.从官网下载nacos压缩 ...
6U VPX 高性能计算存储板卡
基于6U VPX的 XC7VX690T+C6678的双FMC接口雷达通信处理板一.板卡概述高性能VPX信号处理板基于标准6U VPX架构,提供两个标准FMC插槽,适用于电子对抗或雷达信号等领域 ...

linux-awk-3

linux-awk-3的更多相关文章

随机推荐

热门专题