awk脚本结合shell使用
需求:判断hadoop用户是否存在
**************************************************
#!/bin/bash
result=`awk -F ":" '{if($1=="hadoop") print $1}' /etc/passwd`
if [ -n result ]
then
echo "the $result is exists"
fi
运行:
./myawk.sh
**************************************************
如何判断NameNode进程是否启动
jps|awk '{if($2=="NameNode")print $2}'
**************************************************
用户名=>用户路径
vi myawk01.awk
BEGIN{
print "$$$$$$$$$$$$$"
FS=":"
OFS="=>"
}
{
print $1,$6
}
END{
print "@@@@@@@@@@@"
}
执行:
awk -f ./myawk01.awk /etc/passwd
**************************************************
#给输出信息加上表头( \t 表示空格 \n表示换行)
awk -F ":" 'BEGIN {print "name\tshell\n--------------------------------"}
{print $1"\t"$6}' /etc/passwd
----------------------------------------------------------
#给输出信息加上表头和末尾
awk -F : 'BEGIN {print "name\tshell\n--------------------------------"}
{print $1"\t"$6} END {print "end-of-report"}' /etc/passwd
awk -F ":" 'BEGIN {print"--BEGIN--"}$1=="root" { print $1} END{print"----END------"}' /etc/passwd
awk -F ":" 'BEGIN {print"--BEGIN--"}
{if( $1=="root") print $1}
END{print"----END------"}' /etc/passwd
-------------------------------------------------------------------
----------------------------------------------------------
正则表达式匹配格式
1)$n~正则表达式
2)if($n~正则表示式) print $0
----------------------------------------------------------
#打印以root开头的行
awk -F ":" '$0 ~ /^root/' /etc/passwd
#打印以ntp开头并以login结尾的行
awk -F : '$0 ~ /^ntp.*login$/ ' /etc/passwd
#打印包含nobody的行
awk -F : '{if($1~/nobody/) print $0}' /etc/passwd
#打印包含nobody或Nobody的行
awk -F : '{if($1~/[nN]obody/) print $0}' /etc/passwd
#打印n/N开头的行,
awk -F ":" 'BEGIN{print "userName"}{if($1~/^(n|N).*$/) print$0}' /etc/passwd
----------------------------------------------------------
#精确匹配|
#打印名字为root的用户在/etc/passwd文件中的记录
awk -F : '$1=="root" {print $0}' /etc/passwd
awk -F : '{ if($1=="root") print $0 }' /etc/passwd
----------------------------------------------------------
在awk中使用条件操作符
< 小于
>= 大于等于
<= 小于等于
== 等于
!= 不等于
~ 匹配正则表达式
!~ 不匹配正则表达式
----------------------------------------------------------
#或/与运算
awk -F : '$1~/(root|shawn)/ {print $0}' /etc/passwd
awk -F : '$1~/root/ || $1 ~/shawn/ {print $0}' /etc/passwd
awk -F : '{if($1~/root/ || $1 ~/shawn/) print $0}' /etc/passwd
awk -F : '$6~/home/ && $6~/shawn/ {print $0}' /etc/passwd
awk -F : '{if($1~/root/ || ($1~/shawn/)) print $0}' /etc/passwd
awk -F : '{if($1~/root/ || ($1~/shawn/)){print $0} else {print "other:"$0}}' /etc/passwd
awk -F : '{if($0!~/^ntp.*nologin$/) print $0}' /etc/passwd
----------------------------------------------------------
#内置变量
ARGC 命令行参数个数
ARGV 命令行参数排列
FS 设置输入域分隔符,与-F同 *****
NF 记录域的个数 *****
NR 已读的记录数 *****
OFS 输出域分隔符 *****
ORS 输出记录分隔符
RS 控制记录分隔符
----------------------------------------------------------
#FS的用法,注意FS要加双引号
awk 'BEGIN {FS=":"}{print $1}' /etc/passwd
#内置变量用法
BEGIN{
FS=":"
}
{
print $1,$6
}
END{
print "ddddd"
}
----------------
BEGIN {
FS=":"
OFS="="
}
{
print $1,$6
}
----------------
BEGIN {
FS=":"
OFS="="
}
{
print "Row " NR ":" $1,$6
}
----------------
将
BEGIN {
FS=":"
OFS="="
}
{
print "Row " NR ":" $1,$6,$NF
}
END{
print "当前共有" NF "列"
}
awk -f myawk.awk /etc/passwd
----------------------------------------------------------
#求和
awk -F " " 'BEGIN { SUM=0 } { SUM = SUM + $5 } END{ print "总额为:" SUM}' ./ employee.txt
封装到脚本方式:
BEGIN{
FS=" "
sum=0
}
{
sum=sum+$5
}
END{
print sum
}
将执行awk命令封装到shell脚本:
vi myawk03_sh.sh
#!/bin/bash
total= awk -f ./myawk03.awk ./employee.txt
echo "$total"
运行:
./myawk03_sh.sh
-------------------------------------------------------
#求平均值一
BEGIN {
FS=":"
SUM=0
}
{
SUM = SUM + $5
}
END{
print "平均值为:" SUM / NR
}
#求平均值二
BEGIN{
FS=" "
SUM=0
NUM=0
}
{
if($5 ~ /[0-9]+/){
SUM = SUM + $5
NUM = NUM + 1
}
}
END{
print "平均值为:" SUM / NUM
}
#求最大值
BEGIN {
FS=" "
MAX=0
}
{
if ($5 > MAX){
MAX = $5
}
}
END{
printf("最大值为:%d\n", MAX)
}
awk -f test4.awk employee.txt
----------------------------------------------------------
#数组应用一
BEGIN{
FS = " "
}
{
line[NR] = $0
}
END{
i = 1
while (i <=NR) {
print line[i]
i = i + 1
}
}
-----------------------------------------------------------
#数组应用二
BEGIN{
FS = ":"
}
{
line[NR] = $2
}
END{
for(i=1;i<=NR;i=i+1){
print line[i]
}
}
===================================================
1、统计各科修课人数
vi countstu.txt
xiaoA math 90
xiaoB chiese 23
xiaoD English 45
xiaoC jichu 76
xiaoM math 23
xiaoY chiese 12
xiaoK math 56
xiaoY math 23
xiaoQ math 34
xiaoY jichu 12
xiaoP jichu 100
vi countstu.awk
{
Number[$2]++
}
END{
for(course in Number)
printf("%10s %d\n", course, Number[course])
}
运行:
awk -f ./countstu.awk countstu.txt
-------------------------------------------------------
2、awk实现wordcount案例
vi words.txt
wo shi tiancai
wo bu shi tiancai que ding ma
运行方式一:
vi wordcount.awk
{
for (i = 1; i<=NF; i++)
freq[$i]++
}
END{
for (word in freq)
printf "%s%d\n",word,freq[word]
}
运行:
awk -f wordcount.awk words.txt
运行方式二:
vi wordcount_awk.sh
#!/bin/sh
awk -F " " '{
for (i = 1; i<=NF; i++)
freq[$i]++
}
END{
for (word in freq)
printf "%s%d\n",word,freq[word]
}' $1
chmod u+x wordcount_awk.sh
./wordcount_awk.sh words.txt
作业2:要求:将案例1和案例2使用shell脚本封装并且执行
注意:我已经删除一些字符!!!!
案例3:查看NameNode服务是否启动,如果没有启动就启动NameNode
process=`jps|grep -v Jps|awk -F " " '{if($2=="NameNode")print $2}'`
if [ -z $process ]
then
echo "the process is not running,start to running Namenode process..."
path=$(which hadoop-daemon.sh)
$path start namenode
echo "the NameNode process is running..."
else
echo "the NameNode process is already run"
fi
执行:
/bin/bash ./myawk05.sh
案例4:重写一个hdfs的重启动文件
#!/bin/bash
#get all process
all=`jps | grep -v Jps | awk -F " " '{print $1}'`
if [ -n "$all" ] ; then
echo 'found hadoop process is running...'
jps | grep -v Jps | awk -F ' ' '{print "shutdown proccess > " $2}'
kill -9 `jps | grep -v Jps | awk -F ' ' '{print $1}'`
echo 'restart process that you need...'
if [ -f "$HADOOP_HOME/sbin/hadoop-daemon.sh" ]; then
#/opt/bigdata/hadoop-2.7.1/sbin/start-dfs.sh
$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode
fi
else
echo 'not found hadoop process is running...'
echo 'start process that you need...'
if [ -f "$HADOOP_HOME/sbin/hadoop-daemon.sh" ]; then
#/opt/bigdata/hadoop-2.7.1/sbin/start-dfs.sh
$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode
fi
fi
----------------------------------------------------------
如何将awk脚本结合shell使用
需求:判断hadoop用户是否存在
**************************************************
#!/bin/bash
result=`awk -F ":" '{if($1=="hadoop") print $1}' /etc/passwd`
if [ -n result ]
then
echo "the $result is exists"
fi
运行:
./myawk.sh
awk脚本结合shell使用的更多相关文章
- awk如何向shell传值
今天写脚本,遇到awk脚本向shell传参的情况,上网谷歌一下,发现都有些麻烦,通过管道,通过eval,感觉都很复杂.于是想到用read来试一下. 首先构造一个测试文件test.txt,里面的内容是1 ...
- Shell awk文本处理,shell脚本编写
Shell awk文本处理,shell脚本编写 一:内容包含awk.变量.运算符.if多分支 <a>语法糖: awk [options] 'commands' files option - ...
- awk脚本
$0,意即所有域. 有两种方式保存shell提示符下awk脚本的输出.最简单的方式是使用输出重定向符号>文件名,下面的例子重定向输出到文件wow. #awk '{print $0}' grade ...
- awk中引用shell变量的方法
1.通过命令行参数定义变量时引用: awk -v awk变量名= shell变量名 #!/bin/bash var4bash=test awk -v var4awk="$var4bash&q ...
- Awk中调用shell命令
Awk中调用shell命令 需求 在awk中,有时候需要调用linux系统中命令,如计算字符串的MD5值,并保存下来. 方法参考 call a shell command from inside aw ...
- ./ . 和#!/bin/bash 辨析Linux如何选择当前执行脚本的shell
最近遇到一个有趣的问题,让我搞清楚Linux如何选择当前执行脚本的shell 执行cts的的 media stress test 需要安装 android-cts-media-1.0.zip 把这个文 ...
- awk中使用shell的环境变量
awk中使用shell的环境变量一:"'$var'"这种写法大家无需改变用'括起awk程序的习惯,是老外常用的写法.如:var="test"awk 'BEGIN ...
- awk 脚本同时解析多个文件
ARGC The number of command line arguments (does not include options to gawk ...
- shell脚本学习—Shell执行脚本
Shell作用是解释执行用户的命令,用户输入一条命令,Shell就解释执行这一条,这种方式称为交互式,但还有另一种执行命令的方式称为批处理方式,用户事先写一个Shell脚本,Shell可以一次把这些命 ...
- python调用脚本或shell的方式
python调用脚本或shell有下面三种方式: os.system()特点:(1)可以调用脚本.(2)可以判断是否正确执行.(3)满足不了标准输出 && 错误 commands模块特 ...
随机推荐
- deepin下的系统,如何为root用户添加密码
- 微信小程序关于小说类使用官方阅读器
https://doc.weixin.qq.com/doc/w3_AAcAYAbdAFwpM63n1R5SIat3aa4cX?scode=AJEAIQdfAAoYHVCBbdAG4A1QYmAFQ 上 ...
- 远程控制软件 TeamViewer 的局限性和替代方案
TeamViewer 公司创建于2005年,总部位于德国,客户遍及全球,其中企业用户居多,其各方面性能都很不错,但价格却非常贵.针对个人用户,TeamViewer 提供免费版软件,但时不时会提示&qu ...
- java学习之旅(day.21)
HTML 初识HTML HTML: Hyper Text Markup Language(超文本标记语言) 超文本包括文字.图片.音频.视频.动画等 W3C标准 W3C :World Wide Web ...
- 基于FPGA的数字钟设计---第三版
欢迎各位朋友关注"郝旭帅电子设计团队",本篇为各位朋友介绍基于FPGA的数字钟设计---第三版. 功能说明: 1. 在数码管上面显示时分秒(共计六个数码管,前两个显示小时:中间两个 ...
- Machine Learning - 笔记1
一.监督学习(supervised learning) 1.回归(regression) ①按我的理解来说,就是对于训练模型所用到的数据集,能够知道Input和Output的特征.比如 ...
- 腾讯面试:如何提升Kafka吞吐量?
Kafka 是一个分布式流处理平台和消息系统,用于构建实时数据管道和流应用.它最初由 LinkedIn 开发,后来成为 Apache 软件基金会的顶级项目. Kafka 特点是高吞吐量.分布式架构.支 ...
- 【C# mvc5】使用mvc5 +bootstrap+EF6搭建一个权限管理系统的心得体会
使用mvc5的体会,是 业务代码都可以独立分层,比如搭配多层架构,通过controller控制器传递需要渲染的列表,按钮.接受前端返回的实体模型等.总之我觉得要在前端渲染的数据可以写在controll ...
- 为什么下载程序的时候会提示win-amd64.exe
- OpenCV笔记(5) Rect类
看项目代码时,发现了Rect的神奇用法,rect = rect + point.于是了解了一下Rect类. 1. 构造函数 public Rect(Point location, Size size) ...