Linux备份-删除指定日期内文件
#!/usr/bin/env bash
source /etc/profile
echo " *************** start filter *************** "
# get befor six month last day
#m0=$(date -d "$(date -d 'month' +%Y%m01) -1 day" +%Y%m%d)
#echo ${m0}
#m1=$(date -d "$(date -d '0 month' +%Y%m01) -1 day" +%Y%m%d)
#echo ${m1}
#m2=$(date -d "$(date -d last-month +%Y%m01) -1 day" +%Y%m%d)
#echo ${m2}
#m3=$(date -d "$(date -d ${m2} +%Y%m01) -1 day" +%Y%m%d)
#echo ${m3}
#m4=$(date -d "$(date -d ${m3} +%Y%m01) -1 day" +%Y%m%d)
#echo ${m4}
#m5=$(date -d "$(date -d ${m4} +%Y%m01) -1 day" +%Y%m%d)
#echo ${m5}
#m6=$(date -d "$(date -d ${m5} +%Y%m01) -1 day" +%Y%m%d)
#echo ${m6}
# 取得当前月的最后一天,访问数组长度:${#m[*]} + ${#m[@]}
m[0]=$(date -d "$(date -d 'month' +%Y%m01) -1 day" +%Y%m%d)
echo m0 : ${m[0]} ' month : ' ${#m[@]}
for n in $(seq 0 11); do
m[$n+1]=$(date -d "$(date -d ${m[$n]} +%Y%m01) -1 day" +%Y%m%d)
echo m$[$n+1] : ${m[$n+1]} ' month : ' ${#m[*]};
done
echo " ****** time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "
max_date=0
# get the latest file and copy to hdfs
cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter
for dir in $(ls -l ./ | awk '/^d/{print $NF}')
do
if [[ -d $dir && $dir == *\_* ]]; then
f_d=$(echo $dir | cut -d \_ -f 3 | cut -d \. -f 1)
if [[ $max_date < $f_d ]]; then
max_date=$f_d
max_filter=$dir
fi
fi
done
echo " max date is : "$max_date
echo " max filter is : "$max_filter
pwd
# 复制最近日期的filter文件到hdfs
hadoop fs -test -e /data/datacenter/run_center_spark_stream/bloom_filters/$max_filter
if [[ $? == 0 ]]; then
echo " filter is already exist : "$max_filter
else
echo " start hdfs copy "
echo " ****** start time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "
hadoop fs -put $max_filter /data/datacenter/run_center_spark_stream/bloom_filters
echo " ****** end time : " $(date '+%Y-%m-%d %H:%M:%S') " ****** "
fi
remove_week=$(date -d "$max_date 7 days ago" +%Y%m%d)
echo " 删除本地序列化文件的日期界限:"$remove_week
remove_date=$(date -d "$max_date 30 days ago" +%Y%m%d)
echo " 删除文件 和 Hadoop filter 的日期界限:"$remove_date
echo " *************** start remove filter *************** "
for r_dir in $(ls -l ./ | awk '/^d/{print $NF}')
do
if [[ -d $r_dir && $r_dir == *\_* ]]; then
r_d=$(echo $r_dir | cut -d \_ -f 3 | cut -d \. -f 1)
if [[ $r_d < $remove_date ]]; then
if [[ ${m[*]} == *$r_d* ]]; then
cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter/$r_dir
pwd
for f_dir in $(ls *)
do
if [[ "$f_dir" == "mau_device_all.FILTER.SER" ]]; then
echo " ------ keep mau_filter is: " $f_dir;
else
echo " remove file is: " $f_dir;
rm -r $f_dir
fi
done
cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter
pwd
else
echo " remove filter_dir is: "$r_dir
rm -r $r_dir
fi
elif [[ $r_d < $remove_week ]]; then
if [[ $r_d == $m0 || $r_d == $m1 || $r_d == $m2 ]]; then
cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter/$r_dir
pwd
for f_dir in $(ls *)
do
if [[ "$f_dir" == "mau_device_all.FILTER.SER" ]]; then
echo " ------ week keep mau_filter is: " $f_dir;
else
if [[ "$f_dir" == *.FILTER.SER ]]; then
echo " - last day of month - week remove file is: " $f_dir;
rm -r $f_dir
fi
fi
done
cd /home/hadoop/streaming_run_center/tmp/checkpoint/filter
pwd
else
echo "week remove filter is: "$r_dir
rm -r $r_dir/*.FILTER.SER
fi
fi
fi
done
echo " =============== start remove hdfs filter =============== "
# 删除hdfs上指定日期外的tdid
for h_filter in $(hadoop fs -ls /data/datacenter/run_center_spark_stream/bloom_filters | awk '{print $8}')
do
if [[ $h_filter == *\_* ]]; then
h_date=$(echo $h_filter | cut -d \/ -f 6 | cut -d \_ -f 3 | cut -d \. -f 1)
# echo " hdfs date : "$h_date
# echo " hdfs filter : "$h_filter
if [[ ${m[*]} == *$h_date* ]]; then
echo " remain hdfs filter is : "$h_filter
elif [[ $h_date < $remove_date ]]; then
echo "not remain date is : "$h_date
echo "remove hdfs filter is : "$h_filter
hadoop fs -rmr $h_filter
fi
fi
done
echo " -------------- start tdid --------------- "
# 删除小于30天的tdid
cd /home/hadoop/streaming_run_center/tmp/checkpoint/tdidinfo
for tdid in $(ls *)
do
if [[ $tdid == *\_* ]]; then
t_d=$(echo $tdid | cut -d \_ -f 2 | cut -d \. -f 1)
if [[ $t_d == $max_date || $t_d > $max_date ]]; then
echo " need copy date : "$t_d
echo " need copy tdid : "$tdid
# 检查tdid是否存在
# hadoop fs -test -e jiaojiao/tdid/$tdid
# if [[ $? == 0 ]]; then
# echo " tdid is already exist,remove it first "
# hadoop fs -rm jiaojiao/tdid/$tdid
# hadoop fs -put $tdid jiaojiao/tdid
# else
# echo " start copy "
# hadoop fs -put $tdid jiaojiao/tdid
# fi
elif [[ $t_d < $remove_date ]]; then
echo " remove tdid : "$tdid
rm $tdid
fi
fi
done
#echo " =============== start remove hdfs tdid =============== "
#for h_tdid in $(hadoop fs -ls jiaojiao/tdid | awk '{print $8}')
#do
# if [[ $h_tdid == *\_* ]]; then
# h_date=$(echo $h_tdid | cut -d \_ -f 2 | cut -d \. -f 1)
# echo $h_date
# echo $h_tdid
# fi
#done
Linux备份-删除指定日期内文件的更多相关文章
- Window Linux下实现指定目录内文件变更的监控方法
转自:http://qbaok.blog.163.com/blog/static/10129265201112302014782/ 对于监控指定目录内文件变更,window 系统提供了两个未公开API ...
- Linux下查找指定日期的文件
一.背景 Linux服务器的一个目录里,每天产生海量的文件.为了防止磁盘被写满. 决定每天删除部分老文件.OK,问题来了,如何过滤出指定日期的文件? 二.强大的Linux 一行代码搞定: ls --f ...
- 【Linux】linux中删除指定日期之前的文件
要删除系统中就的备份文件,就需要使用命令了: #find /tmp -mtime +30 -type f -name *.sh[ab] -exec rm -f {} \; 假如在一个目录中保留最近30 ...
- centos6.5下oracle自动备份删除指定天数的文件
第一步先做一个备份 #!/bin/sh export ORACLE_BASE=/home/oracle/app export ORACLE_HOME=/dbhome_1 export ORACLE_S ...
- Debian下自动备份文件并上传到远程FTP服务器且删除指定日期前的备份Shell脚本
说明: 1.备份目录/home/osyunwei下面所有的文件到/home/osyunweibak里面,并且保存为osyunwei20120701.tar.gz的压缩文件格式(2012_07_01是 ...
- python 指定日期图片文件删除
手机使用python操作图片文件 起因 前几天去国图拍了一本书,一本心理学方面的书,也许你问我为什么不去买一本,或者去网上找pdf. 其实吧,关于心理学方面的书可以说在市面上一抓就是一堆,至于拍这本书 ...
- Linux下删除空文件,删除指定大小的文件
Linux下批量删除空文件(大小等于0的文件)的方法: find . -name "*" -type f -size 0c | xargs -n 1 rm -f 用这个还可以删除指 ...
- 利用任务计划自动删除指定日期的SQLServer备份文件
利用任务计划自动删除指定日期的SQLServer备份文件 命令FORFILES [/P pathname] [/M searchmask] [/S] [/C command] [/D ...
- linux下查找指定后缀的文件
1.linux下查找指定后缀的文件 例如查找当前目录下的所有后缀名时.c或.h的文件 find . -type f -regex ".*\.\(c\|h\)"
随机推荐
- 数论 HDOJ 5407 CRB and Candies
题目传送门 题意:求LCM (C(N,0),C(N,1),...,C(N,N)),LCM是最小公倍数的意思,C函数是组合数. 分析:先上出题人的解题报告 好吧,数论一点都不懂,只明白f (n + 1) ...
- AngularJs调用NET MVC 控制器中的函数进行后台操作
题目中提到的控制器指的是.NET MVC的控制器,不是angularjs的控制器. 首先看主页面的代码: <!DOCTYPE html> <html> <head> ...
- Linux命令(009) -- tar
tar命令可以为Linux的文件和目录创建档案(备份).利用该命令,可以为某一特定文件创建备份,也可以在档案中改变文件或向档案中加入新的文件:可以把一大堆的文件和目录全部打包成一个文件,这对于备份文件 ...
- Tcpdump的用法
见 超级详细Tcpdump 的用法 http://www.itshouce.com.cn/linux/linux-tcpdump.html
- WPF学习10:基于MVVM Light 制作图形编辑工具(1)
图形编辑器的功能如下图所示: 除了MVVM Light 框架是一个新东西之外,本文所涉及内容之前的WPF学习0-9基本都有相关介绍. 本节中,将搭建编辑器的界面,搭建MVVM Light 框架的使用环 ...
- AJPFX讲解java单例模式
单例设计模式概述: 单例模式就是要确保类在内存中只有一个对象,该实例必须自动创建,并且对外提供单例模式有以下特点: 1.单例类只能有一个实例. 2.单例类必须自己自己创建自己的唯一实例. 3 ...
- KVM环境下vCPU绑定到物理CPU
在KVM环境中测试虚拟系统性能时,如果宿主机是有两个CPU socket的硬件,会碰到由于vCPU在不同物理CPU上浮动导致测试RFC2544时出现少量丢包的现象,测试结果非常不稳定.可以将vCPU绑 ...
- redis-3.0.1 sentinel 主从高可用 详细配置
最近项目上线部署,要求redis作高可用,由于redis cluster还不是特别成熟,就选择了redis sentinel做高可用.redis本身有replication,实现主从备份.结合sent ...
- git的使用 及一些常见的错误处理
git安装使用 添加文件到Git仓库,分两步: 1.使用命令git add <file>,注意,可反复多次使用,添加多个文件: 2.使用命令git commit -m <messag ...
- jquery 获取日期 date 对象、 判断闰年
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...