MongoDB通过Shell 实现集合的日常归档
1.MongoDB数据归档的意义
和其他类型的数据库一样,归档对MongoDB同样重要。通过归档,可以保持集合中合适的数据量,对数据库的性能是一种保障,也就是大家常说的数据冷热分离。
同时,归档对数据库的管理也带来了很大方便性,例如日常的备份、灾难恢复等。
在此,不再展开叙述了。
2.集合数据归档流程图
3.归档实现代码
- #
- # The file is used by cron to Archive the data of NeedArchiveColName_Archive collection,the collection is part of NeedArchiveDBColName DB.
- # The file is writed by DBA Carson Xu.If you find any error, please connect with me,thanks.
- # The version is defined V.
- # Version ModifyTime ModifyBy Desc
- # Ver001 -- : Carson Xu Create the Scripts File
- #
- #
- #!/bin/bash
- ######mongodb可执行文件所在文档路径,此例为4. ,同时支持3.4.4
- command_linebin="/QQMSG/mongo_db/mongobin404/bin/mongo"
- command_linebinT="/QQMSG/mongo_db/mongobin404/bin/mongo"
- ######存放导出过渡文件的文档路径和文件名字,ColA可用你的集合名字替代
- targetpath='/data/mongodb_back/ArchiveDB_端口号'
- bakcollectionname=NeedArchiveColName_$(date "+%Y%m%d%H%M")
- ###### 登入账号信息
- username="账号"
- password="账号密码"
- #######start 设置备份集合的开始日期和结束日期 #####
- ParamBakStartDate=$(date -d '-46 days' "+%Y-%m-%d")
- echo "备份NeedArchiveColName时间参数中的开始时间为:" $ParamBakStartDate
- ParamBakEndDate=$(date -d '-45 days' "+%Y-%m-%d")
- echo "备份NeedArchiveColName时间参数中的结束时间为:" $ParamBakEndDate
- ParamBakStartTimeS="$(date -d $ParamBakStartDate +%s)"
- ParamBakEndTimeS="$(date -d $ParamBakEndDate +%s)"
- echo "备份集合的时间转换为UTC时间秒数为:" $ParamBakStartTimeS 和 $ParamBakEndTimeS
- ParamBakStartTimeMS=$[$ParamBakStartTimeS * +***]
- ParamBakEndTimeMS=$[$ParamBakEndTimeS * +***]
- echo "备份集合的时间转换为UTC时间毫秒数为:" $ParamBakStartTimeMS 和 $ParamBakEndTimeMS
- #######end ######
- ######## start 连接源Server DB ,检查此次集合备份的文档数
- command_line="${command_linebin} localhost:端口号/NeedArchiveDBColName -u$username -p$password"
- export docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
- echo "备份前集合NeedArchiveColName的文档数据为:" $docQty
- ###### End #####
- ###### Start 定义每次备份归档的最大阈值,防止意外情况的发生,例如:参数输入错误###
- if [ $docQty -gt ];then
- echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合指定时间段内的文档数过大,超过定义的安全阈值 2000000,归档终止,请检查!"
- exit
- fi
- ####### end ######
- ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
- command_lineT="${command_linebinT} 归档实例IP:归档实例端口/归档数据库Name -u$username -p$password"
- export docQtyT=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
- echo "备份目标BKDB集合NeedArchiveColName备份归档前的文档数据为:" $docQtyT
- if [ $docQtyT -gt ];then
- echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合检查发现指定时间段内目标数据库目标集合存在异常文档数,归档终止,请检查!"
- exit
- fi
- ####### end ######
- ####### start mongoexport 指定集合指定时间段内的文档,输出到指定路径下;并执行检查命令是否正常执行####
- start()
- {
- echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出开始"
- /QQMSG/mongo_db/mongobin404/bin/mongoexport --port 端口号 -u $username -p $password -d NeedArchiveDBColName --authenticationDatabase NeedArchiveDBColName -c NeedArchiveColName -q ' { NeedArchiveByField: { $gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS') } } ' -o ${targetpath}/${bakcollectionname}
- echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出完毕"
- }
- start
- execute()
- {
- if [ $? -eq ]
- then
- echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport完成!"
- else
- echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport失败"
- exit
- fi
- }
- ###### end ######
- ###### Start mongomongoimport 将导出的备份集合导入到指定的BKDB 指定的集合中#####
- echo "备份输入开始"
- /QQMSG/mongo_db/mongobin404/bin/mongoimport -h 归档实例IP --port 归档实例端口 -u $username -p $password -d 归档数据库Name --authenticationDatabase 归档数据库Name -c NeedArchiveColName --file ${targetpath}/${bakcollectionname}
- echo "备份输入完毕"
- ##### End #######
- ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
- export docQtyT2=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
- echo "备份目标BKDB集合NeedArchiveColName备份归档后的文档数据为:" $docQtyT2
- echo "比较docQty 和 docQtyT2 的大小"
- if [ $docQty == $docQtyT2 ]; then
- echo "正常:时间段内源数据库集合中的文档数 和 目标数据库集合中还原后的文档数据 相等";
- elif [ $docQty -gt $docQtyT2 ]; then
- echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 大于 目标数据库集合中还原后的文档数据";
- exit
- else
- echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 小于 目标数据库集合中还原后的文档数据";
- exit
- fi
- ########### End #####
- ########### Start Remove 源数据库源集合指定时间内的记录 ########
- docQtyR=$(/bin/echo 'db.NeedArchiveColName.remove({NeedArchiveByField:{$gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS')}}).nRemoved' | $command_line --quiet)
- echo "本次操作Remove集合NeedArchiveColName的文档数据为:" $docQtyR
- ########## End #########
- ###### 检查 Remove 后集合的文档数 ###
- docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
- echo "NeedArchiveDBColName库NeedArchiveColName集合 此次 Remove 后指定时间剩余的文档数据为:" $docQty
- ###### End ###
- #########删除导出的文件#######
- rm -rf ${targetpath}/${bakcollectionname}
- if [ $? -eq ]
- then
- echo "正常:NeedArchiveDBColName库NeedArchiveColName集合导出的文件被删除:" ${targetpath}/${bakcollectionname}
- else
- echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合导出的文件未被正常删除" ${targetpath}/${bakcollectionname}
- fi
- ######## End #####
4. 代码说明
4.1 配置基本信息
主要包括:mongo bin 可执行文件所在路径;导出过渡文件的定义;归档账号和密码;集合数据保留天数。
4.2 代码中关键词
明白关键字的含义,可在部署运行前,批量替换
代码中关键词 | 关键词意义 |
|
需要归档的集合所在数据库; |
|
需要归档的集合名字; |
|
|
|
归档依据的字段;此例中是Date类型的字段,其他类型还要调试。 |
/QQMSG/mongo_db/mongobin404/bin | Mongo 可执行文件所在路径 |
2000000 | 归档的最大阈值 |
ArchiveDB_端口号 | 过渡文件所放的位置,一个数据库一个文档。不用细化到集合 |
端口号 | 端口号分为源库所在实例端口,和目标库所在实例端口 |
4.3 在本例中,源库和目标库设置了相同的归档账号和对应密码
4.4 通过crontab 实现日常归档,执行信息(异常错误)重定向到log文件
归档实现代码保存到文件中,通过crontab设置文件的定时任务,实现日常归档。
执行情况 重定向( >>)到指定文件。通过指定文件的监视可实现监控归档的执行情况。
本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!
本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!
本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!
MongoDB通过Shell 实现集合的日常归档的更多相关文章
- MongoDB笔记(二):MongoDB下Shell的基本操作
一.mongoDB与关系型数据库对比 对比项 mongoDB 关系型数据库(oracle.mysql) 表 集合List 二维表table 表的一行数 ...
- linux shell工具集合
1)判断进程是否存在,如果不存在再执行启动命令,可以避免一个脚本同时启动多份 if [ $(ps -ef |grep bastion_account.sh|grep -v grep|wc -l) - ...
- MongoDB学习(操作集合中的文档)
文档概念 文档的数据结构和JSON基本一样. 所有存储在集合中的数据都是BSON格式. BSON是一种类json的一种二进制形式的存储格式,简称Binary JSON. 插入文档 insert()方法 ...
- Shell + crontab 实现日志压缩归档
Shell + crontab 实现日志压缩归档 crontab # archive the ats log days. */ * * * * root /bin/>& shell #! ...
- 【MongoDB】在Mongodb使用shell实现与javascript的动态交互
关于利用mongodb的shell运行脚本,这点在曾经的文章中有点遗漏:如今在此篇博客中做个补充: 一.在命令行中传入脚本文件 定义一个javasciprt文件,名称为:script1.js,内容例如 ...
- MongoDB 基本操作 数据库、集合
一.数据库创建与删除 查看当前所有的数据库 show das/show databases 查看当前数据库 db 创建数据库 use hopedb db.dropDatabase() 删除当前数据库 ...
- Mongodb使用shell实现与javascript的动态交互
关于利用mongodb的shell执行脚本,这点在以前的文章中有点遗漏:现在在此篇博客中做个补充: 一.在命令行中传入脚本文件 定义一个javasciprt文件,名称为:script1.js,内容如下 ...
- MongoDB shell 3 集合方法
方法名 描述 db.collection.aggregate() 聚合,主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果 db.collection.bulkWrite() 批量写入 ...
- MongoDB shell 0 集合方法
方法名 描述 db.collection.aggregate() 聚合,主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果 db.collection.bulkWrite() 批量写入 ...
随机推荐
- SSM-Spring-04:Spring的DI的构造注入,P命名注入,和集合注入
------------吾亦无他,唯手熟尔,谦卑若愚,好学若饥------------- DI和IOC相比,DI更偏向于实现 DI的set方式注入在前面入门案例里有写,所以此处不多啰嗦,直接开搞,先说 ...
- nginx cache的玩法
一.简介 Nginx版本从0.7.48开始,支持了类似Squid的缓存功能.这个缓存是把URL及相关组合当做Key,用Md5算法对Key进行哈希,得到硬盘上对应的哈希目录路径,从而将缓存内容保存在 ...
- Linux共享库、静态库、动态库详解
1. 介绍 使用GNU的工具我们如何在Linux下创建自己的程序函数库?一个“程序函数库”简单的说就是一个文件包含了一些编译好的代码和数据,这些编译好的代码和数据可以在事后供其他的程序使用.程序函数库 ...
- 关于Linux虚拟化技术KVM的科普 科普四(From humjb_1983)
另一组关于KVM的分析文档,虚拟化相关概念.KVM基本原理和架构一-概念和术语.KVM基本原理和架构二-基本原理.KVM基本原理及架构三-CPU虚拟化.KVM基本原理及架构四-内存虚拟化.KVM基本原 ...
- Linux时间子系统之一:认识timer_list和timer_stats和使用
内核版本:v3.4.xxx 一.前言 内核提供了方便查看当前系统TickDevice.活动的Timer列表以及Timer使用的统计信息. 内核分别用两个节点来表示TimerList和Timer统计信息 ...
- selenium提供的截图功能
get_screenshot_as_file()提供一个截屏功能.在自动化执行过程中,执行失败后只能看到代码的运行错误,而不能直接看到ui上的错误,利用截屏保存下来很容易的进行问题的判断 先来执行一个 ...
- celery学习笔记1
生产者消费者模式 在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据由另一个模块来负责处理(此处的模块是广义的,可以是类.函数.线程.进程等).产生数据的模块,就形象地称为生产 ...
- MySQL中的replace语句
一.背景 当使用replace语句更新access_apps表时,原有的mark列.remark列的信息丢失. CREATE TABLE `access_apps` ( `base` varcha ...
- 浅谈cookie,sessionStorage和localStorage
cookie:cookie在浏览器和服务器间来回传递 cookie数据不能超过4k 同时每次http请求都会携带cookie,所以cookie只适合保存很小的数据,比如会话标识 cookie只在设置的 ...
- bzoj 1076 奖励关 状压+期望dp
因为每次选择都是有后效性的,直接dp肯定不行,所以需要逆推. f[i][j]表示从第i次开始,初始状态为j的期望收益 #include<cstdio> #include<cstrin ...