1.MongoDB数据归档的意义

和其他类型的数据库一样,归档对MongoDB同样重要。通过归档,可以保持集合中合适的数据量,对数据库的性能是一种保障,也就是大家常说的数据冷热分离。

同时,归档对数据库的管理也带来了很大方便性,例如日常的备份、灾难恢复等。

在此,不再展开叙述了。

2.集合数据归档流程图

3.归档实现代码

  1. #
  2. # The file is used by cron to Archive the data of NeedArchiveColName_Archive collection,the collection is part of NeedArchiveDBColName DB.
  3. # The file is writed by DBA Carson Xu.If you find any error, please connect with me,thanks.
  4. # The version is defined V.
  5. # Version ModifyTime ModifyBy Desc
  6. # Ver001 -- : Carson Xu Create the Scripts File
  7. #
  8. #
  9. #!/bin/bash
  10. ######mongodb可执行文件所在文档路径,此例为4. ,同时支持3.4.4
  11.  
  12. command_linebin="/QQMSG/mongo_db/mongobin404/bin/mongo"
  13. command_linebinT="/QQMSG/mongo_db/mongobin404/bin/mongo"
  14.  
  15. ######存放导出过渡文件的文档路径和文件名字,ColA可用你的集合名字替代
  16. targetpath='/data/mongodb_back/ArchiveDB_端口号'
  17. bakcollectionname=NeedArchiveColName_$(date "+%Y%m%d%H%M")
  18.  
  19. ###### 登入账号信息
  20. username="账号"
  21. password="账号密码"
  22.  
  23. #######start 设置备份集合的开始日期和结束日期 #####
  24.  
  25. ParamBakStartDate=$(date -d '-46 days' "+%Y-%m-%d")
  26. echo "备份NeedArchiveColName时间参数中的开始时间为:" $ParamBakStartDate
  27.  
  28. ParamBakEndDate=$(date -d '-45 days' "+%Y-%m-%d")
  29. echo "备份NeedArchiveColName时间参数中的结束时间为:" $ParamBakEndDate
  30.  
  31. ParamBakStartTimeS="$(date -d $ParamBakStartDate +%s)"
  32.  
  33. ParamBakEndTimeS="$(date -d $ParamBakEndDate +%s)"
  34.  
  35. echo "备份集合的时间转换为UTC时间秒数为:" $ParamBakStartTimeS $ParamBakEndTimeS
  36.  
  37. ParamBakStartTimeMS=$[$ParamBakStartTimeS * +***]
  38. ParamBakEndTimeMS=$[$ParamBakEndTimeS * +***]
  39.  
  40. echo "备份集合的时间转换为UTC时间毫秒数为:" $ParamBakStartTimeMS $ParamBakEndTimeMS
  41.  
  42. #######end ######
  43.  
  44. ######## start 连接源Server DB ,检查此次集合备份的文档数
  45. command_line="${command_linebin} localhost:端口号/NeedArchiveDBColName -u$username -p$password"
  46. export docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
  47. echo "备份前集合NeedArchiveColName的文档数据为:" $docQty
  48. ###### End #####
  49.  
  50. ###### Start 定义每次备份归档的最大阈值,防止意外情况的发生,例如:参数输入错误###
  51. if [ $docQty -gt ];then
  52. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合指定时间段内的文档数过大,超过定义的安全阈值 2000000,归档终止,请检查!"
  53. exit
  54. fi
  55.  
  56. ####### end ######
  57.  
  58. ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
  59. command_lineT="${command_linebinT} 归档实例IP:归档实例端口/归档数据库Name -u$username -p$password"
  60. export docQtyT=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
  61. echo "备份目标BKDB集合NeedArchiveColName备份归档前的文档数据为:" $docQtyT
  62. if [ $docQtyT -gt ];then
  63. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合检查发现指定时间段内目标数据库目标集合存在异常文档数,归档终止,请检查!"
  64. exit
  65. fi
  66.  
  67. ####### end ######
  68.  
  69. ####### start mongoexport 指定集合指定时间段内的文档,输出到指定路径下;并执行检查命令是否正常执行####
  70. start()
  71. {
  72. echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出开始"
  73. /QQMSG/mongo_db/mongobin404/bin/mongoexport --port 端口号 -u $username -p $password -d NeedArchiveDBColName --authenticationDatabase NeedArchiveDBColName -c NeedArchiveColName -q ' { NeedArchiveByField: { $gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS') } } ' -o ${targetpath}/${bakcollectionname}
  74. echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出完毕"
  75. }
  76. start
  77. execute()
  78. {
  79. if [ $? -eq ]
  80. then
  81. echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport完成!"
  82. else
  83. echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport失败"
  84. exit
  85. fi
  86. }
  87. ###### end ######
  88.  
  89. ###### Start mongomongoimport 将导出的备份集合导入到指定的BKDB 指定的集合中#####
  90. echo "备份输入开始"
  91. /QQMSG/mongo_db/mongobin404/bin/mongoimport -h 归档实例IP --port 归档实例端口 -u $username -p $password -d 归档数据库Name --authenticationDatabase 归档数据库Name -c NeedArchiveColName --file ${targetpath}/${bakcollectionname}
  92. echo "备份输入完毕"
  93.  
  94. ##### End #######
  95.  
  96. ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
  97. export docQtyT2=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
  98. echo "备份目标BKDB集合NeedArchiveColName备份归档后的文档数据为:" $docQtyT2
  99.  
  100. echo "比较docQty 和 docQtyT2 的大小"
  101. if [ $docQty == $docQtyT2 ]; then
  102. echo "正常:时间段内源数据库集合中的文档数 和 目标数据库集合中还原后的文档数据 相等";
  103. elif [ $docQty -gt $docQtyT2 ]; then
  104. echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 大于 目标数据库集合中还原后的文档数据";
  105. exit
  106. else
  107. echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 小于 目标数据库集合中还原后的文档数据";
  108. exit
  109. fi
  110. ########### End #####
  111.  
  112. ########### Start Remove 源数据库源集合指定时间内的记录 ########
  113.  
  114. docQtyR=$(/bin/echo 'db.NeedArchiveColName.remove({NeedArchiveByField:{$gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS')}}).nRemoved' | $command_line --quiet)
  115. echo "本次操作Remove集合NeedArchiveColName的文档数据为:" $docQtyR
  116. ########## End #########
  117. ###### 检查 Remove 后集合的文档数 ###
  118. docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
  119. echo "NeedArchiveDBColName库NeedArchiveColName集合 此次 Remove 后指定时间剩余的文档数据为:" $docQty
  120. ###### End ###
  121.  
  122. #########删除导出的文件#######
  123. rm -rf ${targetpath}/${bakcollectionname}
  124. if [ $? -eq ]
  125. then
  126. echo "正常:NeedArchiveDBColName库NeedArchiveColName集合导出的文件被删除:" ${targetpath}/${bakcollectionname}
  127. else
  128. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合导出的文件未被正常删除" ${targetpath}/${bakcollectionname}
  129. fi
  130. ######## End #####

4. 代码说明

4.1 配置基本信息

主要包括:mongo bin 可执行文件所在路径;导出过渡文件的定义;归档账号和密码;集合数据保留天数。

4.2 代码中关键词

明白关键字的含义,可在部署运行前,批量替换

代码中关键词 关键词意义
  1. NeedArchiveDBColName
需要归档的集合所在数据库;
  1. NeedArchiveColName
需要归档的集合名字;
  1. 归档数据库Name
  1. 归档数据库Name
  1. NeedArchiveByField
归档依据的字段;此例中是Date类型的字段,其他类型还要调试。
 /QQMSG/mongo_db/mongobin404/bin  Mongo 可执行文件所在路径
 2000000  归档的最大阈值
 ArchiveDB_端口号  过渡文件所放的位置,一个数据库一个文档。不用细化到集合
端口号 端口号分为源库所在实例端口,和目标库所在实例端口

4.3 在本例中,源库和目标库设置了相同的归档账号和对应密码

4.4  通过crontab 实现日常归档,执行信息(异常错误)重定向到log文件

归档实现代码保存到文件中,通过crontab设置文件的定时任务,实现日常归档。

执行情况 重定向( >>)到指定文件。通过指定文件的监视可实现监控归档的执行情况。

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

MongoDB通过Shell 实现集合的日常归档的更多相关文章

  1. MongoDB笔记(二):MongoDB下Shell的基本操作

    一.mongoDB与关系型数据库对比 对比项              mongoDB             关系型数据库(oracle.mysql) 表 集合List 二维表table 表的一行数 ...

  2. linux shell工具集合

    1)判断进程是否存在,如果不存在再执行启动命令,可以避免一个脚本同时启动多份 if [ $(ps -ef |grep  bastion_account.sh|grep -v grep|wc -l) - ...

  3. MongoDB学习(操作集合中的文档)

    文档概念 文档的数据结构和JSON基本一样. 所有存储在集合中的数据都是BSON格式. BSON是一种类json的一种二进制形式的存储格式,简称Binary JSON. 插入文档 insert()方法 ...

  4. Shell + crontab 实现日志压缩归档

    Shell + crontab 实现日志压缩归档 crontab # archive the ats log days. */ * * * * root /bin/>& shell #! ...

  5. 【MongoDB】在Mongodb使用shell实现与javascript的动态交互

    关于利用mongodb的shell运行脚本,这点在曾经的文章中有点遗漏:如今在此篇博客中做个补充: 一.在命令行中传入脚本文件 定义一个javasciprt文件,名称为:script1.js,内容例如 ...

  6. MongoDB 基本操作 数据库、集合

    一.数据库创建与删除 查看当前所有的数据库 show das/show databases 查看当前数据库 db 创建数据库 use hopedb db.dropDatabase()  删除当前数据库 ...

  7. Mongodb使用shell实现与javascript的动态交互

    关于利用mongodb的shell执行脚本,这点在以前的文章中有点遗漏:现在在此篇博客中做个补充: 一.在命令行中传入脚本文件 定义一个javasciprt文件,名称为:script1.js,内容如下 ...

  8. MongoDB shell 3 集合方法

    方法名 描述 db.collection.aggregate() 聚合,主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果 db.collection.bulkWrite() 批量写入 ...

  9. MongoDB shell 0 集合方法

    方法名 描述 db.collection.aggregate() 聚合,主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果 db.collection.bulkWrite() 批量写入 ...

随机推荐

  1. SSM-Spring-04:Spring的DI的构造注入,P命名注入,和集合注入

    ------------吾亦无他,唯手熟尔,谦卑若愚,好学若饥------------- DI和IOC相比,DI更偏向于实现 DI的set方式注入在前面入门案例里有写,所以此处不多啰嗦,直接开搞,先说 ...

  2. nginx cache的玩法

      一.简介 Nginx版本从0.7.48开始,支持了类似Squid的缓存功能.这个缓存是把URL及相关组合当做Key,用Md5算法对Key进行哈希,得到硬盘上对应的哈希目录路径,从而将缓存内容保存在 ...

  3. Linux共享库、静态库、动态库详解

    1. 介绍 使用GNU的工具我们如何在Linux下创建自己的程序函数库?一个“程序函数库”简单的说就是一个文件包含了一些编译好的代码和数据,这些编译好的代码和数据可以在事后供其他的程序使用.程序函数库 ...

  4. 关于Linux虚拟化技术KVM的科普 科普四(From humjb_1983)

    另一组关于KVM的分析文档,虚拟化相关概念.KVM基本原理和架构一-概念和术语.KVM基本原理和架构二-基本原理.KVM基本原理及架构三-CPU虚拟化.KVM基本原理及架构四-内存虚拟化.KVM基本原 ...

  5. Linux时间子系统之一:认识timer_list和timer_stats和使用

    内核版本:v3.4.xxx 一.前言 内核提供了方便查看当前系统TickDevice.活动的Timer列表以及Timer使用的统计信息. 内核分别用两个节点来表示TimerList和Timer统计信息 ...

  6. selenium提供的截图功能

    get_screenshot_as_file()提供一个截屏功能.在自动化执行过程中,执行失败后只能看到代码的运行错误,而不能直接看到ui上的错误,利用截屏保存下来很容易的进行问题的判断 先来执行一个 ...

  7. celery学习笔记1

    生产者消费者模式 在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据由另一个模块来负责处理(此处的模块是广义的,可以是类.函数.线程.进程等).产生数据的模块,就形象地称为生产 ...

  8. MySQL中的replace语句

    一.背景 当使用replace语句更新access_apps表时,原有的mark列.remark列的信息丢失. CREATE TABLE `access_apps` (   `base` varcha ...

  9. 浅谈cookie,sessionStorage和localStorage

    cookie:cookie在浏览器和服务器间来回传递 cookie数据不能超过4k 同时每次http请求都会携带cookie,所以cookie只适合保存很小的数据,比如会话标识 cookie只在设置的 ...

  10. bzoj 1076 奖励关 状压+期望dp

    因为每次选择都是有后效性的,直接dp肯定不行,所以需要逆推. f[i][j]表示从第i次开始,初始状态为j的期望收益 #include<cstdio> #include<cstrin ...