MongoDB开发最佳实践

  1. 连接到MongoDB · 关于驱动程序:总是选择与所用之MongoDB相兼容的驱动程序。这可以很容易地从驱动兼容对照表中查到;

     · 如果使用第三方框架(如Spring Data),则还需要考虑框架版本与驱动的兼容性;

    · 关于连接对象MongoClient:使用MongoClient对象连接到MongoDB实例时总是应该保证它单例,并且在这个生命周期 中都从它获取其他操作对象。

    · 关于连接字符串:连接字符串中可以配置大部分连接选项,建议总是在连接字符串中配置这些选项;

    // 连接到复制集 mongodb://节点1,节点2,节点3.../database?[options]

    // 连接到分片集 mongodb://mongos1,mongos2,mongos3.../database?[options]

  2. 常见连接字符串参数 · maxPoolSize

     · 连接池大小

    · maxWaitTime

     · 建议设置,自动杀掉太慢的查询

    · writeConcern

     · 建议majority保证数据安全

    · readConcern

     · 对于数据一致性要求高的场景适当使用
  3. 连接字符串节点和地址 · 无论对于复制集或分片集,连接字符串中都应尽可能多地提供节点地址,建议全部列出;

     · 复制集利用这些地址可以更有效地发现集群成员;
    
     · 分片集利用这些地址可以更有效的分散负载;

    · 连接字符串中尽可能使用与复制集内部配置相同的域名或IP;

  4. 使用域名连接集群 在配置集群时使用域名可以为集群变更时提供一层额外的保护。例如要将集群整体迁移到新网段,直接修改域名解析即可。

    另外,MongoDB提供的mongoDB+srv://协议可以提供额外一层保护。该协议允许通过域名解析得到所有mongos或节点的地址, 而不是写在连接字符串中。

    mongodb+srv://server.example.com/

    Record TTL Class Priority Weight Port Target _mongodb._tcp.server.example.com.86400

    IN SRV 0 5 27317 mongodb1.example.com._mongodb._tcp.server.example.86400 IN SRV 0 5 27017 mongodb2.example.com.

  5. 不要在mongos前面使用负载均衡 基于前面提到的原因,驱动已经直销在不同的mongos之间实现负载均衡,而复制集则需要根据节点的角色来选择发送请求的目标。 如果在mongos或复制集上层部署负载均衡:

    · 驱动会无法探测具体那个节点存活,从而无法完成自动故障恢复;

    · 驱动会无法判断游标是在哪个节点创建的,从而遍历游标时出错;

    结论:不要在mongos或复制集上层放置负载均衡器,让驱动处理负载均衡和自动故障恢复。

  6. 游标使用 如果一个游标已经遍历完,则自动关闭;如果没有遍历完,则需要手动调用close()方法,否则该游标将在服务器上存在 10分钟(默认值)后超时释放,造成不必要的资源浪费。

    但是,如果不能遍历完一个游标,通常意味着查询条件太宽泛,更应该考虑的问题是如何将条件收紧。

  7. 关于查询及索引 · 每一个查询都必须要有对应的索引

    · 尽量使用覆盖索引Covered indexes(可以避免读数据文件)

    · 使用projection来减少返回客户端的文档内容

  8. 关于写入 · 在update语句里只包括需要更新的字段

    · 尽可能使用批量插入语句来提升写入性能

    · 使用TTL自动过期日志类型的数据

  9. 关于文档结构 · 防止使用太长的字段名(浪费空间)

    · 防止使用太深的数组嵌套(超过2层操作比较负责)

    · 不使用中文,标点符号等非拉丁字母作为字段名

  10. 处理分页问题-避免使用count 尽可能不要计算总页数,特别是数据量大和查询条件不能完整命中索引时。

    考虑以下场景:假设集合总共有1000W条数据,在没有索引的情况下考虑以下查询:

    db.coll.find({x:100}).limit(50);
    db.coll.count({x:100});

    · 前者只需要遍历前n条,直到找到50条队伍 x = 100 的文档即可结束;

    · 后者需要遍历完1000W条所有符合要求的文档才能得到结果。

    为了计算总页数而进行count()往往是拖慢页面真题加载速度的原因。

  11. 处理分页问题——巧分页 避免使用skip/limit形式的分页,特别是数据量大的时候;

    替代方案:使用条件查询+唯一条件排序;

    例如:

    第一页:db.find({}).sort({_id: 1}).limit(20);

    第二页:db.find({_id:{$gt:<第一页最后一个_id>}}).sort({_id: 1}).limit(20);

    第三页:db.find({_id:{$gt:<第二页最后一个_id>}}).sort({_id: 1}).limit(20);

    ······

  12. 关于事务 使用事务的原则:

    · 无论何时,事务的使用总是能避免则避免;

    · 模型设计先于事务,尽可能用模型设计规避事务;

    · 不要使用过大的事务(尽量控制在1000个文档更新以内);

    · 当必须使用事务时,尽可能让涉及事务的文档分布在同一片上,这将有效地提高效率;

MongoDB开发最佳实践的更多相关文章

  1. web前端开发最佳实践笔记

    一.文章开篇 由于最近也比较忙,一方面是忙着公司的事情,另外一方面也是忙着看书和学习,所以没有时间来和大家一起分享知识,现在好了,终于回归博客园的大家庭了,今天我打算来分享一下关于<web前端开 ...

  2. [转]Android开发最佳实践

    ——欢迎转载,请注明出处 http://blog.csdn.net/asce1885 ,未经本人同意请勿用于商业用途,谢谢—— 原文链接:https://github.com/futurice/and ...

  3. Hadoop MapReduce开发最佳实践(上篇)

    body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI& ...

  4. 【读书笔记】iOS-微信公众平台开发最佳实践

    一,微信是由腾讯公司广州研发中心产品团队开发,该团队经理张小龙被称为“微信之父”,公司总裁马化腾确定该产品名称为“微信”. 二,常见问题及解决方案. 1,请求URL超时. 这种情况一般是由于服务器网速 ...

  5. Android开发最佳实践《IT蓝豹》

    Android开发最佳实践   移动开发Android经验分享应用GoogleMaterial Design 摘要:前 段时间,Google公布了Android开发最佳实践的一系列课程,涉及到一些平时 ...

  6. Android和PHP开发最佳实践

    Android和PHP开发最佳实践 <Android和PHP开发最佳实践>基本信息作者: 黄隽实丛书名: 移动应用开发技术丛书出版社:机械工业出版社ISBN:9787111410508上架 ...

  7. iOS应用开发最佳实践

    <iOS应用开发最佳实践> 基本信息 作者: 王浩    出版社:电子工业出版社 ISBN:9787121207679 上架时间:2013-7-22 出版日期:2013 年8月 开本:16 ...

  8. 【社区公益】送《Web前端开发最佳实践》给需要的人

    算起来至今,我进入软件开发行业已经有11年之久.从最初的研究人工智能,到后来的Web开发,控件开发,直到现在纯粹的Web前端开发.虽然没有大的作品问世,但也是勤勤恳恳,踏实做事,低调做人.从来不吹牛逼 ...

  9. Web前端开发最佳实践系列文章汇总

    Web前端开发最佳实践(1):前端开发概述 Web前端开发最佳实践(2):前端代码重构 Web前端开发最佳实践(3):前端代码和资源的压缩与合并 Web前端开发最佳实践(4):在页面中添加必要的met ...

随机推荐

  1. SpringBoot java配置类@Configuration 的两种写法

    首先在Springboot项目中,件一个java类,使用注解@Configuration  ,则这个类是SpringBoot bean的创建的配置文件类,,这种配置文件类有两种写法 1.使用包扫描 , ...

  2. shell获取目录下(包括子目录)所有文件名、路径、文件大小

    一例shell脚本:取得目录下(包括子目录)所有文件名.路径与文件大小. 代码,shell脚本: lsdir.sh #!/bin/bash # #site: www.jquerycn.cn funct ...

  3. ES6常用的数值转换方法

    <script type="text/javascript"> // Number常用方法 /* Number.isFinite() 用来检查一个数值是否为有限的(fi ...

  4. 【Python】【Module】hashlib

    用于加密相关的操作,代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法 import hashlib # ######## ...

  5. 记一次 .NET 某妇产医院 WPF内存溢出分析

    一:背景 1. 讲故事 上个月有位朋友通过博客园的短消息找到我,说他的程序存在内存溢出情况,寻求如何解决. 要解决还得通过 windbg 分析啦. 二:Windbg 分析 1. 为什么会内存溢出 大家 ...

  6. Python连接MySQL数据库获取数据绘制柱状图

    一.Python通过pymysql包获取MySQL数据库中的数据(没有对应包的可以通过pip install pymysql 安装对应的包) import matplotlib.pyplot as p ...

  7. pycharm的破解和基本使用

    pycharm的破解 pycharm的账号注册 在完成安装后打开pycharm软件,需要选择购买或是使用.点击试用,选择进入官网注册账号. 进入官网后选择邮箱登录,输入自己的邮箱,点击sign up ...

  8. 如何利用火焰图定位 Java 的 CPU 性能问题

     常见 CPU 性能问题 你所负责的服务(下称:服务)是否遇到过以下现象: 休息的时候,手机突然收到大量告警短信,提示服务的 99.9 line 从 20ms 飙升至 10s: 正在敲代码实现业务功能 ...

  9. Table.PromoteHeaders升降标题Table…Headers(Power Query 之 M 语言)

    数据源: 任意数据源 目标: 将第一行提升为标题 操作过程: [主页](或[转换])>[将第一行用作标题] M公式: = Table.PromoteHeaders( 表, [PromoteAll ...

  10. 存储技术之ceph了解

    ceph rados:可靠的.自动的.分布式.对象存储 特性:高效性,统一性(文件存储,块存储,对象存储),可扩展 没有数据库的概念:为cluster map 记录集群状态. PG:(ceph核心单位 ...