Mongodb使用

Mongodb基本的原则是：条件句是内层文档的键，修改器是外层文档的键【即，修改器要修改的字段声明在修改器内部】。
1、$size，用于查询数组大小为size的记录
db.a.find({"comments":{"$size":3}})
表示查询comments数组中含有三个元素的记录。
既然size可以查询指定数组大小的记录，那么，如果在文档中增加一个size字段，就可以使用 $gt和$lt等比较操作符来进行查询了。
比如说我们增加了一个size字段，表示目前comments中含有的评论个数，那么在查询的时候就可以使用
db.a.find({"size":{"$gt":3}})
这样就能查询出来comment个数大于3个的了。
记得维护size的数据哦，更新comments数据的时候，同时更新size字段
db.a.update({},{"$push":{"cmt":"another comment!"},"$inc":{"size":1}})
2、删除记录中的一个字段
db.a.update({},{"$unset":{"addrs":1}})
3、$push向数组中增加一个元素，如果数组不存在则创建
db.a.update({},{"$push":{"addrs":"shenzhen"}})
4、从数组中删除一个
$pop
db.a.update({},{"$pop":{"addrs":-1}})
-1表示从数组末尾删除。
db.a.update({},{"$pop":{"addrs":1}})
1表示从数组头部删除
$pull
$pull可以删除指定的数组元素
db.a.update({},{"$pull":{"addrs":"shenzhen"}})
5、给已存在的对象增加一个键值或修改一个键值
db.a.update({},{"$set":{"addrs":['shenzhen','guangzhou']}})
6、查询一个数组的最前n、最后n个元素
db.a.find({},{"addrs":{"$slice":5}})
这里查询了一条记录中地址中的前5个。后5个可以用-5。并且，slice也支持偏移和要返回的数据量

db.a.find({},{"addrs":{"$slice":[5,10]}})上面的语句查询了从第6条数据开始，一共10条数据，如果从第六条数据开始，后面不足10条，那么返回后面的所有元素。

7、skip

使用Mongodb的时候【其他数据库也类似】，尽量少跳过过多的数据，这样会产生性能问题。
mongodb的skip是用来跳过数据的，但是要少用。需要使用的时候可以用其他方式代替。比如说要对博客文章分页，那么一般的做法是
db.a.find().sort({"time":1}).skip(10000).limit(10)
优化的做法可能是，根据上一页取出来的时间，在下次分页，即取出下一页的时候，根据上一个时间，来查找，然后再limit，例如
db.a.find({"time":{"$gt":lasttime}}).sort({"time":1})..limit(10)
这样用查找替代跳过数据，效率会有提升。

8、有一个需求是从一个collection中随机选取出一个文档。

那么一般的做法是，先统计文档总数count，然后生成一个1到count的数字，去数据库中取出这个数字对应的文档。

这种方法是很低效的。要统计count，然后才能取出来数据。

高效的做法是：在存储数据的时候，同时存储一个random字段。
每次插入一个记录的时候，都生成一个随机数字赋值给这个字段。那么在随机选取一个文档的时候，这样就可以生成一个随机数rand，然后找到比这个随机数大的一个文档：
result=db.a.findOne({"random":{"$gt":rand}})
if result == null
result=db.a.findOne({"random":{"$gt":rand}})

这样如果最后result还是null，说明数据库中是没有记录了。随机取出一个文档的任务也完成了。

9、删除索引

db.a.dropIndex("indexname")

其中的indexname可以在system.index集合中查找。

10、查询内嵌文档

例如有如下文档：

{"content":"this is content","comments":[{"author":"naughty","score":3},{"author":"cc","score":4}]}

现在要查询author是naughty并且naughty的评论score大于3的记录，那么首先想到的查询是这样的：

db.a.find({'comments.author':'naughty'},{'comments.score':{$gt:3}})

但是记录多起来，查询的时候会发现，这样写是不对的。这样写，只要comments中有naughty并且有score是大于3，那么就会查询出来这条记录。查询结果不是我们想要的。

“要正确的指定一组条件，而不是单独的指定每个键。”书上如是说。

要这样写查询：

db.a.find({"comments":{"$elemMatch":{"author":"naughty","score":{"$gt":3}}}})这样就对了。

elemMatch将限定条件进行分组，仅当需要对一个内嵌文档的多个键进行查询的时候，才会用到。

11、group

假设有类似的一个需求：

有几条这样的文档

db.d.insert({"day":"2012-9-9","tags":['a','b','c','d']})
db.d.insert({"day":"2012-9-9","tags":['c','d']})
db.d.insert({"day":"2012-9-9","tags":['a','d']})
db.d.insert({"day":"2012-9-10","tags":['a','b']})
db.d.insert({"day":"2012-9-10","tags":['a','d']})

要查询每一天tags中出现次数最多的那个tag是什么。那么查询可以按照如下进行：

db.d.group({"key":{"day":true},"initial":{"tags":{}},"reduce":function(doc,res){
   for(i in doc.tags){
       if(doc.tags[i] in res.tags){
           res.tags[doc.tags[i]]++;
       }else{
           res.tags[doc.tags[i]]=1;
       }
   }
},
"finalize":function(res){
   var mp=0;
   for(i in res.tags){
       if(res.tags[i]>mp){
           res.tag=i
           mp=res.tags[i];
       }
   }
   delete res.tags
}
})

其中finalize是在group动作结束之后，对聚合的每一个组调用一次。reduce函数是在聚合的时候进行调用，是用来生成分组的。reduce函数的两个参数分别是：当前文档和本组当前的聚合结果。

12、分片

分片【sharding】的目的是为了提高存储性能，那么什么时候进行分片呢？

第一、机器磁盘不够用了。

第二、机器已经不能满足写数据的性能需求。

第三、想把大数据都放在内存中以提高性能。

mongos就是mongodb的各个版本中都配备的路由器进程，它路由所有的请求，然后将结果聚合。它本身并不存储数据或者是配置信息（但是会缓存配置服务器的信息）。配置服务器存储了集群的配置信息：数据和片的对应关系。

Mongodb使用的更多相关文章

【翻译】MongoDB指南/聚合——聚合管道
[原文地址]https://docs.mongodb.com/manual/ 聚合聚合操作处理数据记录并返回计算后的结果.聚合操作将多个文档分组,并能对已分组的数据执行一系列操作而返回单一结果.Mo ...
【翻译】MongoDB指南/CRUD操作（四）
[原文地址]https://docs.mongodb.com/manual/ CRUD操作(四) 1 查询方案(Query Plans) MongoDB 查询优化程序处理查询并且针对给定可利用的索引选 ...
【翻译】MongoDB指南/CRUD操作（三）
[原文地址]https://docs.mongodb.com/manual/ CRUD操作(三) 主要内容: 原子性和事务(Atomicity and Transactions),读隔离.一致性和新近 ...
【翻译】MongoDB指南/CRUD操作（二）
[原文地址]https://docs.mongodb.com/manual/ MongoDB CRUD操作(二) 主要内容: 更新文档,删除文档,批量写操作,SQL与MongoDB映射图,读隔离(读关 ...
【翻译】MongoDB指南/CRUD操作（一）
[原文地址]https://docs.mongodb.com/manual/ MongoDB CRUD操作(一) 主要内容:CRUD操作简介,插入文档,查询文档. CRUD操作包括创建.读取.更新和删 ...
CRL快速开发框架系列教程十二(MongoDB支持)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
MongoDB系列（二）：C#应用
前言上一篇文章<MongoDB系列(一):简介及安装>已经介绍了MongoDB以及其在window环境下的安装,这篇文章主要讲讲如何用C#来与MongoDB进行通讯.再次强调一下,我使用 ...
MongoDB系列（一）：简介及安装
什么是MongoDB MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统. 在高负载的情况下,添加更多的节点,可以保证服务器性能. MongoDB 旨在为应用提供可扩展的高 ...
[原]分享一下我和MongoDB与Redis那些事
缘起:来自于我在近期一个项目上遇到的问题,在Segmentfault上发表了提问知识背景: 对不是很熟悉MongoDB和Redis的同学做一下介绍. 1.MongoDB数组查询:MongoDB自带L ...
用MongoDB分析合肥餐饮业
看了<从数据角度解析福州美食>后难免心痒,动了要分析合肥餐饮业的念头,因此特地写了Node.js爬虫爬取了合肥的大众点评数据.分析数据库我并没有采用MySQL而是用的MongoDB,是因为 ...

随机推荐

[置顶] gridview中嵌套gridview（并实现子gridview的数据绑定），页面传值，加密，数据绑定
先来张效果图 gridview 中嵌套gridview的原理是这样的,在父gridview中建一个摸板列,然后再模版列当中在放入子gridview,然后再父gridview的OnRowDataBoun ...
StringBuffer跟StringBuilder以及HashMap跟HashTable
StringBuffer是线程安全的 HashTable是线程安全的,但HashMao单线程程序中的性能比HashTable要高,对了HashTable用(add),HashMap用的(put)
SQL Server2008R无法登录的解决方案(系统文件损坏)1814 18456....不看别后悔,有用请点赞
废话早上一开电脑,黑屏幕跑一些修复系统的代码....进入系统后,sql server连接不上正文原因:sql server的服务自动关闭了,并且启动失败 windows日志信息:传递给数据库 ' ...
Lucene.net常用功能说明
Lucene.net是一个.net下的全文检索类库.配置简单,功能丰富,比较成熟.我在项目中用Lucene.net有一段时间了,这里我把常用一些功能写出来,与大家一起分享. Lucene.net用的是 ...
Android应用Icon大小在不同分辨率下定义
http://www.ard9.com/gsjj/204.html 对于Android平台来说,不同分辨率下Icon的大小设计有着不同的要求,对于目前主流的 HDPI即WVGA级别来说,通常hdpi的 ...
Android XML解析
解析XML有三种方式:Dom.SAX.Pull 其中pull解析器运行方式与SAX类似. 我们首先认识pull解析器:http://developer.android.com/intl/zh-cn/r ...
【转】浅析Windows编程的剪贴板
摘要: 本文对Windows剪贴板机制作了深入.全面的阐述,具体内容包括:文本.位图.DSP.自定义格式剪贴板的使用和多数据项和延迟提交技术. 关键词: VC++6.0: 剪贴板机制:数据格式:延迟提 ...
oc for in 的时候nsscanner: nil string argument
今天偶然发现,oc for in 动态的给一数组加东西,然后嵌套for in 会报nsscanner: nil string argument. 换成for循环就好了,暂时还没找到原因
asp：DateDiff 函数
DateDiff 函数返回 Variant (Long) 的值,表示两个指定日期间的时间间隔数目. 语法 DateDiff(interval, date1, date2[, firstdayofwe ...
一、VSTO概述
一.什么是VSTO? VSTO = Visual Studo Tools for Office,是.net平台下的Office开发技术.相对于传统的VBA(Visual Basic Applicati ...

Mongodb使用

Mongodb使用的更多相关文章

随机推荐

热门专题