MongoDB入门---聚合操作&管道操作符&索引的使用

经过前段时间的学习呢，我们对MongoDB有了一个大概的了解，接下来就要开始使用稍稍深入一点的东西了，首先呢，就是MongoDB中的聚合函数，跟mysql中的count等函数差不多。话不多说哈，我们先看一下聚合函数的作用。

MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等)，并返回计算后的数据结果。有点类似sql语句中的 count(*)。那么，接下来我们就来看一下它的语法：

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

是不是还一头雾水，嘿嘿，那就看一下实例吧，下面的是我们集合中的一些数据：

{

   _id: ObjectId(7df78ad8902c)

   title: 'MongoDB Overview',

   description: 'MongoDB is no sql database',

   by_user: 'luyaran.com',

   url: 'http://www.luyaran.com',

   tags: ['mongodb', 'database', 'NoSQL'],

   likes: 100

},

{

   _id: ObjectId(7df78ad8902d)

   title: 'NoSQL Overview',

   description: 'No sql database is very fast',

   by_user: 'luyaran.com',

   url: 'http://www.luyaran.com',

   tags: ['mongodb', 'database', 'NoSQL'],

   likes: 10

},

{

   _id: ObjectId(7df78ad8902e)

   title: 'Neo4j Overview',

   description: 'Neo4j is no sql database',

   by_user: 'Neo4j',

   url: 'http://www.neo4j.com',

   tags: ['neo4j', 'database', 'NoSQL'],

   likes: 750

},

现在呢，我们通过以上的集合来计算每个作者所写的文章数量：

> db.luyaran.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])

{

   "result" : [

      {

         "_id" : "luyarna.com",

         "num_tutorial" : 2

      },

      {

         "_id" : "Neo4j",

         "num_tutorial" : 1

      }

   ],

   "ok" : 1

}

> //类似于sql select by_user,count(*) from luyaran group by luyaran

上面的sql是什么意思就不用在下赘述了，那我们就来看一下MongoDB中有哪些聚合表达式：

表达式	描述	实例
$sum	计算总和。	db.luyaran.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg	计算平均值	db.luyaran.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min	获取集合中所有文档对应值得最小值。	db.luyaran.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max	获取集合中所有文档对应值得最大值。	db.luyaran.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push	在结果文档中插入值到一个数组中。	db.luyaran.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet	在结果文档中插入值到一个数组中，但不创建副本。	db.luyaran.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first	根据资源文档的排序获取第一个文档数据。	db.luyaran.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last	根据资源文档的排序获取最后一个文档数据	db.luyaran.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

写到这里就必须和大家介绍一下管道的概念了：

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式：处理输入文档并输出。表达式是无状态的，只能用于计算当前聚合管道的文档，不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作：

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
$match：用于过滤数据，只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

OK，咱们继续往下走哈，看一下管道操作符的实例哈，首先是$project：

db.luyaran.aggregate(

    { $project : {

        title : 1 ,

        author : 1 ,

    }}

 );

执行上述代码，结果集中就只剩下_id，title，author这三个字段了，默认情况下_id是被包含的，如果你不想被包含的话，你可以通过下面的方式来执行：

db.luyaran.aggregate(

    { $project : {

        _id : 0 ,

        title : 1 ,

        author : 1

    }});

再来看一个$match的实例：

db.luyaran.aggregate( [

                        { $match : { score : { $gt : 70, $lte : 90 } } },

                        { $group: { _id: null, count: { $sum: 1 } } }

                       ] );

$match在这里呢，只是用来获取分数大于70或者等于90的记录，然后呢，将记录送到下一阶段$group管道操作符进行处理。

最后看一个$skip的实例：

db.article.aggregate(

    { $skip : 5 });

经过$skip管道操作符处理之后，前5个文档被过滤掉了。

好啦，到这里，我们的聚合操作和管道操作符就分享的差不多了。接下来就是再深入一点的数据操作了，那就是索引。

索引通常能够极大的提高查询的效率，如果没有索引，MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。这种扫描全集合的查询效率是非常低的，特别在处理大量的数据时，查询可以要花费几十秒甚至几分钟，这对网站的性能是非常致命的。索引是特殊的数据结构，索引存储在一个易于遍历读取的数据集合中，索引是对数据库表中一列或多列的值进行排序的一种结构。接下来我们就来看一下所以的基本语法格式：

>db.COLLECTION_NAME.ensureIndex({KEY:1})

语法中 Key 值为你要创建的索引字段，1为指定按升序创建索引，如果你想按降序来创建索引指定为-1即可。接下来看一下实例哈：

>db.luyaran.ensureIndex({"title":1})

>

ensureIndex() 方法中你也可以设置使用多个字段创建索引（关系型数据库中称作复合索引）。

>db.luyaran.ensureIndex({"title":1,"description":-1})

>

接下来，我们来看一下ensureIndex()的接收可选参数的列表哈：

Parameter	Type	Description
background	Boolean	建索引过程会阻塞其它数据库操作，background可指定以后台方式创建索引，即增加 "background" 可选参数。 "background" 默认值为false。
unique	Boolean	建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name	string	索引的名称。如果未指定，MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups	Boolean	在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse	Boolean	对文档中不存在的字段数据不启用索引；这个参数需要特别注意，如果设置为true的话，在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds	integer	指定一个以秒为单位的数值，完成 TTL设定，设定集合的生存时间。
v	index version	索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights	document	索引权重值，数值在 1 到 99,999 之间，表示该索引相对于其他索引字段的得分权重。
default_language	string	对于文本索引，该参数决定了停用词及词干和词器的规则的列表。默认为英语
language_override	string	对于文本索引，该参数指定了包含在文档中的字段名，语言覆盖默认的language，默认值为 language.

来，我们在后台创建索引试下：

db.luyaran.ensureIndex({open: 1, close: 1}, {background: true})

通过在创建索引时加background:true 的选项，让创建工作在后台执行。

好啦，到这里咱们今天要分享的内容就差不多结束了。重新声明哈，本人的学习笔记，各位看官勿喷哈。如果觉得不错的话，请大家多多点赞评论支持哦。

　　原文链接：https://blog.csdn.net/luyaran/article/details/79737427

MongoDB入门---聚合操作&管道操作符&索引的使用的更多相关文章

MongoDB的聚合操作以及与Python的交互
上一篇主要介绍了MongoDB的基本操作,包括创建.插入.保存.更新和查询等,链接为MongoDB基本操作. 在本文中主要介绍MongoDB的聚合以及与Python的交互. MongoDB聚合什么是 ...
Yii2的mongodb的聚合操作
最近项目使用到mongodb的聚合操作,但是yii文档中对这方面资料较少,记录下 $where['created_time'] = ['$gt' => "$start_date_str ...
Mongodb的聚合和管道
MongoDB 聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果. aggregate() 方法 MongoDB中聚合的方法使用agg ...
mongodb的聚合操作
在mongodb中有时候我们需要对数据进行分析操作,比如一些统计操作,这个时候简单的查询操作(find)就搞不定这些需求,因此就需要使用聚合框架(aggregation) 来完成.在mongodb ...
mongodb aggregate 聚合操作（扁平化flatten）
mongodb自带的函数非常多,最近用mongo做持久化数据库,遇到一个需求:子文档是个数组,把数组里的各个字段扁平化合到根文档中,查过资料后(主要是mongodb的文档和stackoverflow) ...
MongoDB入门三步曲2－－基本操作(续)--聚合、索引、游标及mapReduce
mongodb 基本操作(续)--聚合.索引.游标及mapReduce 目录聚合操作 MapReduce 游标索引聚合操作像大多关系数据库一样,Mongodb也提供了聚合操作,这里仅列取常见到 ...
mongodb高级聚合查询
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...
mongodb高级聚合查询（转）
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...
MongoDb进阶实践之八 MongoDB的聚合初探
一.引言好久没有写东西了,MongoDB系列的文章也丢下好长时间了.今天终于有时间了,就写了一篇有关聚合的文章.一说到“聚合”,用过关系型数据库的人都应该知道它是一个什么东西.关系型数据库有“聚合” ...

随机推荐

浅谈SAP Cloud for Sales 自动化
在Jerry还在本科进行计算机理论知识学习时,我曾经把软件开发里的质量工程师(Quality Engineer)理解成是每天只是简单地做着运行开发人员编写好的软件,如果发现问题,通知开发人员去修改这种 ...
jemter多种方式查看结果树及正则的使用
最近才发现jemter结果是有一种正则表达式匹配的显示方式,以前直接在TEXT下显示和来匹配正则,真是费时间,使用方式如下: 默认使用TEXT方式显示: 显示方式有以下几种: RegExp Teste ...
oracle 10g将数据导入到指定表空间的步骤
--创建临时表空间 create temporary tablespace yhtemp tempfile 'D:/oracle/oradata/Oracle10g/yhtemp.dbf' size ...
Mongod启动失败修复方法
可能的原因:上次服务未正常关闭 1.删除data/db目录下的mongo.lock文件 2.删除/tmp/mongodb-27017.sock文件
Qgis里的查询过滤
查询过虑实现方式通过给getFeatures()传递 QgsFeatureRequest对象,实现数据的过虑,下边是一个查询的例子: request = QgsFeatureRequest() re ...
iOS 数据库sqlite3.0操作--超简单--看我就够啦
iOS客户端数据存储的方式有很多,下面主要是介绍苹果自带的sqlite3.0的使用方法. 首先导入sqlite3.0的框架.然后导入头文件#import <sqlite3.h>就行了下面 ...
nginx/apache连接数梳理
统计连接数,使用netstat命令或ss命令都可以1)统计连接数(80端口) [root@wang ~]# netstat -nat|grep -i "|wc -l 或者:netstat - ...
HDU 2079 选课时间（普通型数量有限母函数）
传送门: http://acm.hdu.edu.cn/showproblem.php?pid=2079 选课时间(题目已修改,注意读题) Time Limit:1000MS Memory Li ...
jsp页面运行的步骤以及原理
1.jsp页面在服务器端的执行步骤: 1)将jsp页面翻译成java文件 2)编译 java-class 3)执行返回结果(html页面)给客户端. 2.jsp页面运行的原理: jsp在服务器端运行 ...
每日笔记---使用@ConfigurationProperties读取yml配置
每日笔记---使用@ConfigurationProperties读取yml配置参考地址 https://www.cnblogs.com/mycs-home/p/8352140.html 1.添加 ...

MongoDB入门---聚合操作&管道操作符&索引的使用

MongoDB入门---聚合操作&管道操作符&索引的使用的更多相关文章

随机推荐

热门专题