MongoDB的聚合操作以及与Python的交互
上一篇主要介绍了MongoDB的基本操作,包括创建、插入、保存、更新和查询等,链接为MongoDB基本操作。
在本文中主要介绍MongoDB的聚合以及与Python的交互。
MongoDB聚合
什么是聚合
MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。
聚合是基于数据处理的聚合管道,每个文档通过由多个阶段组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列处理,输出结果。
语法:db.集合名称.aggregate({管道: {表达式}})
管道一般用于将当前命令的输出结果作为下一个命令的参数。
MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。
常用管道
下面介绍常用的管道:
$group:将集合中的文档分组,可用于统计结果$match:过滤数据,只输出符合条件的文档$project:修改输入文档的结构,如重命名、增加、删除字段,也可用于创建计算结果以及嵌套文档$sort:将输入文档排序后输出$limit:限制聚合管道返回的文档数$skip:跳过指定数量的文档,并返回余下的数据$unwind:将数组类型的字段进行拆分
常用聚合表达式
下面介绍常用的聚合表达式:
$sum:计算总和,$sum:1表示以1计数$avg:计算平均值$min:获取最小值$max:获取最大值$push:在结果文档中插入值到一个数组中$first:根据资源文档的排序,获取第一个文档数据$last:根据资源文档的排序,获取最后一个文档数据
MongoDB聚合实例
现在假设集合studen中有以下数据:
{ "_id" : 1, "name" : "小然", "gender" : 1, "age" : 22, "score" : 95 }
{ "_id" : 2, "name" : "小红", "gender" : 0, "age" : 18, "score" : 80 }
{ "_id" : 3, "name" : "小亮", "gender" : 1, "age" : 19, "score" : 60 }
{ "_id" : 4, "name" : "小强", "gender" : 1, "age" : 23, "score" : 70 }
{ "_id" : 5, "name" : "小柔", "gender" : 0, "age" : 20, "score" : 85 }
{ "_id" : 6, "name" : "小雷", "gender" : 1, "age" : 25, "score" : 65 }
{ "_id" : 7, "name" : "小冉", "gender" : 0, "age" : 19, "score" : 70 }
{ "_id" : 8, "name" : "小晴", "gender" : 0, "age" : 18, "score" : 90 }
{ "_id" : 9, "name" : "小齐", "gender" : 1, "age" : 24, "score" : 50 }
- 以性别进行分组
db.students.aggregate({$group:{_id:"$gender"}})
输出结果为:

- 统计整个文档,获得数据个数和平均分数
db.students.aggregate({$group:{
_id:null,
count:{$sum:1},
avg_score:{$avg:"$score"}
}})
输出结果为:

- 以性别进行分组,获取不同分组中数据的个数和平均分数
db.students.aggregate({$group:{
_id:"$gender",
count:{$sum:1},
avg_score:{$avg:"$score"}
}})
输出结果为:

- 使用
$project修改输出结果
db.students.aggregate(
{$group:{
_id:"$gender",
count:{$sum:1},
avg_score:{$avg:"$score"}}
},
{$project:{
gender:"$_id",
count:1,
_id:0,
avg_score:"$avg_score"}
}
)
输出结果为:

- 使用
$match选择分数大于等于70的学生,统计男生、女生的人数
db.students.aggregate(
{$match:{score:{$gte:70}}},
{$group:{_id:"$gender",count:{$sum:1}}},
{$project:{gender:"$_id",count:1,_id:0}}
)
输出结果为:

MondoDB与Python的交互
pymongo的安装
使用Python操作MongoDB需要安装pymongo,安装方法很简单,使用pip install pymongo即可。
实例化并建立连接
首先从pymongo中导入MongoClient,然后实例化client,建立连接,代码如下:
from pymongo import MongoClient
client = MongoClient(host = "127.0.0.1",port = 27017)
#操作本机MongoDB可以写成client = MongoClient()
collection = client["test"]["test"]
常用操作实例
- 插入一条数据
collection.insert_one({"_id":0,"name":"test0"})
- 插入多条数据
data_list = [{"_id":i,"name":"test{}".format(i)} for i in range(10)]
collection.insert_many(data_list)
data_list = [{"name":"test{}".format(i)} for i in range(10)]
collection.insert_many(data_list)
插入后结果如下图所示,下面的操作都在此数据库上进行操作。

- 查询一条记录
print(collection.find_one({"name":"test2"}))
输出结果为:

- 查询所有记录
result = collection.find({"name":"test2"})
for i in result:
print(i)
输出结果为:

- 更新一条数据
collection.update_one({"name":"test1"},{"$set":{"name":"test10"}})
执行完操作后,数据库如下图所示:

- 更新全部数据
collection.update_many({"name":"test2"},{"$set":{"name":"test20"}})
执行完操作后,数据库如下图所示:

- 删除一条数据
collection.delete_one({"name":"test3"})
执行完操作后,数据库如下图所示:

- 删除所有满足条件的数据
collection.delete_many({"name":"test4"})
执行完操作后,数据库如下图所示:

结语
- 本篇主要介绍了MongoDB的聚合操作以及与Python的交互,但对于我目前的学习阶段来说,只用到了Python中的插入数据语句,其他的操作基本没有用到。
- 感谢大家的阅读,有错误希望大家能够指出,我会积极改正。
MongoDB的聚合操作以及与Python的交互的更多相关文章
- Yii2的mongodb的聚合操作
最近项目使用到mongodb的聚合操作,但是yii文档中对这方面资料较少,记录下 $where['created_time'] = ['$gt' => "$start_date_str ...
- MongoDB入门---聚合操作&管道操作符&索引的使用
经过前段时间的学习呢,我们对MongoDB有了一个大概的了解,接下来就要开始使用稍稍深入一点的东西了,首先呢,就是MongoDB中的聚合函数,跟mysql中的count等函数差不多.话不多说哈,我们先 ...
- mongodb的聚合操作
在mongodb中有时候我们需要对数据进行分析操作,比如一些统计操作,这个时候简单的查询操作(find)就搞不定这些需求,因此就需要使用 聚合框架(aggregation) 来完成.在mongodb ...
- mongodb aggregate 聚合 操作(扁平化flatten)
mongodb自带的函数非常多,最近用mongo做持久化数据库,遇到一个需求:子文档是个数组,把数组里的各个字段扁平化合到根文档中,查过资料后(主要是mongodb的文档和stackoverflow) ...
- mongodb高级聚合查询
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...
- mongodb高级聚合查询(转)
在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysql复杂很多. 注:本文基于 mo ...
- mongodb 高级聚合查询
mongodb高级聚合查询 在工作中会经常遇到一些mongodb的聚合操作,特此总结下.mongo存储的可以是复杂类型,比如数组.对象等mysql不善于处理的文档型结构,并且聚合的操作也比mysq ...
- mongodb(五):聚合操作(python)
pymongo的聚合操作 数据类型样式 /* 1 */ { "_id" : ObjectId("5e5a32fe2a89d7c2fc05b9fc"), &quo ...
- MongoDB 聚合操作
在MongoDB中,有两种方式计算聚合:Pipeline 和 MapReduce.Pipeline查询速度快于MapReduce,但是MapReduce的强大之处在于能够在多台Server上并行执行复 ...
随机推荐
- 今年新鲜出炉的30个流行Android库,你一定需要
作者|Michal Bialas 2017年快过去了,你年初的定的目标都快完成了吗?总结过去三个月内发布的 最新的30 个 Android 库和项目.你一定需要,建议收藏!让你事半功倍 1.Mater ...
- C++箱子排序
箱子排序 实现 把每个箱子用一个链表实现.在进行节点分配之前,每个箱子都是空的. 基本思想 1.从与排序链表的头部开始,逐个删除节点,并把它放到合适的箱子链表的头部 2.收集并连接每个箱子中的节点,产 ...
- idea 自动导入包设置
- 选择 Java 编写 iOS 与 安卓 App的八大理由
[编者按]本文作者为 RoboVM 的 CEO 兼联合创始人 Henric Müller,主要介绍选用 Java 编写移动应用的八大理由.文章系国内 ITOM 管理平台 OneAPM 编译呈现. 在过 ...
- 搜索关键字自动更正 - Oracle Endeca Server
做了几个Oracle Endeca 电商项目.每个项目都会有搜过关键字拼写错误更正(Spelling Correction)的需求.淘宝也有类似功能. Oracle Endeca Sever提供了关键 ...
- Azure Document DB 存储过程、触发器、自定义函数的实现
阅读 大约需要 4 分钟 在上一篇随笔中记录的是关于Azure Cosmos DB 中SQL API (DocumentDB) 的简介和Repository 的实现.本随笔是Document DB 中 ...
- [翻译] GCDObjC
GCDObjC https://github.com/mjmsmith/gcdobjc GCDObjC is an Objective-C wrapper for the most commonly ...
- django中的字段类型
from http://www.cnblogs.com/lhj588/archive/2012/05/24/2516040.html Django 通过 models 实现数据库的创建.修改.删除等操 ...
- Linux系统锁定关键文件
锁定系统关键文件 1.密码.账号文件 chattr +i /etc/passwd /etc/group /etc/shadow /etc/gshadow /etc/inittab 加锁:chattr ...
- "字符串"经过strip 之后还是字符串, 而"字符串"经过split 分开后,就变成了一个列表["x","xx","xxx"]
"字符串"经过strip 之后还是字符串, 而"字符串"经过split 分开后,就变成了一个列表["x","xx",&q ...