mongodb

   最近入职了新的公司,新公司统一使用的mongodb,es等非关系型数据库。以前对es有一些了解,其实就是灵活的文档类型结构,不受限于关系型数据库的那种字段唯一确定的”死板“,但是无论是关系型数据库还是非关系型数据库,目前使用了一段时间来说,我认为各有优劣,具体选择要结合业务场景来进行选择。

   有关mongo的快速学习文档可以参照以下资料来学习:

聚合查询

   在我这种习惯了mysql这种关系型数据的结构设计中,来处理mongo集合(数据表)的一些操作票,或多或少还是受到关系型数据库思想的影响与约束,毕竟还是使用了这么多年了。。。

   比如在下面这种场景下:A对象集合与B对象集合之间有关联关系,此时,针对于上级关系修改操作较少的可以将他们之间的关系映射成嵌入式的子文档,但他们的数据都在经常性的发生相互变化,这种情况很显然不能将数据作为嵌入式文档保存,应该要实时的查询关联的数据。

   mongo中早期的一些版本又没有left join,right join的概念,后来在3.2版本开始,增加了$lookup操作。

   在介绍$lookup前简单了解一下mongo中的一些聚合管道操作:

聚合指令 功能描述
$match 筛选,选择要处理的文档
$project 指定输出文档中的字段,映射别名等
$group 顾名思义,分组 根据指定内容来分组
$limit 限制传递到下一步的文档数量
$skip 跳过当前顺序的一定数量的文档
$unwind 扩展数组,为每一个3数组入口生成一个输出文档
$sort 文档排序
$lookup 多表关联(since 3.2+)
$geoNear 选择某个地理位置附近的的文档
$out 把管道的结果写入某个集合
$redact 控制特定数据的访问

   上面的指定都属于聚合管道中的操作,(官方解释)聚合管道是用于数据聚合的框架,其模型基于数据处理管道的概念。文档进入多阶段管道,将文档转换为聚合结果。MongoDB 聚合管道由多个阶段组成。每个阶段在文档通过管道时转换文档。管道阶段不需要为每个输入文档生成一个输出文档; 如:某些阶段可能会生成新文档或过滤掉文档。后边有时间写一篇文章来记录一下聚合管道。

特别说明 - 局限性

    mongodb的官方文档说明:$lookup: Performs a left outer join to an unsharded collection in the same database to filter in documents from the “joined” collection for processing. The $lookup stage does an equality match between a field from the input documents with a field from the documents of the “joined” collection.

简单点说就是: $lookup只能在同一个数据库中, 且这个collection不能有分片. 如果你的集合设计不在一个库中, 且设置了分片的话, 那下面的连表操作都是无效的,请不用浪费时间浏览了。

$lookup关联

   $lookup是管道中的一个阶段,在这个阶段,可以做连表操作,具有如下语法:

{
$lookup:
{
from: <collection to join 需要左连接的集合>,
localField: <主集合中与该左连集合关联的字段>,
foreignField: <左连集合中对应的字段>,
as: <output array field 指定新输入数组字段的名称:该处会处理成数组>
}
}

该操作等效于如下sql释义:

SELECT *, <output array field>
FROM collection
WHERE <output array field> IN
(SELECT * FROM <collection to join>
WHERE <foreignField>= <collection.localField>);

mongoTemplate中使用

   说了那么多,是想介绍一下简单的概念,言归正传,开始讲在springboot中使用mongoTemplate中该如何使用。

   假设当前有两个集合,一个company,一个product,产品隶属于公司下,他们之间存在关联关系。

   1. CompanyMongoPO.java


import lombok.Data;
import lombok.experimental.Accessors;
import org.springframework.data.mongodb.core.mapping.Document; @Data
@Accessors(chain = true)
@Document("company")
public class CompanyMongoPO { @Id
private String id; private String name; }

   2. productMongoPO.java

import lombok.Data;
import lombok.experimental.Accessors;
import org.springframework.data.mongodb.core.mapping.Document; @Data
@Accessors(chain = true)
@Document("product")
public class ProductMongoPO { @Id
private String id; private String name; private String companyId; }

   3. 在Dao层进行查询操作:

......
Criteria criteria = new Criteria();
criteria.and("companyId").is("companyId");
// 构造聚合管道操作
List<AggregationOperation> operationList = Lists.newArrayList();
// 这一步很重要,将product中的companyId字段转化为ObjectId类型,因为String类型和ObjectId类型不一样,会导致连接失效
AddFieldsOperation addFieldsOperation = AddFieldsOperation.addField("companyId").withValue(ConvertOperators.ToObjectId.toObjectId("$companyId")).build();
LookupOperation companyLookupOperation = LookupOperation.newLookup()
.from("company")
.localField("companyId")
.foreignField("_id")
.as("companyJoin");
AggregationOperation match = Aggregation.match(criteria);
ProjectionOperation project = Aggregation.project("id","name","companyId")
.and("companyJoin.name").as("companyName");
// 分页与排序操作,字段未在上面体现出来
SkipOperation skip = Aggregation.skip((long)param.getOffset());
LimitOperation limit = Aggregation.limit(param.getPageSize());
SortOperation sort = Aggregation.sort(Sort.Direction.DESC, "createTime");
// 封装条件:此处的顺序可以调整 将match放到前面可以避免因为AddFiled引起的companyId字段类型变化
operationList.add(match);
operationList.add(addFieldsOperation);
operationList.add(companyLookupOperation);
operationList.add(project);
operationList.add(sort);
operationList.add(skip);
operationList.add(limit); Aggregation agg = Aggregation.newAggregation(operationList);
AggregationResults<ProductItemVO> aggregationResults = this.getMongoTemplate().aggregate(agg, "product", ProductItemVO.class);
List<ProductItemVO> dataList = aggregationResults.getMappedResults();
......

   如上伪代码,就是一个简单的聚合操作,当然有几个地方需要注意一下:

  • 连表时的字段类型要一致:比如上面的companyId和id字段,一个String,一个是ObjectId类型,需要将companyId转化为ObjectId类型,再进行连接,当然这个地方我理解也可以将_id转化为String类型,但是经过我的测试,发现没有成功,还需要找下原因。

  • 在将companyId转化为ObjectId类型后,如果后面有使用到companyId作为match的筛选条件字段,这个地方要注意一下,在聚合管道中,有一定的顺序性,如果将AddFieldsOperation操作放在match之前,那么会导致match这个字段的条件失效,需要调整一下顺序,将match放在前面,先查找出符合条件的数据再进行连表查询,这样既可以提高查询效率,又可以避免字段类型问题。

总结

   目前用到的就是这样的操作,往后还有更复杂的操作时再继续更新记录内容。

MongoTemplate聚合(一)$lookup的更多相关文章

  1. MongoTemplate聚合操作

    Aggregation简单来说,就是提供数据统计.分析.分类的方法,这与mapreduce有异曲同工之处,只不过mongodb做了更多的封装与优化,让数据操作更加便捷和易用.Aggregation操作 ...

  2. mongoTemplate聚合操作Demo

    package com.tangzhe.mongodb.mongotemplate; import com.mongodb.BasicDBObject; import com.mongodb.DBOb ...

  3. mongodb mongotemplate聚合

    1.group by并且计算总数 @Test public void insertTest() { //测试数据 //insertTestData(); Aggregation agg = Aggre ...

  4. 基于 MongoDB 动态字段设计的探索 (二) 聚合操作

    业务需求及设计见前文:基于 MongoDB 动态字段设计的探索 根据专业计算各科平均分 (总分.最高分.最低分) public Object avg(String major){ Aggregatio ...

  5. MongoDB学习记录

    一.操作符 "$lt" :"<""$lte" :"<=""$gt" :"> ...

  6. SpringBoot整合MongoDB JPA,测试MongoRepository与MongoTemplate用法,简单增删改查+高级聚合

    源码 地址 -> https://github.com/TaoPanfeng/case/tree/master/04-mongo/springboot-mongo 一 引入依赖 <depe ...

  7. 开发中使用mongoTemplate进行Aggregation聚合查询

    笔记:使用mongo聚合查询(一开始根本没接触过mongo,一点一点慢慢的查资料完成了工作需求) 需求:在订单表中,根据buyerNick分组,统计每个buyerNick的电话.地址.支付总金额以及总 ...

  8. mongoTemplate.aggregate()聚合查询

    一.概述 1. 聚合的表达式 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果.有点类似sql语句中的 count(*). 下表展示了一些聚 ...

  9. 【翻译】MongoDB指南/聚合——聚合管道

    [原文地址]https://docs.mongodb.com/manual/ 聚合 聚合操作处理数据记录并返回计算后的结果.聚合操作将多个文档分组,并能对已分组的数据执行一系列操作而返回单一结果.Mo ...

随机推荐

  1. Java学习日报7.18

    /** * *//** * @author 86152 * */ package trangle;import java.util.Scanner; public class Trangle{ pub ...

  2. swap是干嘛的?

    本文截取自:http://hbasefly.com/2017/05/24/hbase-linux/ swap是干嘛的? 在Linux下,SWAP的作用类似Windows系统下的"虚拟内存&q ...

  3. 关于java方法重写

    1.子类的方法与父类中的方法有相同的返回类型,相同的方法名称.相同的参数列表 2.子类方法的访问级别不能低于父类方法的访问级别 3.子类方法抛出的异常范围不能大于父类中方法抛出的异常范围

  4. mysql 创建[序列],功能类似于oracle的序列

    参考自菜鸟教程 https://www.runoob.com/mysql/mysql-using-sequences.html 使用函数创建自增序列管理表(批量使用自增表,设置初始值,自增幅度) 第一 ...

  5. JS内存

    内存是用来存什么的 通俗的来说呢,就是用来存 var let function const 声明的变量. 内存的大小 与操作系统有关,64位1.4G 32位0.7G. 为啥内存大小要这么设计,为啥不是 ...

  6. WPF 调试时拖拽不生效

    WPF窗体代码 <Window x:Class="SerialLabelDemo.Test.Window10" xmlns="http://schemas.micr ...

  7. Angular入门到精通系列教程(10)- 指令(Directive)

    1. 摘要 2. 组件与指令之间的关系 2.1. 指令的种类 3. Angular 中指令的用途 4. 指令举例 4.1. 指令功能 4.2. Anuglar CLI生成基本文件 4.3. Direc ...

  8. Linux下Oracle 11G XE 安装笔记

    操作系统 [oracle@RAC02 ~]$ lsb_release -aLSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:cor ...

  9. C++ 简单输出当前日期时间

    根据https://www.runoob.com/cplusplus/cpp-date-time.html编写. 首先介绍2个数据类型. 一个是time_t,与时间函数相关的变量,定义的变量记录着自 ...

  10. PAT甲级练习 1087 All Roads Lead to Rome (30分) 字符串hash + dijkstra

    题目分析: 这题我在写的时候在PTA提交能过但是在牛客网就WA了一个点,先写一下思路留个坑 这题的简单来说就是需要找一条最短路->最开心->点最少(平均幸福指数自然就高了),由于本题给出的 ...