1 mongoDB索引的管理

  本节介绍mongoDB中的索引,熟悉mysql/sqlserver等关系型数据库的小伙伴应该都知道索引对优化数据查询的重要性。我们先简单了解一下索引:索引的本质就是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据(数据row或者document)的物理地址,索引可以大大加快查询的速度,这是因为使用索引后可以不再扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址(多数为B-tree查找),然后通过地址来访问相应的数据。
  索引可以加快数据检索、排序、分组的速度,减少磁盘I/O,但是索引也不是越多越好,因为索引本身也是数据表,需要占用存储空间,同时索引需要数据库进行维护,当我们对索引列的值进行增改删操作时,数据库需要更新索引表,这会增加数据库的压力。
我们要根据实际情况来判断哪些列适合添加索引,哪些列不适合添加索引,一般遵循的规律如下:
  主/外键列,主键用于强制该列的唯一性和组织表中数据的排列结构;外键可以加快连接的速度;
  经常用于比较的类(大于小于等于等),因为索引已经排序,值就是大于/小于的分界点;
  经常进行范围搜索,因为索引已经排序,其指定的范围是连续的;
  经常进行排序的列,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
  经常进行分组的列,因为索引已经排序,同一个值的所有数据地址会聚集在一块,很方便分组。
我们看一下mongoDB的索引使用,首先准备数据:
db.userinfos.insertMany([
{_id:, name: "张三", age: ,level:, ename: { firstname: "san", lastname: "zhang"}, roles: ["vip","gen" ]},
{_id:, name: "李四", age: ,level:, ename: { firstname: "si", lastname: "li"}, roles:[ "vip" ]},
{_id:, name: "王五", age: ,level:, ename: { firstname: "wu", lastname: "wang"}, roles: ["gen","vip" ]},
{_id:, name: "赵六", age: ,level:, ename: { firstname: "liu", lastname: "zhao"}, roles: ["gen"] },
{_id:, name: "田七", age: , ename: { firstname: "qi", lastname: "tian"}, address:'北京' },
{_id:, name: "周八", age: ,roles:["gen"], address:'上海' }
]);

  索引的增删改查还是十分简单的,我们看一下索引管理的几个方法:

//创建索引,值1表示正序排序,-1表示倒序排序
  db.userinfos.createIndex({age:-}) //查看userinfos中的所有索引
  db.userinfos.getIndexes() //删除特定一个索引
  db.userinfos.dropIndex({name:,age:-})
//删除所有的索引(主键索引_id不会被删除)
  db.userinfos.dropIndexes() //如果我们要修改一个索引的话,可以先删除索引然后在重新添加。

2 mongoDB中常用的索引类型

1 单键索引

  单键索引(Single Field Indexes)顾名思义就是单个字段作为索引列,mongoDB的所有collection默认都有一个单键索引_id,我们也可以对一些经常作为过滤条件的字段设置索引,如给age字段添加一个索引,语法十分简单:

//给age字段添加升序索引
  db.userinfos.createIndex({age:})

  其中{age:1}中的1表示升序,如果想设置倒序索引的话使用 db.userinfos.createIndex({age:-}) 即可。我们通过explain()方法查看查询计划,如下图,看到查询age=23的document时使用了索引,如果没有使用索引的话stage=COLLSCAN。

  因为document的存储是bson格式的,我们也可以给内置对象的字段添加索引,或者将整个内置对象作为一个索引,语法如下:

//1.内嵌对象的某一字段作为索引
//在ename.firstname字段上添加索引
  db.userinfos.createIndex({"ename.firstname":})
//使用ename.firstname字段的索引查询
  db.userinfos.find({"ename.firstname":"san"}) //2.整个内嵌对象作为索引
//给整个ename字段添加索引
  db.userinfos.dropIndexes()
//使用ename字段的索引查询
  db.userinfos.createIndex({"ename":})

2 复合索引

  复合索引(Compound Indexes)指一个索引包含多个字段,用法和单键索引基本一致。使用复合索引时要注意字段的顺序,如下添加一个name和age的复合索引,name正序,age倒序,document首先按照name正序排序,然后name相同的document按age进行倒序排序。mongoDB中一个复合索引最多可以包含32个字段。

//添加复合索引,name正序,age倒序
  db.userinfos.createIndex({"name":,"age":-})
//过滤条件为name,或包含name的查询会使用索引(索引的第一个字段)
  db.userinfos.find({name:'张三'}).explain()
   db.userinfos.find({name:"张三",level:}).explain()
   db.userinfos.find({name:"张三",age:}).explain() //查询条件为age时,不会使用上边创建的索引,而是使用的全表扫描
db.userinfos.find({age:}).explain()

  执行查询时查询计划如下:

3 多键索引

  多键索引(mutiKey Indexes)是建在数组上的索引,在mongoDB的document中,有些字段的值为数组,多键索引就是为了提高查询这些数组的效率。看一个栗子:准备测试数据,classes集合中添加两个班级,每个班级都有一个students数组,如下:

  db.classes.insertMany([
{
"classname":"class1",
"students":[{name:'jack',age:},
{name:'tom',age:},
{name:'lilei',age:}]
},
{
"classname":"class2",
"students":[{name:'lucy',age:},
{name:'jim',age:},
{name:'jarry',age:}]
}]
)

  为了提高查询students的效率,我们使用  db.classes.createIndex({'students.age':}) 给students的age字段添加索引,然后使用索引,如下图:

4 哈希索引

  哈希索引(hashed Indexes)就是将field的值进行hash计算后作为索引,其强大之处在于实现O(1)查找,当然用哈希索引最主要的功能也就是实现定值查找,对于经常需要排序或查询范围查询的集合不要使用哈希索引。

3 mongoDB中常用的索引属性

1  唯一索引

  唯一索引(unique indexes)用于为collection添加唯一约束,即强制要求collection中的索引字段没有重复值。添加唯一索引的语法:

//在userinfos的name字段添加唯一索引
db.userinfos.createIndex({name:},{unique:true})

  看一个使用唯一索引的栗子:

2  局部索引

  局部索引(Partial Indexes)顾名思义,只对collection的一部分添加索引。创建索引的时候,根据过滤条件判断是否对document添加索引,对于没有添加索引的文档查找时采用的全表扫描,对添加了索引的文档查找时使用索引。使用方法也比较简单:

//userinfos集合中age>25的部分添加age字段索引
db.userinfos.createIndex(
{age:},
{ partialFilterExpression: {age:{$gt: }}}
)
//查询age<25的document时,因为age<25的部分没有索引,会全表扫描查找(stage:COLLSCAN)
db.userinfos.find({age:})
//查询age>25的document时,因为age>25的部分创建了索引,会使用索引进行查找(stage:IXSCAN)
db.userinfos.find({age:})

  当查询age=23的记录时,stage=COLLSCAN,当查询age=26的记录时,使用了索引,如下:

2 稀疏索引

  稀疏索引(sparse indexes)在有索引字段的document上添加索引,如在address字段上添加稀疏索引时,只有document有address字段时才会添加索引。而普通索引则是为所有的document添加索引,使用普通索引时如果document没有索引字段的话,设置索引字段的值为null。

  稀疏索引的创建方式如下,当document包含address字段时才会创建索引:

//创建在address上创建稀疏索引
  db.userinfos.createIndex({address:},{sparse:true})

  看一个使用稀疏索引的栗子:

4 TTL索引

  TTL索引(TTL indexes)是一种特殊的单键索引,用于设置document的过期时间,mongoDB会在document过期后将其删除,TTL非常容易实现类似缓存过期策略的功能。我们看一个使用TTL索引的栗子:

 //添加测试数据
db.logs.insertMany([
{_id:,createtime:new Date(),msg:"log1"},
{_id:,createtime:new Date(),msg:"log2"},
{_id:,createtime:new Date(),msg:"log3"},
{_id:,createtime:new Date(),msg:"log4"}
])
//在createtime字段添加TTL索引,过期时间是120s
db.logs.createIndex({createtime:}, { expireAfterSeconds: }) //logs中的document在创建后的120s后过期,会被mongoDB自动删除

  注意:TTL索引只能设置在date类型字段(或者包含date类型的数组)上,过期时间为字段值+exprireAfterSeconds;document过期时不一定就会被立即删除,因为mongoDB执行删除任务的时间间隔是60s;capped Collection不能设置TTL索引,因为mongoDB不能主动删除capped Collection中的document。

小结

  本节介绍了mongoDB中常用的索引和索引属性,索引对提升数据检索的速度十分重要,在数据量比较大的时候一般都要在collection上建立索引。mongoDB提供的索引种类很丰富,总会有几种适用于我们的业务,除了上边介绍的索引外,mongoDB还支持text index和一些地理位置相关的索引,这里不再介绍,有兴趣的小伙伴可以到官网 研究下。如果文中有错误的话,希望大家可以指出,我会及时修改,谢谢。

快速掌握mongoDB(三)——mongoDB的索引详解的更多相关文章

  1. Solr系列三:solr索引详解(Schema介绍、字段定义详解、Schema API 介绍)

    一.Schema介绍 1. Schema 是什么? Schema:模式,是集合/内核中字段的定义,让solr知道集合/内核包含哪些字段.字段的数据类型.字段该索引存储. 2. Schema 的定义方式 ...

  2. Oracle索引详解

    Oracle索引详解(二) --索引分类   Oracle 提供了大量索引选项.知道在给定条件下使用哪个选项对于一个程序的性能来说非常重要.一个错误的选择可能会引发死锁,并导致数据库性能急剧下降或进程 ...

  3. Spring Boot 2.x 快速入门(下)HelloWorld示例详解

    上篇 Spring Boot 2.x 快速入门(上)HelloWorld示例 进行了Sprint Boot的快速入门,以实际的示例代码来练手,总比光看书要强很多嘛,最好的就是边看.边写.边记.边展示. ...

  4. spring事务详解(三)源码详解

    系列目录 spring事务详解(一)初探事务 spring事务详解(二)简单样例 spring事务详解(三)源码详解 spring事务详解(四)测试验证 spring事务详解(五)总结提高 一.引子 ...

  5. 【详细解析】MySQL索引详解( 索引概念、6大索引类型、key 和 index 的区别、其他索引方式)

    [详细解析]MySQL索引详解( 索引概念.6大索引类型.key 和 index 的区别.其他索引方式) MySQL索引的概念: 索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分 ...

  6. MySQL 联合索引详解

    MySQL 联合索引详解   联合索引又叫复合索引.对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分.例如索引是key index (a,b,c ...

  7. Hadoop集群搭建安装过程(三)(图文详解---尽情点击!!!)

    Hadoop集群搭建安装过程(三)(图文详解---尽情点击!!!) 一.JDK的安装 安装位置都在同一位置(/usr/tools/jdk1.8.0_73) jdk的安装在克隆三台机器的时候可以提前安装 ...

  8. Linux防火墙iptables学习笔记(三)iptables命令详解和举例[转载]

     Linux防火墙iptables学习笔记(三)iptables命令详解和举例 2008-10-16 23:45:46 转载 网上看到这个配置讲解得还比较易懂,就转过来了,大家一起看下,希望对您工作能 ...

  9. python selenium 三种等待方式详解[转]

    python selenium 三种等待方式详解   引言: 当你觉得你的定位没有问题,但是却直接报了元素不可见,那你就可以考虑是不是因为程序运行太快或者页面加载太慢造成了元素不可见,那就必须要加等待 ...

  10. Window下PHP三种运行方式图文详解,window下的php是不是单进程的?

    Window下PHP三种运行方式图文详解,window下的php是不是单进程的? PHP运行目前为止主要有三种方式: a.以模块加载的方式运行,初学者可能不容易理解,其实就是将PHP集成到Apache ...

随机推荐

  1. SQL Server 事务复制分发到订阅同步慢

    原文:SQL Server 事务复制分发到订阅同步慢 最近发现有一个发布经常出现问题,每几天就出错不同步,提示要求初始化.重新调整同步后,复制还是很慢!每天白天未分发的命令就达五六百万条!要解决慢的问 ...

  2. memcached对中文key的支持问题

    默认的memcached客户端对非ANSI的key存取时会有问题,有2种方式解决: 1 在get和set前将缓存的key进行UrlEncode 2 修改memcached.config文件 <e ...

  3. 核心思想:许多公司都没有认识到云储存的革命性(类似QQ把它搞成了用户的家、再也离不开了)

    在云储存刚刚兴起的时候,也就是dropbox刚刚进入大家视野的时候.许多人都是简单的认为这只是一个提供在线存储的服务而已,许多公司都没有认识到云储存的革命性. 对于这些大公司贸然进入一些新的领域是需要 ...

  4. C# ACCESS 修改表记录提示"UPDATE 语句语法错"问题

    错误的sql 语句如下: sqlStr =  "update tb_userInfo set passWord='" + pw + "' where userName=' ...

  5. 修改GitHub上项目语言显示

    问题 最近将自己以Scala为主语言写的博客放到github上了.由于使用了富文本编辑器.jQuery.Bootstrap等第三方插件,导致js.css等代码远远超过你自己写的代码. 于是也就成这样了 ...

  6. Azure 云助手主要功能

    实时查询: 实时查询Azure云服务的用量和账单,还可以将重点服务固定在首页“我的监控”页面,方便快速查看. 随时管控: 随时随地对云服务管理和配置(例如,重启.更改虚拟机). 多个账户: 随心切换多 ...

  7. 【DRP】-Dao层常用功能代码:增删改查

    本系列博客内容为:做DRP系统中Dao层常用功能. 该项目采用MVC架构 C(Controller)控制器,主要职责;1.取得表单参数:2.调用业务逻辑:3.转向页面 M(Model)模型,主要职责: ...

  8. jquery事件和动画操作集锦

    一,事件 1,加载事件 1 2 3 4 5 6 $(document).ready(function(){   //todo }); //dom准备就绪后执行ready里面的函数,此时dom对应的相关 ...

  9. CS代码代写, 程序代写, java代写, python代写, c/c++代写,csdaixie,daixie,作业代写,代写

    互联网一线工程师程序代写 微信联系 当天完成特色: 互联网一线工程师 24-48小时完成.用心代写/辅导/帮助客户CS作业. 客户反馈与评价 服务质量:保证honor code,代码原创.参考课程sl ...

  10. redis连接错误3种解决方案System Error MISCONF Redis is configured to save RDB snapshots

    redis连接错误System Error MISCONF Redis is configured to save RDB snapshots, but XX   情况1解决办法: 由于强制停止red ...