MongoDB之索引
索引是用来加快查询的,这里不解说索引的原理和数据结构。事实上大部分数据库的索引就是B+Tree,想要了解的同学能够看索引原理,要掌握怎样为查询配置最佳索引会有些难度。
MongoDB索引差点儿和关系型数据库的索引一样.绝大数优化关系型数据库索引的技巧相同适用于MongoDB。
我们举一个样例,如今集合中插入多个文档:
db.lf.insert({“name”:”lf”,”age”:23,”isactive”:true})
db.lf.insert({“name”:”lf”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”aaaa”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”bbbb”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”cccc”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”aaaaa”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”bbbb”,”age”:28,”isactive”:true})
db.lf.insert({“name”:”bbbb”,”age”:21,”isactive”:false})
db.lf.insert({“name”:”rrrr”,”age”:11,”isactive”:true})
接下来。我们该创建索引了。
创建索引
要依照name键进行查找,就能够在此键上建立索引,来提高查询速度。
使用ensureIndex方法来创建索引:
db.lf.ensureIndex({"name":1})
对某个键创建索引会加速对该键的查询,可是对于其它的查询可能没有帮助,即便查询中包括了被索引的键。
那么怎样查看自己创建了哪些索引呢?
查看索引
使用db.system.indexes.find()就能够查看自己创建的索引了。
能够看到,id是一定会有一个索引的,我们创建的name索引在后面。
这里要介绍一个概念,叫做表扫描,表扫描就是在没有索引的集合中查找内容,从第一个到最后一个。当集合过大时,这样的需找方式会显得非常慢,所以我们要避免表扫描。
删除索引
使用dropIndexes命令来删除索引。
比如:
> db.runCommand({"dropIndexes":"lf","index":"*"})
{
"nIndexesWas" : 2,
"msg" : "non-_id indexes dropped for collection",
"ok" : 1
}
> db.lf.ensureIndex({"name":1,"age":1})
> db.lf.ensureIndex({"name":1,"age":-1})
> db.system.indexes.find()
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "name" : 1, "age" : 1 }, "ns" : "test.lf", "name"
: "name_1_age_1" }
{ "v" : 1, "key" : { "name" : 1, "age" : -1 }, "ns" : "test.lf", "name
" : "name_1_age_-1" }
能够看到,创建的全部会有一个name。在删除相应索引时指定名称即可了。
假设以{“age”:1, “name”:1,}这样的方式创建索引,MongoDB会按例如以下方式组织:
用户名安装字母升序排列,同名的组依照年龄升序排列。
创建索引的缺点是每次插入,更新,删除都会产生额外的开销,由于数据库不但须要运行这些操作,还要将这些操作在集合的索引中标记.因此,尽可能少的创建索引。
一般来说,要是查询要返回集合中一半以上的结果,用表扫描会比差点儿每条文档都要索引要快,所以,查询是否存在某个键,或者检查摸个布尔类型的值是真是假,就没有必要利用索引。
扩展索引
假设有个集合存储了用户的状态信息。如今要查询用户和日期,取出某一用户近期的状态.我们可能会建立例如以下索引:
db.users.ensureIndex({"user":1,"date":-1})
这会使对用户和日期的查询非常快,可是并非最好的方式。
由于应用会有数百万的用户,每人每天都有数十条状态更新.若是每条用户状态的索引值咱用相似一页纸的磁盘控件,那么对每次”最新状态”的查询,数据库将会将不同的页加载内存。若是网站太热门,内存放不下全部索引,就会非常慢。要是改变索引的顺序{“date”:-1,”user”:1},则数据库能够将最后几天的索引保存在内存中,能够有效的降低内存交换,这样查询不论什么用户的最新状态都会快非常多。
索引内嵌文档中的键
那么索引怎样作用于NoSQL复杂灵活的内嵌文档呢?
事实上和普通的没有什么差别,还是利用点操作符:
db.blog.insert(
{
"title":" blog",
"author":
{
"name":"lf",
"email":"362512489@qq.com"
}
}
)
为author.name创建索引:
db.blog.ensureIndex({"author.name":1})
对内嵌文档的键索引和普通键索引没有什么差别。所以说两者能够联合组成复合索引。
索引名称
集合中的每个索引都有一个字符串类型的名字,来唯一标识索引,server通过这个名字来删除或操作索引.默认情况下,索引名相似
keyname1_dir1_keyname2_dir2
这样的形式,当中keyname代表索引的键,dir代表索引的方向(1或-1)。当然了,我们也能够通过ensureIndex来指定索引的名称:
db.blog.ensureIndex({"author.name":1},{"name":"author_name_index"})
注意一点,自己定义的索引名称是不能改动的,仅仅能通过删除索引再重建。
唯一索引
唯一索引能够确保集合的每个文档的指定键都有唯一值.假设想保证文档的username键都有不同的值:
db.lf.ensureIndex({"username":1},{"unique":true})
默认情况下,insert并不会去检測文档是否插入过。所以为了避免插入的文档包括与唯一键反复的值,可能要用到安全插入才干满足要求。
消除反复
当我们为已有的集合创建唯一索引的时候,可能有些值已经反复了,所以会创建失败。我们可能会希望价格全部包括反复值的文档都删掉,这个时候我们就能够使用dropDups方法,来保留发现的第一个文档而删除接下来的有反复值的文档:
db.lf.ensureIndex({"username":1},{"unique":true,"dropDups":true})
当然了。假设是关键数据,这样做未免显得有些鲁莽。还是写个脚本预处理比較好。
MongoDB之索引的更多相关文章
- MongoDB的索引(三)
MongoDB的索引: 1. _id索引 该索引是大多数集合默认创建的索引,也就是说用户每插入一个数据,MongoDB会自动生成一条唯一的_id字段. 2. 单键索引 单键索引是最普通的索引,它不会自 ...
- MongoDB 覆盖索引查询
MongoDB 覆盖索引查询 官方的MongoDB的文档中说明,覆盖查询是以下的查询: 所有的查询字段是索引的一部分 所有的查询返回字段在同一个索引中 由于所有出现在查询中的字段是索引的一部分, Mo ...
- MongoDB数据库索引
前面的话 索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录.这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查 ...
- MongoDB数据库索引构建情况分析
前面的话 本文将详细介绍MongoDB数据库索引构建情况分析 概述 创建索引可以加快索引相关的查询,但是会增加磁盘空间的消耗,降低写入性能.这时,就需要评判当前索引的构建情况是否合理.有4种方法可以使 ...
- MongoDB索引(一) --- 入门篇:学习使用MongoDB数据库索引
这个系列文章会分为两篇来写: 第一篇:入门篇,学习使用MongoDB数据库索引 第二篇:进阶篇,研究数据库索引原理--B/B+树的基本原理 1. 准备工作 在学习使用MongoDB数据库索引之前,有一 ...
- MongoDb进阶实践之七 MongoDB的索引入门
一.引言 好久没有写东西了,MongoDB系列的文章也丢下好长时间了.今天终于有时间了,就写了一篇有关索引的文章.一说到"索引",用过关系型数据库的人都应该知道它是一个什么 ...
- 给MongoDB添加索引
用过数据库的都知道,数据库索引与书籍的索引类似,都是用来帮助快速查找的. MongoDB的索引跟关系型数据库的索引几乎一致. 1. 索引的创建 mongodb采用ensureInd ...
- linux环境给mongodb创建索引
首先我们来了解索引,如果有基础的可以直接看最后面的操作. 可参照 DoNotStop 的CSDN 博客 ,全文地址请点击: https://blog.csdn.net/u013725455/artic ...
- MongoDB复合索引详解
摘要: 对于MongoDB的多键查询,创建复合索引可以有效提高性能. 什么是复合索引? 复合索引,即Compound Index,指的是将多个键组合到一起创建索引,这样可以加速匹配多个键的查询.不妨通 ...
- 五、MongoDB的索引
一.MongoDB的下载.安装与部署 二.MongoDB的基础知识简介 三.MongoDB的创建.更新和删除 四.MongoDB的查询 五.MongoDB的索引 1.简介 它就像是一本书的目录,如果没 ...
随机推荐
- (20)python pycharm
使用GitHub 一·登录GitHub 1. 2. 3. 4. 二. 登录成功后再配置git 1 2.创建项目到github 3.下载github
- 设置每个datanode里面的map数目,提高运行效率
首先可以通过hdfs.site.xml下面的dfs.block.size来设置数据的块大小,这个参数会决定map的总数目(4194304=4m) 然后通过mapred.site.xml下面的mapre ...
- CSU 1337 搞笑版费马大定理【优化枚举】
费马大定理:当n>2时,不定方程an+bn=cn没有正整数解.比如a3+b3=c3没有正整数解.为了活跃气氛,我们不妨来个搞笑版:把方程改成a3+b3=c3,这样就有解了,比如a=4, b=9, ...
- Codeforces Round 252 (Div. 2)
layout: post title: Codeforces Round 252 (Div. 2) author: "luowentaoaa" catalog: true tags ...
- Tarjan+topsort(DP)【P3387】 [模板]缩点
Description 给定一个n个点m条边有向图,每个点有一个权值,求一条路径,使路径经过的点权值之和最大.你只需要求出这个权值和. 允许多次经过一条边或者一个点,但是,重复经过的点,权值只计算一次 ...
- 洛谷——P1017 进制转换
P1017 进制转换 题目描述 我们可以用这样的方式来表示一个十进制数: 将每个阿拉伯数字乘以一个以该数字所处位置的(值减1)为指数,以10为底数的幂之和的形式.例如:123可表示为 1\times ...
- Floyd-弗洛伊德算法
今天,研究一下谁都能看懂的弗洛伊德算法. 首先,弗洛伊德算法是一种利用动态规划的思想寻找给定的加权图中多源点之间最短路径的算法. 这个算法需要一个用到一个二维数组啊a[][],而a[i][j]表示的就 ...
- centos7常用系统维护命令
一.开机自启动服务列表 #开机自启动 apache服务 systemctl enable httpd.service #开机自启动iptables服务 systemctl enable iptable ...
- 【贪心】bzoj3709 [PA2014]Bohater
把怪分成两类看: 一.回血>损血 则若先杀损血少的再杀损血多的,则为当前这一步提供了更高的可能性.因为血量是单增的,所以尽量用较少的血量去干♂耗血较少的怪物. 二.回血<损血 则若先杀回血 ...
- 【Trie+DP】BZOJ1212-[HNOI2004]L语言
[题目大意]给出字典和文章,求出文章能够被理解的最长前缀. [思路] 1A……!先用文章建立一棵Trie树,然后对于文章进行DP.f[i]表示文章中长度为i的前缀能否被理解,如果f[i]能理解,顺着下 ...