mongodb模拟生产环境的分片集群

分片是指数据拆分将其分散在不同的机器上的过程,有时候也叫分区来表示这个概念.将数据分散到不同机器上不需要功能强大的计算机就可以储存更多的数据,处理更大的负载.

几乎所有的数据库都能手动分片应用程序需要维护与若干不同数据库服务器的连接,每个连接都是独立的应用程序给I案例不同服务器上不同数据的存储,还管理在合适的数据库上查询的工作,这种方法能够很好的工作,但是难以维护不如想集群添加节点或者从集群删除节点都很困难调整数据分布和负载模式也不轻松.

MongoDB支持自动分片,可以使用数据库架构对应用程序不可见,可以简化系统管理,对应用程序而言,就像连接的一台但是mongod服务器一样,MongoDB自动处理数据在分布上的分布.也更容易添加和删除分片.

MongoDB的分片机制允许你创建一个包含许多台机器的集群,将数据的子集合分散在集群中,每个分片维护着一个数据集合的子集.与单机服务器和副本集相比,使用集群架构可以使应用程序具有更大的数据处理能力.

首先要准备三台可以互相通信的的服务器作为配置服务器配置服务器是集群的大脑保存着几区和发呢鬼片的元数据即个分片包含哪些数据信息. 因此要首先建立配置服务器鉴于他极端的重要性必须启用日志功能并确保其数据保存在非易失性去驱动器上

因为mongos需要从配置服务器获取配置信息因此配置服务器应该先于任何mongos进程启动配置服务器是独立的mongod进程可以想见简单的mongod进程一样启动

命令

mongod --configsvr -f conf/config.conf

config.conf 文件内容:

dbpath = /home/apps/mongoDB/data/configdb
logpath = /home/apps/mongoDB/logs/configdb.log
fork = true

--configsvr 的作用是把默认端口修改为27019 dbpath 修改为 data/configdb 建议使用这个参数这样可以直白的告诉我们这个服务器的用处

配置服务器并不需要太多的空间和资源因此可以将其部署在运行着其他程序的机器上如应用服务器分片的mongod服务器或者mongos进程的服务器

可以在三台配置服务器的任意一台上启动mongos

mongodb-linux-i686-3.0.2/bin/mongos --configdb 192.168.1.111:27019,192.168.1.116:27019,192.168.1.117:27019 -f conf/mongos.conf

mongos.conf文件内容:

logpath = /home/apps/mongoDB/logs/mongos.log
fork = true

默认情况下 mongos运行在27017端口并不需要指定数据目录 mongos自身并不保存数据他会在启动时从配置服务器加载数据确保设置了logpath 以便将mongos日志保存到安全的地方可以启动任意数量的mongos进程

生产情况下一般mongos进程回合应用服务器运行在同一台服务器上

连接mongos

mongodb-linux-i686-3.0.2/bin/mongo 127.0.0.1:27017/test

将副本集转换为分片

只要告知mongos副本集的名称和副本集成员类表

sh.addShard("spock/server-1:27017,server-2:27017,server-3:27017")

可以在参数中指定副本集的所有成员但并非一定要这么做 mongos能够自动检测到没有包含在副本集成员表中的成员如运行sh.status() 可发现mongoDB已经找到了其他的副本集成员

副本集明朝spock被用作分片名称如之后希望移除这个分片或是向这个分片迁移数据可使用spock来表示这个分片这比使用特定的服务器名称要好因为副本集成员和状态是不断改变的,将副本集甜椒到分片后就可以将应用程序连接到副本集改成连接mongos

数据分片

除非明确指定规则否则MongoDB不会自动对数据进行分片,如有必要必须明确要告知数据和集合

假如我们希望对test数据库中的music集合按照name键进行分片首先要对music数据库启动分片

首先我们连接mongos 想test.music 添加10000条数据

然后再连接mongo 对数据库test启动分片

在对集合启动分片之前要在片键name上建立索引

现在就可以根据name对集合music 进行分片了

因为我们现在只有一个分片所以数据全部在spock这个副本集上 minkey-->>maxkey

增加集群容量

可通过增加分片来增加集群容量为添加一个新的空的分片可先创建一个副本集,确保副本集的名字和其他分片不同副本集初始化并拥有一个主节点后.可以在mongos上运行sh.addShard("test123/192.168.1.122:27017") 将副本集作为分片添加到集群中

如果有现存的很多副本集只要他们没有同名的数据库就可以将他们作为新的分片全部添加到集群中.由于内存有限我就能在做副本集了演示当的mongod假如集群中作为分片

因为本机存在一个test数据库所以报上面图片的错误所以我去本机删除 test数据库

继续添加分片

可以看见 108机器已经添加成集群的分片之一了

MongoDB 会均衡的将集合数据分散到集群的分片上这个过程不是瞬间完成的对于比较大的集合可能会话上几个小时才能完成

用mongoVUE 可以看到108分片的数据在增加

一秒后刷新

副本集 spock的数据在减少

进过了漫长等待 108分片上的数据最后

spock副本集上数据停留在

现在可以看出数据通过mongos 添加到集群中,然后均衡器会自动帮你做数据均衡 .

MongoDB如何追踪集群数据

理论上说 MongoDB能够追踪到每个文档的位置,但当集合中包含成千上万的文档的时候,就会变得难以操作,因此mongodb将文档分组为快(chunk) 每个快由给定片键特定范围内的文档组成,一个快只能存在一个分片上,所以mongodb用一个比较小的表就能够维护块跟分片的映射

快范围

新分片的几个起初只有一个块,所有文档都位于这个块中,范围是负无穷到正无穷 shell用$minKey $maxKey表示

随着数据的不断增长 mongodb会自动将其分成两个块,范围就变成了负无穷到 <some value> 和 <some value>到正无穷两个块中的<some value>是相同的范围较小的块包含比<some value>小的所有文档(但是不包含<some value>本身) 范围较大的块包含从<some value>一直到正无穷的所有文档(包含<some value>本身)

比如我们按照age字段进行分片所有的age的值为3~17的文档都包含在这一个块中:3<=age<17 该快拆分后,我们得到了两个较小的块 3<=age<12 和12<=age<17 这里的 12就叫做拆分点(split point0)

快拆分

mongos会记录在每个块中插入了多少数据一旦到达阀值,就会检查是否需要对块进行拆分,如果快需要拆分 mongos就会在配置服务器上更新这个块的元信息.快拆分只需要更改快的元数据即可,而无需要进行数据移动,数据拆分时配置服务器会创建新的块文档同时会修改旧的快范围拆分完成后 mongos会重置对原始快的追踪器同时为新的块创建新的追踪器

拆分点的选取

{"age":13,"username":"wad"}

{"age":13,"username":"斯蒂芬"}

//拆分点

{"age":14,"username":"wads"}

{"age":14,"username":"wadf"}

{"age":14,"username":"wadg"}

//拆分点

{"age":15,"username":"wadh"}

{"age":15"username":"wadm"}

mongos无需在每个可用的拆分点对块进行拆分但拆分时只能猜这些拆分点钟选择一个

上面例子来说如果这是初中的学生的信息那么在14岁的人将会很多这样如果是用age作为片键就会出现很多大块所以拥有不同的片键值是非常重要的

注意:集群的搭建必须保证配置服务器都必须可达否则当mongos不断重复发起拆分请求去无法进行拆分这个过程叫做拆分风暴避免拆分风暴的唯一方法就是尽可能的保证配置服务器的可用和健康.也可以重新启动mongos 重置写入计数器

频繁的让mongos上线和宕机那么mongos在再次宕机之前可能永远无法收到足矣打到拆分阀值点的写请求因此快回变得越来越大所以减少mongos进程的波动,尽可能保证mongos进程可用,而不是需要时开启,不需要是关闭.

均衡器

负责数据的迁移他会周期性的检查分片间是否存在不均衡存在就迁移数据打到均衡每个mongos有时候也会扮演均衡器的角色. 每隔几秒钟 mongos就会尝试变身为均衡器,如果没有其他均衡器可用,mongos就会对整个集群加锁,防止服务器对集群修改然后做一次均衡,均衡不会影响mongos的正常路由操作所以对客户端没有影响

不均衡是值:一个分片明显比其他分片拥有更多的快(集合越大越能承受不均衡状态) 如果检测到不均衡均衡器就会开始对块进行在分布,使每个分片拥有数量相当的快.如果没有集合打到均衡阀值.mongos就不再充当均衡器的角色了

mongodb模拟生产环境的分片集群的更多相关文章

MongoDB DBA 实践6-----MongoDB的分片集群部署
一.分片 MongoDB使用分片技术来支持大数据集和高吞吐量操作. 1.分片目的对于单台数据库服务器,庞大的数据量及高吞吐量的应用程序对它而言无疑是个巨大的挑战.频繁的CRUD操作能够耗尽服务器的C ...
生产环境MySQL数据库集群MHA上线实施方案
生产环境MySQL数据库集群MHA上线实施方案一．不停库操作 1.在所有节点安装MHAnode所需的perl模块(需要有安装epel源) yum install perl-DBD-MySQL -y ...
MongoDB DBA 实践7-----MongoDB的分片集群操
一.使用Ranged Sharding对集合进行分片从mongo连接到的shell中mongos,使用该sh.shardCollection()方法对集合进行分片. 注意: 必须已为集合所在的数据库 ...
正式生产环境下hadoop集群的DNS+NFS+ssh免password登陆配置
博客地址:http://www.loveweir.com/ 环境虚拟机centos6.5 主机名h1 IP 192.168.137.11 作为DNS FNS的server 主机名h2 IP 19 ...
kubernetes实战之部署一个接近生产环境的consul集群
系列目录前面我们介绍了如何在windows单机以及如何基于docker部署consul集群,看起来也不是很复杂,然而如果想要把consul部署到kubernetes集群中并充分利用kubernete ...
【七】MongoDB管理之分片集群介绍
分片是横跨多台主机存储数据记录的过程,它是MongoDB针对日益增长的数据需求而采用的解决方案.随着数据的快速增长,单台服务器已经无法满足读写高吞吐量的需求.分片通过水平扩展的方式解决了这个问题.通过 ...
Mongodb副本集＋分片集群环境部署记录
前面详细介绍了mongodb的副本集和分片的原理,这里就不赘述了.下面记录Mongodb副本集+分片集群环境部署过程: MongoDB Sharding Cluster,需要三种角色: Shard S ...
Mongodb副本集＋分片集群环境部署
前面详细介绍了mongodb的副本集和分片的原理,这里就不赘述了.下面记录Mongodb副本集+分片集群环境部署过程: MongoDB Sharding Cluster,需要三种角色: Shard S ...
分布式mongodb分片集群
本博客先简单介绍mongodb入门以及单实例以及mongodb的主从(主从官网是不提倡用的,原因后续介绍),副本集,分片. 第一:nosql介绍: 数据库分为关系型数据库与非关系型数据库,及具代表性的 ...

随机推荐

字符串函数 (strfun)
字符串函数 (strfun) 题目描述两个等长的由大写英文字母构成的字符串a和b,从a中选择连续子串x,从b中选出连续子串y.子串x与子串y的长度相等. 定义函数f(x,y)为满足条件xi=yi(1 ...
webstorm配置autoprefix
http://blog.csdn.net/pugongying520/article/details/52712639 配置图
mac 安装 maven 配置
前面的话: 记录在 Mac 下安装配置 maven 1. 下载 Maven, 并解压到某个目录.例如/Users/robbie/apache-maven-3.3.3 2. 打开 Terminal, ...
sql2008百万级数据排除重复信息
--高性能排除重复select userid from table where userid in ( select userid from ( select userid, row_number() ...
Extension Methods "点"函数方法扩展方法
原文发布时间为:2011-03-25 -- 来源于本人的百度文章 [由搬家工具导入] http://msdn.microsoft.com/en-us/library/bb383977.aspx 条件： ...
教你怎么使用Windows7系统自带的备份与还原的方法
原文发布时间为:2010-09-09 -- 来源于本人的百度文章 [由搬家工具导入] 继续单击“下一步”按钮，在其后界面中检查上述备份设置是否正确，如果不正确的话可以直接单击“取消”按钮，重新设置备份 ...
Feeling kind of the sorrow
It's almost a long time, in this place, but sometimes, feelings do vary. When I stepped in front of ...
UBUNTU命令行下进程查看-终止
ps ax 显示当前系统进程的列表 ps aux 显示当前系统进程详细列表以及进程用户如果输出过长,可能添加管道命令 less 如 ps ax|less 查看具体进程,使用 grep命令如 ...
[SaltStack] 基础介绍
今天有时间把以前研究过的saltstack梳理总结下 -:) salt是干什么的我就不多说了, 大家Google下资料很多的, 简单来说就是func+puppet: 配置文件管理远程命令调用 Cro ...
[Oracle] Redo&Undo梳理
Oracle Redo&undo Oracle中的redo和undo是关键技术的核心, 诸如实例恢复, 介质恢复, DataGuard, 闪回机制等都是给予redo和undo的, 所以很有必要 ...

mongodb模拟生产环境的分片集群

mongodb模拟生产环境的分片集群的更多相关文章

随机推荐

热门专题