MongoDB整理笔记のSharding分片
这是一种将海量的数据水平扩展的数据库集群系统,数据分表存储在sharding 的各个节点上,使用者通过简单的配置就可以很方便地构建一个分布式MongoDB 集群。
MongoDB 的数据分块称为 chunk。每个 chunk 都是 Collection 中一段连续的数据记录,通常最大尺寸是 200MB,超出则生成新的数据块。要构建一个 MongoDB Sharding Cluster,需要三种角色:
Shard Server
即存储实际数据的分片,每个Shard 可以是一个mongod 实例,也可以是一组mongod 实例构成的Replica Set。为了实现每个Shard 内部的auto-failover,MongoDB 官方建议每个Shard为一组Replica Set。
Config Server
为了将一个特定的collection 存储在多个shard 中,需要为该collection 指定一个shard key,例如{age: 1} ,shard key 可以决定该条记录属于哪个chunk。Config Servers 就是用来存储:所有shard 节点的配置信息、每个chunk 的shard key 范围、chunk 在各shard 的分布情况、该集群中所有DB 和collection 的sharding 配置信息。
Route Process
这是一个前端路由,客户端由此接入,然后询问Config Servers 需要到哪个Shard 上查询或保存记录,再连接相应的Shard 进行操作,最后将结果返回给客户端。客户端只需要将原本发给mongod 的查询或更新请求原封不动地发给Routing Process,而不必关心所操作的记录存储在哪个Shard 上。
下面我们在同一台物理机器上构建一个简单的 Sharding Cluster:
架构图如下:
Shard Server 1:20000
Shard Server 2:20001
Config Server :30000
Route Process:40000
(1)启动三服务
启动Shard Server
- mkdir -p /data/shard/s0 --创建数据目录
- mkdir -p /data/shard/s1
- mkdir -p /data/shard/log --创建日志目录
- /Apps/mongo/bin/mongod --shardsvr --port 20000 --dbpath /data/shard/s0 --fork --logpath
- /data/shard/log/s0.log --directoryperdb --启动Shard Server 实例1
- /Apps/mongo/bin/mongod --shardsvr --port 20001 --dbpath /data/shard/s1 --fork --logpath
- /data/shard/log/s1.log --directoryperdb --启动Shard Server 实例2
启动Config Server
- mkdir -p /data/shard/config --创建数据目录
- /Apps/mongo/bin/mongod --configsvr --port 30000 --dbpath /data/shard/config --fork --logpath
- /data/shard/log/config.log --directoryperdb --启动Config Server 实例
启动Route Process
- /Apps/mongo/bin/mongos --port 40000 --configdb localhost:30000 --fork --logpath
- /data/shard/log/route.log --chunkSize 1 --启动Route Server 实例
mongos 启动参数中,chunkSize 这一项是用来指定chunk 的大小的,单位是MB,默认大小为200MB,为了方便测试Sharding 效果,我们把chunkSize 指定为 1MB。
(2)配置Sharding
接下来,我们使用MongoDB Shell 登录到mongos,添加Shard 节点
- [root@localhost ~]# /Apps/mongo/bin/mongo admin --port 40000 --此操作需要连接admin 库
- MongoDB shell version: 1.8.1
- connecting to: 127.0.0.1:40000/admin
- > db.runCommand({ addshard:"localhost:20000" }) --添加 Shard Server
- { "shardAdded" : "shard0000", "ok" : 1 }
- > db.runCommand({ addshard:"localhost:20001" })
- { "shardAdded" : "shard0001", "ok" : 1 }
- > db.runCommand({ enablesharding:"test" }) --设置分片存储的数据库
- { "ok" : 1 }
- > db.runCommand({ shardcollection: "test.users", key: { _id:1 }}) --设置分片的集合名称,且必
- 须指定Shard Key,系统会自动创建索引
- { "collectionsharded" : "test.users", "ok" : 1 }
- >
(3)验证Sharding正常工作
我们已经对test.users 表进行了分片的设置,下面我们们插入一些数据看一下结果
- > use test
- switched to db test
- > for (var i = 1; i <= 500000; i++) db.users.insert({age:i, name:"wangwenlong", addr:"Beijing",
- country:"China"})
- > db.users.stats()
- {
- "sharded" : true, --说明此表已被shard
- "ns" : "test.users",
- "count" : 500000,
- "size" : 48000000,
- "avgObjSize" : 96,
- "storageSize" : 66655232,
- "nindexes" : 1,
- "nchunks" : 43,
- "shards" : {
- "shard0000" : { --在此分片实例上约有24.5M 数据
- "ns" : "test.users",
- "count" : 254889,
- "size" : 24469344,
- "avgObjSize" : 96,
- "storageSize" : 33327616,
- "numExtents" : 8,
- "nindexes" : 1,
- "lastExtentSize" : 12079360,
- "paddingFactor" : 1,
- "flags" : 1,
- "totalIndexSize" : 11468800,
- "indexSizes" : {
- "_id_" : 11468800
- },
- "ok" : 1
- },
- "shard0001" : { --在此分片实例上约有23.5M 数据
- "ns" : "test.users",
- "count" : 245111,
- "size" : 23530656,
- "avgObjSize" : 96,
- "storageSize" : 33327616,
- "numExtents" : 8,
- "nindexes" : 1,
- "lastExtentSize" : 12079360,
- "paddingFactor" : 1,
- "flags" : 1,
- "totalIndexSize" : 10649600,
- "indexSizes" : {
- "_id_" : 10649600
- },
- "ok" : 1
- }
- },
- "ok" : 1
- }
- >
我们看一下磁盘上的物理文件情况
- [root@localhost bin]# ll /data/shard/s0/test --此分片实例上有数据产生
- 总计 262420
- -rw------- 1 root root 16777216 06-03 15:21 test.0
- -rw------- 1 root root 33554432 06-03 15:21 test.1
- -rw------- 1 root root 67108864 06-03 15:22 test.2
- -rw------- 1 root root 134217728 06-03 15:24 test.3
- -rw------- 1 root root 16777216 06-03 15:21 test.ns
- [root@localhost bin]# ll /data/shard/s1/test --此分片实例上有数据产生
- 总计 262420
- -rw------- 1 root root 16777216 06-03 15:21 test.0
- -rw------- 1 root root 33554432 06-03 15:21 test.1
- -rw------- 1 root root 67108864 06-03 15:22 test.2
- -rw------- 1 root root 134217728 06-03 15:23 test.3
- -rw------- 1 root root 16777216 06-03 15:21 test.ns
- [root@localhost bin]#
看上述结果,表明test.users 集合已经被分片处理了,但是通过mongos 路由,我们并感觉不到是数据存放在哪个shard 的chunk 上的,这就是MongoDB 用户体验上的一个优势,即对用户是透明的。
MongoDB整理笔记のSharding分片的更多相关文章
- MongoDB整理笔记のReplica Sets + Sharding
MongoDB Auto-Sharding 解决了海量存储和动态扩容的问题,但离实际生产环境所需的高可靠.高可用还有些距离,所以有了"Replica Sets + Sharding" ...
- MongoDB整理笔记の管理Sharding
1.列出所有的Shard Server > db.runCommand({ listshards: 1 }) --列出所有的Shard Server { "shards" : ...
- MongoDB整理笔记の新增Shard Server
1.启动一个新Shard Server 进程 [root@localhost ~]# mkdir /data/shard/s2 [root@localhost ~]# /Apps/mongo/bin/ ...
- MongoDB 学习笔记之 分片和副本集混合运用
分片和副本集混合运用: 基本架构图: 搭建详细配置: 3个shard + 3个replicat set + 3个configserver + 3个Mongos shardrsname Primary ...
- MongoDB整理笔记のMapReduce
MongDB的MapReduce相当于MySQL中的“group by”,所以在MongoDB上使用Map/Reduce进行并行“统计”很容易. 使用MapReduce要实现两个函数Map函数和Red ...
- MongoDB整理笔记のCapped Collection
1.简单介绍 capped collections 是性能出色的有着固定大小的集合,以LRU(Least Recently Used 最近最少使用)规则和插入顺序进行age-out(老化移出)处理,自 ...
- MongoDB整理笔记の走进MongoDB世界
本人学习mongodb时间不长,但是鉴于工作的需要以及未来发展的趋势,本人想更深层的认识mongodb底层的原理以及更灵活的应用mongodb,边学边工作实践. mongodb属于nosql中算是最 ...
- MongoDB整理笔记のjava MongoDB分页优化
最近项目在做网站用户数据新访客统计,数据存储在MongoDB中,统计的数据其实也并不是很大,1000W上下,但是公司只配给我4G内存的电脑,让我程序跑起来气喘吁吁...很是疲惫不堪. 最常见的问题莫过 ...
- MongoDB整理笔记のID自增长
以下是官网原文地址: http://docs.mongodb.org/manual/tutorial/create-an-auto-incrementing-field/ 概要 MongoDB 的_i ...
随机推荐
- Tair 分布式K-V存储方案
tair 是淘宝的一个开源项目,它是一个分布式的key/value结构数据的解决方案. 作为一个分布式系统,Tair由一个中心控制节点(config server)和一系列的服务节点(data ser ...
- python开发函数进阶:生成器表达式&各种推导式
一,生成器表达式 #生成器表达式比列表解析更省内存,因为惰性运算 #!/usr/bin/env python #_*_coding:utf-8_*_ new_2 = (i*i for i in ran ...
- python学习(四) 字典:当索引不好用时
第四章 字典:当索引不好用时 4.1 字典的使用 字典的适用场景: 表示一个游戏棋盘的状态,每个键都是由坐标值组成的元组: 存储文件修改时间,用文件名作为键: 数字电话/地址簿 4.2 创建和使用字典 ...
- Git 常用命令速查手册
来源:https://www.jianshu.com/p/5ee9897b6b65 1.初始化仓库 git init 2.将文件添加到仓库 git add 文件名 # 将工作区的某个文件添加到暂存区 ...
- PHP判断当前协议是否为HTTPS
function is_https() { if ( !empty($_SERVER['HTTPS']) && strtolower($_SERVER['HTTPS']) !== 'o ...
- sql 2012先分离迁移mdf mlf 文件到别的机器后附加 数据库成只读的修复方法
SQL Server2008附加数据库之后显示为只读时解决方法 从本地分离的数据库文件放到远程服务器上,附加数据库出现数据库为(只读情况) 阅读了以下两篇文章: 第一篇:http://blog.c ...
- JavaScript第二节
1.动态属性 引用类型可以动态的添加属性,而基本类型不行. 2.复制变量值 3.检测类型 执行环境和作用域 没有块级作用域 引用类型 1.Object类型 2.Array类型 数组初始化: 检测数组: ...
- SqlServer——for xml path
for xml path 就是将 sql 查询出来的内容以XML的格式显示出来.参考网站MSDN:将 PATH 模式与 FOR XML 一起使用. 先创建测试用的表格: create table SZ ...
- Spring Cloud Zuul 1(API 网关服务)
API网关是一个更为智能的应用服务器,它的存在就像是整个微服架构系统的门面一样,所有的外部客户端访问都需要经过它来进行调度和过滤. 它实现的功能包括:请求路由.负载均衡.校验过滤等功能. Spring ...
- C程序栈内存堆内存的地址
#include <stdio.h> #include <malloc.h> int main() { char * p1, * p2; p1=(char *)malloc(2 ...