原文地址:https://www.cnblogs.com/ityouknow/p/7344005.html

相关概念

先来看一张图:

从图中可以看到有四个组件:mongos、config server、shard、replica set。

mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。

config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!

shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。

replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。

仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。

简单了解之后,我们可以这样总结一下,应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失同步在副本集中存储了一份,仲裁在数据存储到分片的时候决定存储到哪个节点。

环境准备

系统系统 centos6.5
三台服务器:192.168.0.75/84/86
安装包: mongodb-linux-x86_64-3.4.6.tgz

服务器规划

服务器75 服务器84 服务器86
mongos mongos mongos
config server config server config server
shard server1 主节点 shard server1 副节点 shard server1 仲裁
shard server2 仲裁 shard server2 主节点 shard server2 副节点
shard server3 副节点 shard server3 仲裁 shard server3 主节点

端口分配:

  1. mongos20000
  2. config21000
  3. shard127001
  4. shard227002
  5. shard327003

集群搭建

1、安装mongodb

  1. #解压
  2. tar -xzvf mongodb-linux-x86_64-3.4..tgz -C /usr/local/
  3. #改名
  4. mv mongodb-linux-x86_64-3.4. mongodb
  1. 分别在每台机器建立confmongosconfigshard1shard2shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。
  1. mkdir -p /usr/local/mongodb/conf
  2. mkdir -p /usr/local/mongodb/mongos/log
  3. mkdir -p /usr/local/mongodb/config/data
  4. mkdir -p /usr/local/mongodb/config/log
  5. mkdir -p /usr/local/mongodb/shard1/data
  6. mkdir -p /usr/local/mongodb/shard1/log
  7. mkdir -p /usr/local/mongodb/shard2/data
  8. mkdir -p /usr/local/mongodb/shard2/log
  9. mkdir -p /usr/local/mongodb/shard3/data
  10. mkdir -p /usr/local/mongodb/shard3/log

配置环境变量

  1. vim /etc/profile
  2. # 内容
  3. export MONGODB_HOME=/usr/local/mongodb
  4. export PATH=$MONGODB_HOME/bin:$PATH
  5. # 使立即生效
  6. source /etc/profile

2、config server配置服务器

mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。

添加配置文件

  1. vi /usr/local/mongodb/conf/config.conf
  2.  
  3. ## 配置文件内容
  4. pidfilepath = /usr/local/mongodb/config/log/configsrv.pid
  5. dbpath = /usr/local/mongodb/config/data
  6. logpath = /usr/local/mongodb/config/log/congigsrv.log
  7. logappend = true
  8.  
  9. bind_ip = 0.0.0.0
  10. port =
  11. fork = true
  12.  
  13. #declare this is a config db of a cluster;
  14. configsvr = true
  15.  
  16. #副本集名称
  17. replSet=configs
  18.  
  19. #设置最大连接数
  20. maxConns=

启动三台服务器的config server

  1. mongod -f /usr/local/mongodb/conf/config.conf

登录任意一台配置服务器,初始化配置副本集

  1. #连接
  2. mongo --port
  3. #config变量
  4. config = {
  5. ... _id : "configs",
  6. ... members : [
  7. ... {_id : , host : "192.168.0.75:21000" },
  8. ... {_id : , host : "192.168.0.84:21000" },
  9. ... {_id : , host : "192.168.0.86:21000" }
  10. ... ]
  11. ... }
  12.  
  13. #初始化副本集
  14. rs.initiate(config)

其中,"_id" : "configs"应与配置文件中配置的 replicaction.replSetName 一致,"members" 中的 "host" 为三个节点的 ip 和 port

3、配置分片副本集(三台机器)

设置第一个分片副本集

配置文件

  1. vi /usr/local/mongodb/conf/shard1.conf
  2.  
  3. #配置文件内容
  4. #——————————————–
  5. pidfilepath = /usr/local/mongodb/shard1/log/shard1.pid
  6. dbpath = /usr/local/mongodb/shard1/data
  7. logpath = /usr/local/mongodb/shard1/log/shard1.log
  8. logappend = true
  9.  
  10. bind_ip = 0.0.0.0
  11. port =
  12. fork = true
  13.  
  14. #打开web监控
  15. httpinterface=true
  16. rest=true
  17.  
  18. #副本集名称
  19. replSet=shard1
  20.  
  21. #declare this is a shard db of a cluster;
  22. shardsvr = true
  23.  
  24. #设置最大连接数
  25. maxConns=

启动三台服务器的shard1 server

  1. mongod -f /usr/local/mongodb/conf/shard1.conf

登陆任意一台服务器,初始化副本集

  1. mongo --port
  2. #使用admin数据库
  3. use admin
  4. #定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
  5. config = {
  6. ... _id : "shard1",
  7. ... members : [
  8. ... {_id : , host : "192.168.0.75:27001" },
  9. ... {_id : , host : "192.168.0.84:27001" },
  10. ... {_id : , host : "192.168.0.86:27001” , arbiterOnly: true }
  11. ... ]
  12. ... }
  13. #初始化副本集配置
  14. rs.initiate(config);

设置第二个分片副本集

配置文件

  1. vi /usr/local/mongodb/conf/shard2.conf
  2.  
  3. #配置文件内容
  4. #——————————————–
  5. pidfilepath = /usr/local/mongodb/shard2/log/shard2.pid
  6. dbpath = /usr/local/mongodb/shard2/data
  7. logpath = /usr/local/mongodb/shard2/log/shard2.log
  8. logappend = true
  9.  
  10. bind_ip = 0.0.0.0
  11. port =
  12. fork = true
  13.  
  14. #打开web监控
  15. httpinterface=true
  16. rest=true
  17.  
  18. #副本集名称
  19. replSet=shard2
  20.  
  21. #declare this is a shard db of a cluster;
  22. shardsvr = true
  23.  
  24. #设置最大连接数
  25. maxConns=

启动三台服务器的shard2 server

  1. mongod -f /usr/local/mongodb/conf/shard2.conf

登陆任意一台服务器,初始化副本集

  1. mongo --port
  2. #使用admin数据库
  3. use admin
  4. #定义副本集配置
  5. config = {
  6. ... _id : "shard2",
  7. ... members : [
  8. ... {_id : , host : "192.168.0.75:27002" , arbiterOnly: true },
  9. ... {_id : , host : "192.168.0.84:27002" },
  10. ... {_id : , host : "192.168.0.86:27002" }
  11. ... ]
  12. ... }
  13.  
  14. #初始化副本集配置
  15. rs.initiate(config);

设置第三个分片副本集

配置文件

  1. vi /usr/local/mongodb/conf/shard3.conf
  2.  
  3. #配置文件内容
  4. #——————————————–
  5. pidfilepath = /usr/local/mongodb/shard3/log/shard3.pid
  6. dbpath = /usr/local/mongodb/shard3/data
  7. logpath = /usr/local/mongodb/shard3/log/shard3.log
  8. logappend = true
  9.  
  10. bind_ip = 0.0.0.0
  11. port =
  12. fork = true
  13.  
  14. #打开web监控
  15. httpinterface=true
  16. rest=true
  17.  
  18. #副本集名称
  19. replSet=shard3
  20.  
  21. #declare this is a shard db of a cluster;
  22. shardsvr = true
  23.  
  24. #设置最大连接数
  25. maxConns=

启动三台服务器的shard3 server

  1. mongod -f /usr/local/mongodb/conf/shard3.conf

登陆任意一台服务器,初始化副本集

  1. mongo --port
  2. #使用admin数据库
  3. use admin
  4. #定义副本集配置
  5. config = {
  6. ... _id : "shard3",
  7. ... members : [
  8. ... {_id : , host : "192.168.0.75:27003" },
  9. ... {_id : , host : "192.168.0.84:27003" , arbiterOnly: true},
  10. ... {_id : , host : "192.168.0.86:27003" }
  11. ... ]
  12. ... }
  13.  
  14. #初始化副本集配置
  15. rs.initiate(config);

4、配置路由服务器 mongos

先启动配置服务器和分片服务器,后启动路由实例启动路由实例:(三台机器)

  1. vi /usr/local/mongodb/conf/mongos.conf
  2.  
  3. #内容
  4. pidfilepath = /usr/local/mongodb/mongos/log/mongos.pid
  5. logpath = /usr/local/mongodb/mongos/log/mongos.log
  6. logappend = true
  7.  
  8. bind_ip = 0.0.0.0
  9. port =
  10. fork = true
  11.  
  12. #监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字
  13. configdb = configs/192.168.0.75:,192.168.0.84:,192.168.0.86:
  14.  
  15. #设置最大连接数
  16. maxConns=

启动三台服务器的mongos server

  1. mongos -f /usr/local/mongodb/conf/mongos.conf

5、启用分片

目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。

登陆任意一台mongos

  1. mongo --port
  2. #使用admin数据库
  3. user admin
  4. #串联路由服务器与分配副本集
  5. sh.addShard("shard1/192.168.0.75:27001,192.168.0.84:27001,192.168.0.86:27001")
  6. sh.addShard("shard2/192.168.0.75:27002,192.168.0.84:27002,192.168.0.86:27002")
  7. sh.addShard("shard3/192.168.0.75:27003,192.168.0.84:27003,192.168.0.86:27003")
  8. #查看集群状态
  9. sh.status()

6、测试

目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。

mongdb并不会主动去分片,这需要你去手动设置。 所以你会看到如下的命令

  1. #指定testdb分片生效
  2. db.runCommand( { enablesharding :"testdb"}); #这个命令是说testdb这个库启用分片
  3. #指定数据库里需要分片的集合和片键
  4. db.runCommand( { shardcollection : "testdb.table1",key : {id: } } ) #这个命令是说对testdb下的table1 进行分片存储。片键是id 分片方式是1 
    我并不知道 1 这个分片方式是什么算法。因为我在这里用的是hashed(哈希)的分片方式: db.runCommand( { shardcollection : "testdb.table1",key : {id: "hashed"} } )
    这样就可以了,hashed算法会平均的将你的数据放到各个分片。
    值得注意的是 以上的设置 需要在 admin库中实现。而执行插入命令时 做好切换到testdb,即:use testdb

我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!

测试分片配置结果

  1. mongo 127.0.0.1:
  2. #使用testdb
  3. use testdb;
  4. #插入测试数据
  5. for (var i = ; i <= ; i++)
  6. db.table1.save({id:i,"test1":"testval1"});
  7. #查看分片情况如下,部分无关信息省掉了
  8. db.table1.stats();
  9.  
  10. {
  11. "sharded" : true,
  12. "ns" : "testdb.table1",
  13. "count" : ,
  14. "numExtents" : ,
  15. "size" : ,
  16. "storageSize" : ,
  17. "totalIndexSize" : ,
  18. "indexSizes" : {
  19. "_id_" : ,
  20. "id_1" :
  21. },
  22. "avgObjSize" : ,
  23. "nindexes" : ,
  24. "nchunks" : ,
  25. "shards" : {
  26. "shard1" : {
  27. "ns" : "testdb.table1",
  28. "count" : ,
  29. "size" : ,
  30. ...
  31. "ok" :
  32. },
  33. "shard2" : {
  34. "ns" : "testdb.table1",
  35. "count" : ,
  36. "size" : ,
  37. ...
  38. "ok" :
  39. },
  40. "shard3" : {
  41. "ns" : "testdb.table1",
  42. "count" :,
  43. "size" : ,
  44. ...
  45. "ok" :
  46. }
  47. },
  48. "ok" :
  49. }

可以看到数据分到3个分片,各自分片数量为: shard1 “count” : 42183,shard2 “count” : 38937,shard3 “count” : 18880。已经成功了!

后期运维

启动关闭

mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos.

  1. mongod -f /usr/local/mongodb/conf/config.conf
  2. mongod -f /usr/local/mongodb/conf/shard1.conf
  3. mongod -f /usr/local/mongodb/conf/shard2.conf
  4. mongod -f /usr/local/mongodb/conf/shard3.conf
  5. mongod -f /usr/local/mongodb/conf/mongos.conf

关闭时,直接killall杀掉所有进程

  1. killall mongod
  2. killall mongos

mongodb集群搭建(分片+副本)的更多相关文章

  1. MongoDB集群搭建-分片

    MongoDB集群搭建-分片 一.场景: 1,机器的磁盘不够用了.使用分片解决磁盘空间的问题. 2,单个mongod已经不能满足写数据的性能要求.通过分片让写压力分散到各个分片上面,使用分片服务器自身 ...

  2. mongodb3.6集群搭建:分片+副本集

    mongodb是最常用的noSql数据库,在数据库排名中已经上升到了前五.这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群. 在搭建集群之前,需要首先了解几个概念:路由,分片.副本集.配置 ...

  3. MongoDB集群搭建之副本集模仿主从模式的行为

    #模拟主节点异常中断 [root@ba3b27d855f6 bin]# kill -9 199 [root@ba3b27d855f6 bin]#   #连接到其中一台备份节点 [root@ba3b27 ...

  4. mongodb 搭建集群(分片+副本集)

    mongodb  搭建集群(分片+副本集) 一.搭建结构图: 二.搭建步骤:

  5. MongoDB集群搭建-副本集

    MongoDB集群搭建-副本集 概念性的知识,可以参考本人博客地址: 一.Master-Slave方案: 主从: 二.Replica Set方案: 副本集: 步骤:(只要按步骤操作,100%成功) 1 ...

  6. Mongodb 集群搭建以及常见错误

    Mongodb 集群搭建以及常见错误 1 关于Replica Sets +Sharding(主从复制加分片)搭建,不这详细去说,网上有很多,大部分的例子就三台服务器之间做主从复制,分2个shard,架 ...

  7. Mongodb集群搭建之 Replica Set

    Mongodb集群搭建之 Replica Set Replica Set 中文翻译叫做副本集,不过我并不喜欢把英文翻译成中文,总是感觉怪怪的.其实简单来说就是集群当中包含了多份数据,保证主节点挂掉了, ...

  8. mongodb集群搭建过程记录

    mongodb集群搭建花费比较长的时间,在此记录下过程,方便以后使用 一 软件环境 系统:ubuntu 18.04,mongodb 社区版4.2 https://docs.mongodb.com/ma ...

  9. mongodb集群搭建(分片+副本)开启安全认证

    关于安全认证得总结: 这个讲述的步骤也是先创建超管用户,关闭服务,然后生成密钥文件,开启安全认证,启动服务 相关概念 先来看一张图: 从图中可以看到有四个组件:mongos.config server ...

随机推荐

  1. .NET几大热点问题(.NET人员必读)

    下面收集了关于.NET几大热点问题及简要答案,防止我们回答问题不专业的尴尬.同一时候还将一些.NET资源的相关网址罗列一二. 一.什么是.Net?它主要包含什么?  .Net是为简化在第三代因特网的高 ...

  2. Fiddler手机抓包工具设置过滤域名

    需求:我想用fiddler抓包只抓test.sis.1course.cn; pre.schoolis.cn; sistest02.schoolis.cn;这几个域名下的请求 设置步骤:https:// ...

  3. oc54--auatorelease应用场景

    // // Person.h #import <Foundation/Foundation.h> @interface Person : NSObject @property (nonat ...

  4. Android系统Recovery工作原理之使用update.zip升级过程分析(九)---updater-script脚本语法简介以及执行流程【转】

    本文转载自:http://blog.csdn.net/mu0206mu/article/details/7465603       Android系统Recovery工作原理之使用update.zip ...

  5. CNN tensorflow text classification CNN文本分类的例子

    from:http://deeplearning.lipingyang.org/tensorflow-examples-text/ TensorFlow examples (text-based) T ...

  6. idea UML快捷键

  7. c语言中struct的初始化

    C++中的struct已经和class一样,可以用构造函数初始化. C语言中的struct怎么初始化呢? typedef struct _TEST_T {        int i;        c ...

  8. python 线程池和锁

    一.死锁现象与递归锁 锁:Lock线程安全,多线程操作时,内部会让所有线程排队处理.如:list/dict/Queue        线程不安全 + 人 => 排队处理. import thre ...

  9. spring data jpa 、hibernate、jpa之间的关系

    引用:http://blog.csdn.net/u014421556/article/details/52635000 hibernate作为JPA的实现.   JPA规范与ORM框架之间的关系   ...

  10. L4课程_Firebase_笔记分享_StudyJams_2017

    最近才发现Study Jams China的官方论坛也支持MarkDown,所以就直接把笔记发在了那儿. http://www.studyjamscn.com/thread-21855-1-1.htm ...