Mongodb 分片操作实战

~坏人~ 2024-10-16 23:15:39 原文

由于生产环境中一般使用zoomkeeper做config节点的仲裁节点，zoomkeeper会在三个config节点中挑选出一台作为主config节点。且mongos节点一般是两个节点，必须做高可用，可以用keepalived实现（任何具有负载均衡能力的服务器节点都可以使用keepalived做高可用）

实际操作过程

1：准备四个节点mongodb1(mongos)、mongodb2(config)、mongodb3(shard1)、mongodb4(shard2)且保证可以通过主机名访问，且时间同步

2：配置mongodb2(config)节点，使得mongodb2为config节点，编辑配置文件/etc/mongod.conf

添加：configsvr = true

同时注释：#replSet=uplooking #replIndexPrefetch=_id_only #port=27017 这3个指令

（因为副本集与config节点不能同时工作）

4：启动config server，此时默认config server监听在27019端口

systemctl start mongod.service

5: 在mongodb1上操纵：mongodb1作为路由，使用mongos连接config server，先清空配置文件，再添加如下信息

logpath=/var/log/mongodb/mongod.log # 指明日志路径

pidfilepath=/var/run/mongodb/mongod.pid # 指明pid路径

logappend=true # 指明日志累加

fork=true # 指明运行于守护进程

port=27017 # 指明端口

configdb=192.168.43.11:27019 # 指明config server 的地址在哪里

6：指定配置文件，启动mongos，也可以使用systemctl启动，但是需要修改下启动脚本/etc/rc.d/init.d/mongod

mongos -f /etc/mongod.conf

7：将mongodb3和mongodb4配置文件中关于副本集的指令注释，然后直接启动

systemctl start mongod

8：mongodb3、mongodb4启动之后，在mongodb1上，通过mongo登入到mongos，将mongodb3、mongodb4作为shard添加到mongos的路由策略中

9：创建支持shard机制的数据库

sh.enableSharding("uplookingdb")

mongos> sh.status();

--- Sharding Status ---

sharding version: {

"_id" : 1,

"version" : 4,

"minCompatibleVersion" : 4,

"currentVersion" : 5,

"clusterId" : ObjectId("59f6caf5c93e5ff2a637a0cd")

}

shards:

{ "_id" : "shard0000", "host" : "192.168.43.13:27017" }

{ "_id" : "shard0001", "host" : "192.168.43.12:27017" }

databases: # 这里会显示支持shard的数据库，分片collection放置在各个shard，而没有分片的collection放置在主shard中

{ "_id" : "admin", "partitioned" : false, "primary" : "config" }

{ "_id" : "test", "partitioned" : false, "primary" : "shard0001" }

{ "_id" : "uplookingdb", "partitioned" : true, "primary" : "shard0001" }

10：在对应支持shard机制的数据库上创建支持shard的collection，{"age": 1}指明索引为age，升序排序，这样shard集群的功能就已经启动了，之后就可以调用mongodb1这个接口写数据了，但是写入mongodb1的数据不会保存在mongodb1，因为mongodb1是一个router节点，所有的数据都会保存至shard节点上。

sh.shardCollection("uplookingdb.students", {"age": 1})

11：此时mongodb1节点上会有uplookingdb库和 students表了

mongos> show dbs;

admin (empty)

config 0.016GB

uplookingdb 0.078GB

mongos> use uplookingdb

switched to db uplookingdb

mongos> show collections;

students

system.indexes

12：给students表创建添加数据（可以使用js的循环语法插入数据）

mongos> for (i=1; i<1000000; i++){

db.students.insert({"name": "yhy"+i, "age": i%100, "student_id": i, "skill": "ok"+i, "salary": "$"+i%10000})

}

13：复制mongodb1窗口，先查看一下students表有多少行数据了，在看看此时的shard分片的状态

mongos>db.students.find().count(); # 查看students表中有多少行数据了

237751

mongos> sh.status() # 再查看一下shard的状态信息

--- Sharding Status ---

sharding version: {

"_id" : 1,

"version" : 4,

"minCompatibleVersion" : 4,

"currentVersion" : 5,

"clusterId" : ObjectId("59f6caf5c93e5ff2a637a0cd")

}

shards: # 只是shard节点列表

{ "_id" : "shard0000", "host" : "192.168.43.13:27017" }

{ "_id" : "shard0001", "host" : "192.168.43.12:27017" }

databases: # 这是支持shard机制的库

{ "_id" : "admin", "partitioned" : false, "primary" : "config" }

{ "_id" : "test", "partitioned" : false, "primary" : "shard0001" }

{ "_id" : "uplookingdb", "partitioned" : true, "primary" : "shard0001" }

uplookingdb.students 这是支持shard机制的表

shard key: { "age" : 1 } # 用表上的哪个索引作为shard的键

chunks: # 这里是显示chunk的发布情况

shard0000 2 # 发布两个chunk

shard0001 3 # 发布三个chunk

{ "age" : { "$minKey" : 1 } } -->> { "age" : 1 } on : shard0000 Timestamp(2, 0)

{ "age" : 1 } -->> { "age" : 47 } on : shard0000 Timestamp(3, 0)

{ "age" : 47 } -->> { "age" : 72 } on : shard0001 Timestamp(3, 2)

{ "age" : 72 } -->> { "age" : 99 } on : shard0001 Timestamp(3, 3)

{ "age" : 99 } -->> { "age" : { "$maxKey" : 1 } } on : shard0001 Timestamp(2, 3)

14：过一段时间之后，等数据在mongodb1节点插入完毕，在mongodb3，mongodb4上就会发现一部分年龄的人在mongodb3，而另外一部分在mongodb4上

db.students.find();

15：再添加一个新的节点进来，在mongodb1上设置它为shard节点，此时你会发现chunk就会自动迁移，无需我们手动管理，但是chunk在shard节点中自动迁移会消耗大量的带宽以及带来I/O压力，因此，一般是现在mongodb1节点将

16：如果创建一个库，且添加一张表，且并没有将库和表添加到shard机制中来，那么对于每一个shard节点实现副本集赋值功能，以及多个config节点，同学们一定要完成（我出去调研的时候发现，MongoDB的应用场景再某种程度上不比MySQL弱）

Mongodb 分片操作实战的更多相关文章

Mongodb 分片操作介绍
为什么需要分片操作?由于数据量太大,使得CPU,内存,磁盘I/O等压力过大.当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量.这时,我们就可以通过在多台 ...
MongoDB 分片操作
添加分片 use admin //添加分片节点,每个分片都是一个副本集[allowLocal:true仅仅开发时才将分片配置到本地,生产时不能这样] db.runCommand({addshard:& ...
[置顶] MongoDB 分布式操作——分片操作
MongoDB 分布式操作——分片操作描述: 像其它分布式数据库一样,MongoDB同样支持分布式操作,且MongoDB将分布式已经集成到数据库中,其分布式体系如下图所示: 所谓的片,其实就是一个单 ...
MongoDB 分片集群实战
背景在如今的互联网环境下,海量数据已随处可见并且还在不断增长,对于如何存储处理海量数据,比较常见的方法有两种: 垂直扩展:通过增加单台服务器的配置,例如使用更强悍的 CPU.更大的内存.更大容量的磁 ...
python操作三大主流数据库(10)python操作mongodb数据库④mongodb新闻项目实战
python操作mongodb数据库④mongodb新闻项目实战参考文档:http://flask-mongoengine.readthedocs.io/en/latest/ 目录: [root@n ...
(转)MongoDB分片实战集群搭建
环境准备 Linux环境主机 OS 备注 192.168.32.13 CentOS6.3 64位普通PC 192.168.71.43 CentOS6.2 64位服务器,NUMA CPU架构 Mo ...
(转)mongodb分片
本文转载自:http://www.cnblogs.com/huangxincheng/archive/2012/03/07/2383284.html 在mongodb里面存在另一种集群,就是分片技术, ...
MongoDB分片技术[转]
8天学通MongoDB——第六天分片技术在mongodb里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内存就吃不消了,针 ...
mongodb分片
在系统早期,数据量还小的时候不会引起太大的问题,但是随着数据量持续增多,后续迟早会出现一台机器硬件瓶颈问题的.而mongodb主打的就是海量数据架构,他不能解决海量数据怎么行!不行!“分片”就用这个来 ...

随机推荐

2017-2018-1 20155209 实现mypwd
2017-2018-1 20155209 实现mypwd 1 学习pwd命令 2 研究pwd实现需要的系统调用(man -k; grep),写出伪代码 3 实现mypwd 4 测试mypwd 首先使用 ...
02-web框架
1 while True: print('server is waiting...') conn, addr = server.accept() data = conn.recv(1024) prin ...
CF 1110 D. Jongmah
D. Jongmah 链接题意: 一些数字,有两种方式组成一个三元组,[x,x,x],[x,x+1,x+2],每个数字只能用一次,求最多组成多少三元组. 分析: 因为每三个[x,x+1,x+2]是可 ...
2_C语言中的数据类型（五）char
1.1 char类型 1.1.1 char常量,变量 char c:定义一个char变量 ‘a’,char的常量 Char的本质就是一个整数,一个只有1个字节大小的整数 ...
#2007. 「SCOI2015」国旗计划
好久没更过博了.. 首先断环为链,因为线段互相不包含,所以对每个线段\(i\)可以找一个满足\(r_j\geq l_i\)的\(l_j\)最小的线段,dp的时候\(i\)就会从\(j\)转移过来然后 ...
[Luogu4921]情侣？给我烧了！[错位排列]
题意题意很清楚 \滑稽分析对于每一个询问 \(k\) ,记 \(g(x)\) 表示 \(x\) 对情侣都错开的方案总数,那么答案可以写成如下形式: \[ {ans}_k= \binom{n}{k ...
adb server version (31) doesn't match this client (39) 解决方案
adb server version (31) doesn't match this client (39) 问题的解决方案, 在cmd中输入adb nodaemon server -a后解决了, 记 ...
Socket之简单的Unity3D聊天室__TCP协议
服务器端程序 using System; using System.Collections.Generic; using System.Linq; using System.Net; using Sy ...
曾经的华为C面试题，一点就通
学习编程可以锻炼你的思维,帮助你更好地思考,创建一种我认为在各领域都非常有用的思维方式. 比尔盖茨曾经的华为C面试题,一点就通 [问题区] 有两个变量x和y, x=10; y = 2 ...
python多线程与GIL（转）
作者:卢钧轶(cenalulu) 本文原文地址:http://cenalulu.github.io/python/gil-in-python/ GIL是什么 GIL(Global Interprete ...