MySQL Cluster 数据分布(分区、分组)
数据分布
1、MySQL Cluster自动分区数据表(也可能使用用户自定义分区),将数据分布到分区中;
2、一个数据表被划分到多个Data Node分区中,数据在分区中被”striped”;
3、主键的 hashing 决定哪个分区拥有数据(自动分布);
4、对主键的一部分进行hashing也是可能的(适合sharding和数据局部性);
分区和数据分布
1、如果有两个数据节点(DATA NODE 1和DATA NODE 2),每个数据表都被分到两个分区中。
2、subid是主键,对主键subid进行的hashing决定分区。当然对主键的一分部分(part of PK)进行hashing也是可能的。
- -奇数主键(绿色部分)
- -偶数主键(红色部分)
副本(Replicas)
1、为了提供冗余和快速故障转移,分区之间是同步复制的;
2、最常用的是用两个副本(两份数据):
- - 使用1个,2个,3个,4个副本也都是可能的
- - NoOfReplicas=2
3、分区间的同步复制是从主分区(PRIMARY)到辅助分区(SECONDARY)
- - 当有一个变更(下图实体圆心表示变更)发生在P0的时候,它将同步复制到S0
- - 这个变更在事务commit的时候被持久化
- - P0或S0将被更新,或什么都不做
数据分布 – 磁盘日志记录(disk logging)
1、数据在commit之后会在主内存中(main memory)
(1).但是改变(changes)是REDO日志记录的(REDO LOGGED),而REDO日志是每N毫秒(推荐1000ms)刷新到磁盘
由TimeBetweenGlobalCheckpoints参数控制
类似innodb-flush-log-at-trx_commit=2
(2).数据同时被checkpoint到磁盘
2、磁盘日志记录使得恢复一个完全失败的cluster成为可能
节点组(Node groups)
1、共享同样数据的节点属于同一个节点组
2、一个节点组包含节点数等于副本数。(下图使用NoOfReplicas=2)
3、两个副本-四个数据节点
(1).四个数据节点-四个分区-两个副本
(2).四个节点和两个副本–>两个节点组
- 节点组数目 = 总节点数 / 副本数
4、三个副本-三个数据节点
(1).三个数据节点-三个分区
- 更多的副本,“写”更慢
(2).三个节点和三个副本–>一个节点组(这种方式不常用)
- 两个副本是惯例
5、副本使用建议
(1).推荐使用两个副本- 性能和可用性是最好的折衷
(2).三个或四个副本写比较慢,使用这种方式部署相对更少
(3).“写”成本
- 1个副本(没冗余): cost X
- 2个副本: cost 2X
- 三个副本: cost 3X
验证数据分布
用法:
ndb_desc -c connect_string tbl_name -d db_name [-p]
- mysql> select * from ndbtest.tbl;
- +---+
- | a |
- +---+
- | 3 |
- | 6 |
- | 5 |
- | 1 |
- | 2 |
- | 4 |
- +---+
- 6 rows in set (0.01 sec)
- mysql>
参考:
MySQL Cluster 数据分布(分区、分组)的更多相关文章
- MySQL Cluster配置概述
一. MySQL Cluster概述 MySQL Cluster 是一种技术,该技术允许在无共享的系统中部署“内存中”数据库的 Cluster .通过无共享体系结构,系统能够使用廉价的硬件,而 ...
- MySQL的表分区详解
这篇文章主要介绍了MySQL的表分区,例如什么是表分区.为什么要对表进行分区.表分区的4种类型详解等,需要的朋友可以参考下 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysq ...
- MySQL的表分区(转载)
MySQL的表分区(转载) 一.什么是表分区 通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了. 如:某用户表的记录超过了600万条,那么就可以根据入库日期将表 ...
- mysql数据库表分区详解(数量过大的数据库表通过分区提高查询速度)
这篇文章主要介绍了MySQL的表分区,例如什么是表分区.为什么要对表进行分区.表分区的4种类型详解等,需要的朋友可以参考下 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysq ...
- mysql中的分区
第18章:分区 目录 18.1. MySQL中的分区概述 18.2. 分区类型 18.2.1. RANGE分区 18.2.2. LIST分区 18.2.3. HASH分区 18.2.4. KEY分区 ...
- MySQL Cluster 与 MongoDB 复制群集分片设计及原理
分布式数据库计算涉及到分布式事务.数据分布.数据收敛计算等等要求 分布式数据库能实现高安全.高性能.高可用等特征,当然也带来了高成本(固定成本及运营成本),我们通过MongoDB及MySQL Clus ...
- mysql集群 MySQL Cluster
<?php /* 郑重说明2015年6月11日16:28:14,目前为止MySQL Cluster 社区版不支持INNODB,商业版支持,但是授权价格20W左右,so看此文档之前,考虑下钱 My ...
- [置顶] MySQL Cluster初步学习资料整理--安装部署新特性性能测试等
1.1 mysql-cluster简介 简单的说,MySQLCluster实际上是在无共享存储设备的情况下实现的一种完全分布式数据库系统,其主要通过NDBCluster(简称NDB)存储引擎来实现. ...
- MySQL Cluster
MySQL Cluster MySQL集群一个非共享(shared nothing).分布式.分区系统,使用同步复制机制提供高可用和高性能. MySQL集群使用的是NDB引擎.NDB存储引擎会在节点间 ...
随机推荐
- winform窗体控件(全)
回顾跟补充下除了昨天那常用6个其他的winform窗体控件作用 1:Button:按钮 (1)AutoSize:如果是True的情况下,内容将会撑开:False的话会另起一行 (2)Enabled: ...
- 关于JSP---三大指令
JSP三大指令: page ------>最复杂的一个指令,属性很多,常用的像import,language,pageEncoding等等 include-------->静态包含, ...
- CWMP开源代码研究1——开篇之作
原创作品,转载请注明出处,严禁非法转载.如有错误,请留言! email:40879506@qq.com 声明:本系列涉及的开源程序代码学习和研究,严禁用于商业目的. 如有任何问题,欢迎和我交流.(企鹅 ...
- 【C#】【Thread】Barrier任务并行
Barrier 是一个对象,它可以在并行操作中的所有任务都达到相应的关卡之前,阻止各个任务继续执行. 如果并行操作是分阶段执行的,并且每一阶段要求各任务之间进行同步,则可以使用该对象. --MSDN ...
- httpUrlConnection中文乱码
public void getFeiInfo(String sessionId) throws IOException{ //发送的请求参数,发送的格式也是Json的 String requestSt ...
- EasyUI datagrildview导出excel报表
$.extend($.fn.datagrid.methods, { toExcel: function(jq, filename){ return jq.each(function(){ var ur ...
- select,poll,epoll比较
除常用文件i/o外,其他常用io模型:io多路复用(select和poll系统调用)信号驱动I/Olinux专有的epoll编程接口异步io(aio),linux在glibc中提供有基于线程的 pos ...
- Web前端面试题目及答案汇总
HTML/CSS部分 1.什么是盒子模型? 在网页中,一个元素占有空间的大小由几个部分构成,其中包括元素的内容(content),元素的内边距(padding),元素的边框(border),元素的外边 ...
- logging 模块误用导致的内存泄露
首先介绍下怎么发现的吧, 线上的项目日志是通过 logging 模块打到 syslog 里, 跑了一段时间后发现 syslog 的 UDP 连接超过了 8W, 没错是 8 W. 主要是 logging ...
- Android 摇一摇功能的注意事项
/**开始重力传感器的检测*/ public void start() { // 获得传感器管理器 sensorManager = (SensorManager) mContext.getSystem ...