MySQL分布式集群之MyCAT（三）rule的分析【转】

首先写在最前面，MyCAT1.4的alpha版本已经发布了，这里面修复了不少的bug，也完善了一细节，之前两篇博客已经做了一些修改

---------------------------------------------------------------------------------这才是本体~----------------------------------------------------------------------------------
          之前已经介绍过了schema的作用了，这一篇会把rule和server一起介绍~
          首先是rule，在这个文件里面会详细的制定多种分片的规则，这次只抽出一些使用率比较高的方法，先上配置文件的内容

          可以简单看一下，在截图的上半部分描述的是rule的定义，在下半部分，是rule对应的实际切分规则，这里总工介绍下面四种切分方式~murmur已坑~
-------------------------------------------------------------------------------------------Hash-int---------------------------------------------------------------------------------
          先看hash-int，在这一条切分规则的下面，有一个mapfile，这代表着，这个切分规则是根据partition-hash-int的内容来决定的，那么看一下这个文本文件

          很简单的内容，这代表着切分使用的基准列里面，值为10000的时候，放在第一个DN里面（dn1），值为10010的时候，放在第二个DN里面（dn2）
          可以看一下实际效果

          看一下MyCAT的Debug日志，这两条语句被分配到了dn1和dn2上面，数据库里面也插入了相对应的数据

          那么~问题来了（挖掘机滚粗~），如果插入的数据中，基准列的取值不是这个文件里面写明的值，会是什么效果？

          直截了当的报错了~

好了，hash-int的这种切分规则，大体上可以理解为枚举分区，会比较适合于取值固定的场合，比如说性别（0,1），省份（固定值，短时间不会收复日本省吧~），渠道商 or 各种平台的ID
而且，用逗号分隔可以把多个值放在一个分区里面，所以可以根据实际的数据量/流量/访问量来综合制定切分策略；
缺点：毕竟不是全能战士╮(╯_╰)╭

-------------------------------------------------------------------------------------------range-long---------------------------------------------------------------------------------
          第二种切分方式，range-long，仔细一看的话，和hash-int是比较像的，也是由特定的文件来决定切分策略，所以还是去看一下文件的内容

          从文件内容可以看出，这是一种范围切分的方式，制定基准列的取值范围，然后把这一范围的所有数据都放到一个DN上面，这种方式和hash-int基本一致，就不截图了（懒癌晚期，时间不够了！）
          这种切分策略，个人感觉在业务数据库里面的使用场景会少一些，因为这种切分方式需要预定好整体的数量，这就决定了那种无限增长的数据不能用这个，毕竟要改动这个切分策略会很麻烦
          真要用起来，感觉也就对自增主键用，然后按照一定的数量来均匀切分，比如那种一天固定X条数据的业务（温度采集？数据采集？之类的情况），然后提前建好多个DN（库）。
          当然，也存在一种潜在的问题，如果在短时间发生海量的顺序插入操作，而每一个DN（分库）设定的数量比较高(比如说一个DN设定的放1000W条数据),那么在这个时候,会出现某一个DN（分库）IO压力非常高，而其他几个DN（分库）完全没有IO操作，就会出现类似于DB中常见的热块/热盘的现象，而MySQL经常用自增主键，所以使得MySQL的表出现大量“顺序”插入的机会会多很多。
--------------------------------------------------------------------------------------------mod-long-----------------------------------------------------------------------------------
          mod-long，从mod来看这应该是一种取余数的方法，来看一下具体配置的信息

          count=4，这是代表着总共把数据切分成四份，一般是和具体的DN数量对应，从而达到把数据均匀的分布在四个DN上（当然，count<dn数量也没什么问题）
           看一下实际的效果

          看一下MyCAT的Debug日志，看看MyCAT是如何处理的

          采用这种取余数的方式时，这四条数据分别插入了四个DN（库），而且可以看到，顺序插入时，数据是被均匀的分散在多个DN（库）上面
          相比较于上面的range的方法，这种切分策略会更好的分散数据库写的压力，但是问题也很明显，一旦出现了范围查询，就需要MyCAT去合并结果，当数据量偏高的时候，这种跨库查询+合并结果消耗的时间有可能会增加很多，尤其是还出现了order by的时候。
          所以这种切分策略会比较适合于单点查询的情景，比如说.....我也不知道......真的不知道,也许在银行,查询个人账户信息的时候,一些和用户信息的表可以做好冗余,然后利用这种方式来提供更为高效的查询(毕竟银行的用户数量多,恩恩~)

--------------------------------------------------------------------------------partition-by-long----------------------------------------------------------------------------------
          partition-by-long,处于range-long和mod-long之间的一个略微折中的划分策略,具体切分形势依照如下描述:
          以1024为一个单位,每个DN存放partitionLength数量的数据,且,partitionCount x partitionLength=1024
          看起来有点难以理解,形象点描述的话,以partitionCount(4) x partitionLength(256)为例,sid%1024=0-255的放在DN1,256-511的放在DN2,以此类推
          试着以128为偏移值插入了八条数据，直接看MyCAT的日志

          可以看到，八条数据均匀的分布在这四个DN里面~
          值得一提的是，这种切分策略也支持非均匀分布~实在是测不动了，盗图两张~


          这两张图基本上也说明白了这种非均匀分布的划分策略，重点还是在2x256+1x512=1024上面~
          这种划分策略在range-long和mod-long之间取了一个折中点，同时，也还算是比较灵活，可以根据不同的情况进行非均匀划分，实际上能应用的场景会稍微多一点吧，或者说，不少场景都能用一用，相对减少了跨DN的情形，又把数据比较均匀的切分开来了，单点查询也不会太慢。

-----------------------------------------------------------------------------------写在最后-------------------------------------------------------------------------------------
          其实MyCAT支持的切分方式还有不少，比如说按照时间的切分策略，可以按月，按天切分等，在这里也没办法把所有的策略都放上来，见谅了o(￣ヘ￣o＃)
          实际上从个人的观点来看，时间的切分依照数据库本身的分区策略来分也没什么问题，半年度，季度的数据也还是会需要查询的....PS：   _(:з」∠)_真不是懒...
          可以说，MyCAT的分库分表的重点，基本全部在这个rule里面体现了，表要不要分，表的数据怎么切分，都是需要根据实际业务来决定，充分根据业务的特点去决定最合适的划分策略~
          下一章预告>>server，对MyCAT调优的主要部分

第一篇http://blog.itpub.net/29510932/viewspace-1664499/
第二篇http://blog.itpub.net/29510932/viewspace-1667814/

转自

MySQL分布式集群之MyCAT（三）rule的分析-wangwenan6-ITPUB博客
http://blog.itpub.net/29510932/viewspace-1678591/

MySQL分布式集群之MyCAT（三）rule的分析【转】的更多相关文章

MySQL分布式集群之MyCAT（一）简介【转】
隔了好久,才想起来更新博客,最近倒腾的数据库从Oracle换成了MySQL,研究了一段时间,感觉社区版的MySQL在各个方面都逊色于Oracle,Oracle真的好方便!好了,不废话,这次准备记录一些 ...
MySQL分布式集群之MyCAT（二）【转】
在第一部分,有简单的介绍MyCAT的搭建和配置文件的基本情况,这一篇详细介绍schema的一些具体参数,以及实际作用首先贴上自己测试用的schema文件,双引号之前的反斜杠不会消除,姑 ...
MySQL分布式集群之MyCAT(转)
原文地址:http://blog.itpub.net/29510932/viewspace-1664499/ 隔了好久,才想起来更新博客,最近倒腾的数据库从Oracle换成了MySQL,研究了一段时间 ...
如何搭建一个 MySQL 分布式集群
1.准备集群搭建环境使用6台虚拟机来搭建 MySQL分布式集群 ,相应的实验环境与对应的MySQL节点之间的对应关系如下图所示: 管理节点(MGM):这类节点的作用是管理MySQLCluster内的 ...
抄来的，占个位儿【百度架构师是怎样搭建MySQL分布式集群】
1.准备集群搭建环境使用6台虚拟机来搭建MySQL分布式集群,相应的实验环境与对应的MySQL节点之间的对应关系如下图所示: 管理节点(MGM):这类节点的作用是管理MySQLCluster ...
mysql分布式集群实现原理
做MySQL集群,例如:利用mysql cluster ,mysql proxy,mysql replication,drdb等等有人会问mysql集群,根分表有什么关系吗?虽然它不是实际意义上的分 ...
Mysql分布式集群
一.准备集群: 192.168.1.191 管理节点192.168.1.192 管理节点192.168.1.193 数据节点和API节点 192.168.1.194 数据节点和API节点安 ...
【Database】Mysql分布式集群学习笔记
一.sql 的基本操作 (2018年11月29日,笔记) (1)数据库相关操作创建数据库.查看数据库.删除数据库 #. 创建数据库 create database mytest default ch ...
MySQL集群之MyCat
MySQL集群之MyCat 一.MyCat简介及分析 1.1 MyCat是什么? 1.2 关键特性及应用场景 1.2.1 关键特性 1.2.2 应用场景 1.2.3 MyCat不适合的应用场景 1.3 ...

随机推荐

Codeforces Round #250 (Div. 1) D. The Child and Sequence（线段树）
D. The Child and Sequence time limit per test 4 seconds memory limit per test 256 megabytes input st ...
【刷题】BZOJ 1934 [Shoi2007]Vote 善意的投票
Description 幼儿园里有n个小朋友打算通过投票来决定睡不睡午觉.对他们来说,这个问题并不是很重要,于是他们决定发扬谦让精神.虽然每个人都有自己的主见,但是为了照顾一下自己朋友的想法,他们也可 ...
[AT2401] [arc072_e] Alice in linear land
题目链接 AtCoder:https://arc072.contest.atcoder.jp/tasks/arc072_c 洛谷:https://www.luogu.org/problemnew/sh ...
JUnit中按照顺序执行测试方式
很多情况下,写了一堆的test case,希望某一些test case必须在某个test case之后执行.比如,测试某一个Dao代码,希望添加的case在最前面,然后是修改或者查询,最后才是删除,以 ...
洛谷 P2473 [SCOI2008]奖励关解题报告
P2473 [SCOI2008]奖励关题目描述你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出$k$次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝 ...
安装Xtrabackup，设置定时备份msyql数据库
Xtrabackup是由percona提供的mysql数据库备份工具,据官方介绍,这也是世界上惟一一款开源的能够对innodb和xtradb数据库进行热备的工具. XtraDB 存储引擎是由Perco ...
VS2010 重命名文件：源文件名和目标文件名相同的解决方案
想要在“”解决方案资源管理器“”中修改一个已经写好的文件的文件名,如图: 在改了几次后就出现了如图的问题: 然而在“解决方案资源管理器”中并没有看到,于是我打开了工程在磁盘中的位置文件夹: 意外发现了 ...
Android源码批量下载及导入到Eclipse
1.去http://code.google.com/p/msysgit/downloads/list 下载Git,进行安装 2.生成批量下载脚本文件下载批量工具CreatAutoGetSh(工具 ...
解题：洛谷4178 Tree
题面重(新)学点分治中...... 普通的点分治一般这几步: 1.找重心 2.从重心开始DFS,得到信息 3.统计经过重心的路径 4.分别分治几棵子树,继续这个过程然后是常见的(制杖的我的)一些疑 ...
解题：USACO14OPEN Fair Photography
题面有点像JRY的那道序列题,大概是统计题的经典套路? 先说无修改的:将白奶牛记为$-1$,花奶牛记为$1$,然后做前缀和统计某个前缀和$sum$第一次出现的位置,之后再出现就统计答案.对于修改(将 ...

MySQL分布式集群之MyCAT（三）rule的分析【转】

MySQL分布式集群之MyCAT（三）rule的分析【转】的更多相关文章

随机推荐

热门专题