数据切分——Mysql分区表的建立及性能分析

Mysql的安装方法可以参考：

http://blog.csdn.net/jhq0113/article/details/43812895

Mysql分区表的介绍可以参考：

http://blog.csdn.net/jhq0113/article/details/44592865

1.检查你的Mysql是否支持分区

mysql> SHOW VARIABLES LIKE '%partition%';

若结果如下，表示你的Mysql支持表分区:

+-----------------------+-------+

       | Variable_name         | Value |

       +-----------------------+-------+

       | have_partition_engine | YES   |

       +-----------------------+-------+

       1 row in set (0.00 sec)

RANGE分区表创建方式：

DROP TABLE IF EXISTS `my_orders`;

CREATE TABLE `my_orders` (

  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '表主键',

  `pid` int(10) unsigned NOT NULL COMMENT '产品ID',

  `price` decimal(15,2) NOT NULL COMMENT '单价',

  `num` int(11) NOT NULL COMMENT '购买数量',

  `uid` int(10) unsigned NOT NULL COMMENT '客户ID',

  `atime` datetime NOT NULL COMMENT '下单时间',

  `utime` int(10) unsigned NOT NULL DEFAULT 0 COMMENT '修改时间',

  `isdel` tinyint(4) NOT NULL DEFAULT '0' COMMENT '软删除标识',

  PRIMARY KEY (`id`,`atime`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

/*********分区信息**************/

PARTITION BY RANGE (YEAR(atime))

(

   PARTITION p0 VALUES LESS THAN (2016),

   PARTITION p1 VALUES LESS THAN (2017),

   PARTITION p2 VALUES LESS THAN MAXVALUE

);

以上是一个简单的订单表，分区字段是atime,根据RANGE分区，这样当你向该表中插入数据的时候，Mysql会根据YEAR(atime)的值进行分区存储。

检查分区是否创建成功，执行查询语句：

EXPLAIN PARTITIONS SELECT * FROM `my_orders`

若成功，结果如下：

性能分析：

1）.创建同样表结构，但没有进行分区的表

DROP TABLE IF EXISTS `my_order`;

CREATE TABLE `my_order` (

  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '表主键',

  `pid` int(10) unsigned NOT NULL COMMENT '产品ID',

  `price` decimal(15,2) NOT NULL COMMENT '单价',

  `num` int(11) NOT NULL COMMENT '购买数量',

  `uid` int(10) unsigned NOT NULL COMMENT '客户ID',

  `atime` datetime NOT NULL COMMENT '下单时间',

  `utime` int(10) unsigned NOT NULL DEFAULT 0 COMMENT '修改时间',

  `isdel` tinyint(4) NOT NULL DEFAULT '0' COMMENT '软删除标识',

  PRIMARY KEY (`id`,`atime`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2）.向两张表中插入相同的数据

/**************************向分区表插入数据****************************/

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,CURRENT_TIMESTAMP());

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2016-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2017-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2018-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2015-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2016-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2017-05-01 00:00:00');

INSERT INTO my_orders(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2018-05-01 00:00:00');

/**************************向未分区表插入数据****************************/

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,CURRENT_TIMESTAMP());

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2016-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2017-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89757,'2018-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2015-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2016-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2017-05-01 00:00:00');

INSERT INTO my_order(`pid`,`price`,`num`,`uid`,`atime`) VALUES(1,12.23,1,89756,'2018-05-01 00:00:00');

3）.主从复制，大约20万条左右（主从复制的数据和真实环境有差距，但是能体现出表分区查询的性能优劣）

/**********************************主从复制大量数据******************************/

INSERT INTO `my_orders`(`pid`,`price`,`num`,`uid`,`atime`) SELECT `pid`,`price`,`num`,`uid`,`atime` FROM `my_orders`;

INSERT INTO `my_order`(`pid`,`price`,`num`,`uid`,`atime`) SELECT `pid`,`price`,`num`,`uid`,`atime` FROM `my_order`;

4）.查询测试

/***************************查询性能分析**************************************/

SELECT * FROM `my_orders` WHERE `uid`=89757 AND `atime`< CURRENT_TIMESTAMP();

/****用时0.084s****/

SELECT * FROM `my_order` WHERE `uid`=89757 AND `atime`< CURRENT_TIMESTAMP();

/****用时0.284s****/

通过以上查询可以明显看出进行表分区的查询性能更好，查询所花费的时间更短。

分析查询过程：

EXPLAIN PARTITIONS SELECT * FROM `my_orders` WHERE `uid`=89757 AND `atime`< CURRENT_TIMESTAMP();

EXPLAIN PARTITIONS SELECT * FROM `my_order` WHERE `uid`=89757 AND `atime`< CURRENT_TIMESTAMP();

通过以上结果可以看出，my_orders表查询直接经过p0分区，只扫描了49386行，而my_order表没有进行分区，扫描了196983行，这也是性能得到提升的关键所在。

当然，表的分区并不是分的越多越好，当表的分区太多时找分区又是一个性能的瓶颈了，建议在200个分区以内。

LIST分区表创建方式：

/*****************创建分区表*********************/

CREATE TABLE `products` (

`id`  bigint UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '表主键' ,

`name`  varchar(64) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '产品名称' ,

`metrial`  tinyint UNSIGNED NOT NULL COMMENT '材质' ,

`weight`  double UNSIGNED NOT NULL DEFAULT 0 COMMENT '重量' ,

`vol`  double UNSIGNED NOT NULL DEFAULT 0 COMMENT '容积' ,

`c_id`  tinyint UNSIGNED NOT NULL COMMENT '供货公司ID' ,

PRIMARY KEY (`id`,`c_id`)

)ENGINE=InnoDB DEFAULT CHARSET=utf8

/*********分区信息**************/

PARTITION BY LIST(c_id)

(

    PARTITION pA VALUES IN (1,3,11,13),

    PARTITION pB VALUES IN (2,4,12,14),

    PARTITION pC VALUES IN (5,7,15,17),

    PARTITION pD VALUES IN (6,8,16,18),

    PARTITION pE VALUES IN (9,10,19,20)

);

可以看出，LIST分区和RANGE分区很类似，这里就不做性能分析了，和RANGE很类似。

HASH分区表的创建方式：

/*****************分区表*****************/

CREATE TABLE `msgs` (

  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '表主键',

  `sender` int(10) unsigned NOT NULL COMMENT '发送者ID',

  `reciver` int(10) unsigned NOT NULL COMMENT '接收者ID',

  `msg_type` tinyint(3) unsigned NOT NULL COMMENT '消息类型',

  `msg` varchar(225) NOT NULL COMMENT '消息内容',

  `atime` int(10) unsigned NOT NULL COMMENT '发送时间',

  `sub_id` tinyint(3) unsigned NOT NULL COMMENT '部门ID',

  PRIMARY KEY (`id`,`sub_id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

/*********分区信息**************/

PARTITION BY HASH(sub_id)

PARTITIONS 10;

以上语句代表，msgs表按照sub_id进行HASH分区，一共分了十个区。

Key分区和HASH分区很类似，不再介绍，若想了解可以参考Mysql官方文档进行详细了解。

子分区的创建方式:

CREATE TABLE `msgss` (

  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '表主键',

  `sender` int(10) unsigned NOT NULL COMMENT '发送者ID',

  `reciver` int(10) unsigned NOT NULL COMMENT '接收者ID',

  `msg_type` tinyint(3) unsigned NOT NULL COMMENT '消息类型',

  `msg` varchar(225) NOT NULL COMMENT '消息内容',

  `atime` int(10) unsigned NOT NULL COMMENT '发送时间',

  `sub_id` tinyint(3) unsigned NOT NULL COMMENT '部门ID',

  PRIMARY KEY (`id`,`atime`,`sub_id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

/*********分区信息**************/

PARTITION BY RANGE (atime) SUBPARTITION BY HASH (sub_id)

(

		PARTITION t0 VALUES LESS THAN(1451577600)

		(

			SUBPARTITION s0,

			SUBPARTITION s1,

			SUBPARTITION s2,

			SUBPARTITION s3,

			SUBPARTITION s4,

			SUBPARTITION s5

		),

		PARTITION t1 VALUES LESS THAN(1483200000)

		(

			SUBPARTITION s6,

			SUBPARTITION s7,

			SUBPARTITION s8,

			SUBPARTITION s9,

			SUBPARTITION s10,

			SUBPARTITION s11

		),

		PARTITION t2 VALUES LESS THAN MAXVALUE

		(

			SUBPARTITION s12,

			SUBPARTITION s13,

			SUBPARTITION s14,

			SUBPARTITION s15,

			SUBPARTITION s16,

			SUBPARTITION s17

		)

);

检查子分区是否创建成功：

EXPLAIN PARTITIONS SELECT * FROM msgss;

结果如下图：

数据切分——Mysql分区表的建立及性能分析的更多相关文章

数据切分——Mysql分区表的管理与维护
关于Mysql分区表的介绍可以参考: http://blog.csdn.net/jhq0113/article/details/44592865 关于Mysql分区表的创建可以参考: http://b ...
MYSQL索引结构原理、性能分析与优化
[转]MYSQL索引结构原理.性能分析与优化第一部分:基础知识索引官方介绍索引是帮助MySQL高效获取数据的数据结构.笔者理解索引相当于一本书的目录,通过目录就知道要的资料在哪里, 不用一页一页 ...
Mysql视图的作用及其性能分析
定义:视图是从一个或几个基本表导出的表,它与基本表不同,是一个虚表. 作用: 1.简化操作,不用进行多表查询. 2.当不同种类的用用户共享同一个数据库时,非常灵活,(用户以不同的方式看待同一数据. ...
【转】由浅入深探究mysql索引结构原理、性能分析与优化
摘要: 第一部分:基础知识第二部分:MYISAM和INNODB索引结构 1.简单介绍B-tree B+ tree树 2.MyisAM索引结构 3.Annode索引结构 4.MyisAM索引与Inno ...
由浅入深探究mysql索引结构原理、性能分析与优化转
第一部分:基础知识第二部分:MYISAM和INNODB索引结构 1. 简单介绍B-tree B+ tree树 2. MyisAM索引结构 3. Annode索引结构 4. MyisAM索引与Inno ...
由浅入深探究mysql索引结构原理、性能分析与优化
摘要: 第一部分:基础知识第二部分:MYISAM和INNODB索引结构 1.简单介绍B-tree B+ tree树 2.MyisAM索引结构 3.Annode索引结构 4.MyisAM索引与Inno ...
[转载]由浅入深探究mysql索引结构原理、性能分析与优化
第一部分:基础知识第二部分:MYISAM和INNODB索引结构1. 简单介绍B-tree B+ tree树 2. MyisAM索引结构 3. Annode索引结构 4. MyisAM索引与InnoDB ...
Mysql Join语法解析与性能分析详解
一．Join语法概述 join 用于多表中字段之间的联系,语法如下: ... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona table1 ...
[转]Mysql Join语法解析与性能分析
转自:http://www.cnblogs.com/BeginMan/p/3754322.html 一．Join语法概述 join 用于多表中字段之间的联系,语法如下: ... FROM table1 ...

随机推荐

Android杂谈--ListView之BaseAdapter的使用
话说开发用了各种Adapter之后感觉用的最舒服的还是BaseAdapter,尽管使用起来比其他适配器有些麻烦,但是使用它却能实现很多自己喜欢的列表布局,比如ListView.GridView.Gal ...
MQTT协议详解一
首先给出MQTT协议的查看地址:http://public.dhe.ibm.com/software/dw/webservices/ws-mqtt/mqtt-v3r1.html 当然也有PDF版的,百 ...
ThinkPHP第十三天(CONF_PATH、APP_PATH，UEditor用法)
1.CONF_PATH 项目配置文件目录地址,APP_PATH 项目地址 2.ThinkPHP中更新数据的连接操作位save(),更新一个字段可以用setField(name,value)方法. 3. ...
PGA_AGGREGATE_TARGET 原理
PGA_AGGREGATE_TARGET参数的理解 PGA结构图: 在Oracle9i之前,PGA的计算和控制都是比较复杂的事情,从 ...
ES6学习笔记:Module的基本用法
export和import ES6实现了模块功能,试图解决JavaScript代码上的依赖和部署上的问题,取代现有的CommonJs的AMD规范,成为浏览器和服务器通用的模块解决方案. 模块功能有两个 ...
运用Python语言编写获取Linux基本系统信息(一)：获得Linux版本、内核、当前时间
申请博客有一段时间了,然而到现在还一篇没有写过..... 主要因为没有想到需要写些什么,最近在学习Python语言,照着书上看了看最基础的东西,发现根本看不进去,而且光看的话今天看了觉得都理解懂了,过 ...
osgText::Text简介
整理自<OpenSceneGraph三维渲染引擎编程指南> 在OSG中,为了显示高质量的文字,专门定义了一个新的名字空间来管理场景中的文字渲染,这个名字空间中的类主要用于加载字体和控制文字 ...
hdoj 1247 Hat’s Words(字典树)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1247 思路分析:题目要求找出在输入字符串中的满足要求(该字符串由输入的字符串中的两个字符串拼接而成)的 ...
shell脚本内与mysql交互
一: mysqlCMD="mysql -h${MYSQL_HOST} -P${MYSQL_PORT} -u${MYSQL_USER} -p${MYSQL_PASS}" crea ...
Android学习笔记（十五）——碎片的生命周期（附源代码）
碎片的生命周期点击下载源代码与活动类似.碎片具有自己的生命周期.理解了碎片的生命周期后.我们能够在碎片被销毁时正确地保存事实上例,在碎片被重建时将其还原到前一个状态. 1.使用上一篇的项目Frag ...

数据切分——Mysql分区表的建立及性能分析

数据切分——Mysql分区表的建立及性能分析的更多相关文章

随机推荐

热门专题