mysql分区之range分区

随着互联网的发展，各方面的数据越来越多，从最近两年大数据越来越强的呼声中就可见一斑。

我们所做的项目虽算不上什么大项目，但是由于业务量的问题，数据也是相当的多。

数据一多，就很容易出现性能问题，而为了解决这个问题我们通常很容易想到集群、分片等。

但是在某些时候却不一定必须要用集群、分片，也可以适当的使用数据分区。

什么是分区？

（以下引用自：http://wangweiak47.blog.51cto.com/2337362/1602422/）

MySQL在未启用分区功能时，数据库的单个表内容是以单个文件的形式存放在文件系统上的。当启用分区功能后，MySQL将按用户指定的规则将单个表内容分割成几个文件存放在文件系统上。分区分为水平分区和垂直分区，水平分区是将表的数据按行分割成不同的数据文件，而垂直分区则是将表的数据按列分割成不同的数据文件。分片要遵循完备性原则、可重构性原则与不相交原则。完备性代表所有数据必须映射到某个片段上。可重构性表示所有分片数据必须可以重新构成全局数据。不相交性表示不同分片上的数据没有重复（除非你是特意做的冗余）。

大概是介于各方面的考虑，我们用的的表中就用到了range分区，数据库是其他人在管理，但是因为用到了这个表，因此我便抽时间进行了简单的学习。

据我的了解，要使用分区的话，必须要在创建表结构的时候就使用创建分区的语句，不能再后期更改。

例如我创建一个简单的emp表，有id、name、age三个字段，然后根据id分区。正确的建表语句基本如下：

CREATE TABLE emp(
id INT NOT NULL,
NAME VARCHAR(20),
age INT
)
PARTITION BY RANGE(ID)(
PARTITION p0 VALUES LESS THAN (6),
PARTITION p1 VALUES LESS THAN (11),
PARTITION pmax VALUES LESS THAN maxvalue
);

这里我是设置把整个表的数据分为三个区，id小于6的是一个区，区名称p0；id介于6到11的属于一个区，区名称p1；然后所有id大于11的一个区，区名称pmax。

整理一个语法，基本如下：

create table tablename（
 字段名 数据类型
...
）
partition by range(分区依赖的字段名)（
partition 分取名 values less than （分区条件的值），
...
）

这里需要注意的是例子中的最后一行partition pmax values less than maxvalue，这一句中只有代表分区名的pmax是可以自己任意取得，剩下的单词不能变，maxvalue代表上边分区条件的最大值。

这样的话能保证所有数据都能正常入库，否则，假如没有这一句的话，那么id大于等于11的数据便无法存入库中，将会报错。

表结构创建好以后，为了测试分区是否成功，我向表中插入了一些数据，语句如下：

INSERT INTO emp VALUES(1,'test1',22);
INSERT INTO emp VALUES(2,'test2',25);
INSERT INTO emp VALUES(3,'test3',27);
INSERT INTO emp VALUES(4,'test4',20);
INSERT INTO emp VALUES(5,'test5',22);
INSERT INTO emp VALUES(6,'test6',25);
INSERT INTO emp VALUES(7,'test7',27);
INSERT INTO emp VALUES(8,'test8',20);
INSERT INTO emp VALUES(9,'test9',22);
INSERT INTO emp VALUES(10,'test10',25);
INSERT INTO emp VALUES(11,'test11',27);
INSERT INTO emp VALUES(12,'test12',20);
INSERT INTO emp VALUES(13,'test13',22);
INSERT INTO emp VALUES(14,'test14',25);
INSERT INTO emp VALUES(15,'test15',27);
INSERT INTO emp VALUES(16,'test16',20);
INSERT INTO emp VALUES(17,'test17',30);
INSERT INTO emp VALUES(18,'test18',40);
INSERT INTO emp VALUES(19,'test19',20);

数据插入完成后，要验证是否对应id的数据保存在了对应的分区，可以使用查询分区的命令，如下：

SELECT partition_name,partition_expression,partition_description,table_rows
FROM information_schema.PARTITIONS
WHERE table_schema = SCHEMA() AND table_name='emp'

查询出的结果如图：

可以看出partition_name是分区名，partition_expression是分区依赖的字段，partition_description可以理解成该分区的条件，table_rows表示该分区中现在有的数据量。

从上边的数据中可以看出分区是成功的，但是如上分区虽然可以避免无法插入的问题，却又出现了一个新的问题。

那就是最后一个pmax区的数据有可能非常的大，这样一来，数据并不平均，不成比例，有可能使得查询最后一个区的数据时依旧出现性能问题。所以，解决办法大致有这样三个：

一是在能控制分区字段数据的情况下，比如说这里的id，假如能明确的知道什么时候会是多大的值，那么就可以一开始的时候不要这个pmax，而是定期的增加分区。例如这里存在了p0、p1，那么可以在id即将到达11的时候增加p2、p3甚至更多。增加分区的语句示例如下：

ALTER TABLE emp ADD PARTITION(PARTITION p2 VALUES LESS THAN (16))

语法整理就是：

alter table tablename add partition（partition 分区名 values lessthan （分区条件））

上边这个办法可以解决数据不成比例的这个问题，只不过也同时存在隐患，那就是假如什么时候忘了增加后边的分区，亦或者说是分区依赖的字段值超出了预料，那么就又可能导致数据无法入库的问题。这样一来又有两种方法可以解决：

一是可以使用mysql的事务机制和存储过程等，做一个mysql的定时任务，然后使数据库系统自己在特定的时间增加分区。这样一来基本上不会出现第一个方法所说的问题，只不过这种方法需要对mysql的事务和存储过程也有一定的理解，操作起来有一定的难度。

我知道这个方法，暂时还没有着手去实现，等后边进一步了解事务和存储过程后再给出相关的例子。

那么除开上边这种定时任务的方法外，还有一个就是拆分分区的办法，也就是还是使用之前有pmax分区的这个表结构，然后用拆分分区的语句来拆分pmax。示例如下：

ALTER TABLE emp REORGANIZE PARTITION pmax INTO(
PARTITION p2 VALUES LESS THAN (16),
PARTITION pmax VALUES LESS THAN maxvalue
)

然后我们再用查询分区情况的语句查询，便可以看到结果变成这样：

很显然，多出来了一个p2分区，拆分成功的同事不影响其他的功能。

那么这里分区拆分的语法整理如下：

alter table tablename reorganize partition 要拆分的分区名 into（
partition 拆分后的分区名1 values less than （条件），
partition 拆分后的分区名2 values lessthan （条件），
...
)

好了，到这里基本上算是完成了，但是我们知道数据库一般的操作都是增删改查，我们这里已经有了增改查，却自然也不能少了删。

按理说正常的生产环境的数据库应该是不能随意删除数据的，但是并不代表就不能删，反而有的时候还必须要删。

就比如我们项目中那个库，由于数据量太大，即便是分区了也依旧会在大量数据的情况下变慢。而与此同时，我们是按时间分区的，实际使用过程中只需要用到几天的数据，那么实际上很早以前的数据是可以删除不要的，或者说备份以后删除这个表的，这样就需要用到删除语句。

当然了，删除可以用delete，但是这样的话分区信息还在库中，实际上也是没必要要的，完全可以直接删除分区，因为删除分区的时候也同时会删除这个区内的所有数据。

示例之前我们先查一下之前插入的所有数据，如图：

这里示例删除p0分区代码如下：

ALTER TABLE emp  DROP PARTITION p0

然后先用查询分区的代码看一下，如图

可以看到p0区不见了，在select * 一下，如图：

可以看到id小于6的数据已经没有了，数据删除成功。

mysql分区之range分区的更多相关文章

Mysql --分区(3)range分区
3.分区类型 RANGE分区按照range分区的表是利用取值范围将数据分成分区,区间要连续并且不能互相重叠,使用values less than操作符进行分区定义 CREATE TABLE tnp ...
MySQL 横向表分区之RANGE分区小结
MySQL 横向表分区之RANGE分区小结 by:授客 QQ:1033553122 目录简介 1 RANGE分区 1 创建分区表 1 查看表分区 2 新增表分区 2 新增数据 3 分区表查询 3 删 ...
高性能可扩展mysql 笔记（三）Hash分区、RANGE分区、LIST分区
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 一.MySQL分区表操作 1.定义:数据库表分区是数据库基本设计规范之一,分区表在物理上表现为多个文件, ...
MySQL数据表range分区例子
某些行业数据量的增长速度极快,随着数据库中数据量的急速膨胀,数据库的插入和查询效率越来越低.此时,除了程序代码和查询语句外,还得在数据库的结构上做点更改:在一个主读辅写的数据库中,当数据表数据超过10 ...
MySQL RANGE分区
200 ? "200px" : this.width)!important;} --> 介绍 RANGE分区基于一个给定的连续区间范围,早期版本RANGE主要是基于整数的分区 ...
MySql采用range分区可提升查询效率
简介: RANGE分区基于一个给定的连续区间范围,早期版本RANGE主要是基于整数的分区.在5.7版本中DATE.DATETIME列也可以使用RANGE分区,同时在5.5以上的版本提供了基于非整形的R ...
[MySQL Reference Manual] 20 分区
20 分区 20 分区 20.1 MySQL的分区概述 20.2 分区类型 20.2.1 RANGE分区 20.2.2 LIST分区 20.2.3 COLUMNS分区 20.2.3.1 RANGE C ...
Mysql --分区表(5)Columns分区
COLUMNS分区 COLUMNS分区是RANGE和LIST分区的变种.COLUMNS分区支持多列作为分区键进行分区 RANGE COLUNMS分区和LIST COLUMNS都支持非INT型列作为分区 ...
Mysql --分区(4)List分区
LIST分区 LIST分区是建立离散的值列表告诉数据库特定的值属于哪个分区,LIST分区在很多方面类似于RANGE分区,区别在LIST分区是从属于一个枚举列表的值得集合,RANGE分区是从属于一个连续 ...

随机推荐

Java基础教程1：环境配置及第一个HelloWorld.java
本文主要介绍JDK环境配置.Sublime Text3配置及第一个HelloWorld.Java程序.运行环境为Win10系统,使用JDK1.8版本. 1. JDK下载及环境配置 1.1 JDK下载 ...
JavaScript 优雅简单的拼接字符串
前言最近维护一个老系统,里面有大量js拼接字符串的代码,这里总计一下js拼接字符串 JS 原生字符串拼接 JavaScript里面的字符串可以直接用 + 来拼接 return "<a ...
selenium模拟浏览器对搜狗微信文章进行爬取
在上一篇博客中使用redis所维护的代理池抓取微信文章,开始运行良好,之后运行时总是会报501错误,我用浏览器打开网页又能正常打开,调试了好多次都还是会出错,既然这种方法出错,那就用selenium模 ...
python3操作socketserver
socketserver是标准库中的一个高级模块,用于网络客户端与服务器的实现．模块中,已经实现了一些可供使用的类. 在python3中,导入socketserver模块使用的命令: import s ...
FreeMarker template error: The following has evaluated to null or missing: ==> blogger.md [in template "admin/about.ftl" at line 44, column 84]
FreeMarker template error:The following has evaluated to null or missing:==> blogger.md [in templ ...
洛谷 P3674 小清新人渣的本愿 [莫队 bitset]
传送门题意: 给你一个序列a,长度为n,有Q次操作,每次询问一个区间是否可以选出两个数它们的差为x,或者询问一个区间是否可以选出两个数它们的和为x,或者询问一个区间是否可以选出两个数它们的乘积为x ...
BZOJ 2194 [快速傅里叶变换卷积]
题意:请计算C[k]=sigma(a[i]*b[i-k]) 其中 k < = i < n ,并且有 n < = 10 ^ 5. a,b中的元素均为小于等于100的非负整数. 卷积 ( ...
ionic2+Angular web端实现微信分享以及如何跳转回分享出去的页面
微信分享,首先参考微信JS-SDK开发文档. step1:在启动文件index.html中引入微信js文件: <script src="http://res.wx.qq.com/ope ...
浅谈Java SE、Java EE、Java ME三者的区别
本文把JAVA SE.JAVA EE.JAVA ME拿来做下区别,同时也分享一下作者的一些成果.目前的Java平台根据软件开发人员.服务提供商和设备生产商可以针对特定的市场可以分为三个版本JAVA S ...
查看Zookeeper服务器状态信息的一些命令
1.Zookeeper服务器当前节点配置信息: echo conf|nc localhost 2181 2.cons:echo cons|nc localhost 2181 输出当前服务器所有客户端连 ...

mysql分区之range分区

mysql分区之range分区的更多相关文章

随机推荐

热门专题