mysql表分区实战

一，什么是数据库分区
以mysql为例，mysql数据库中的数据是以文件的形势存在磁盘上的，默认放在/mysql/data下面（可以通过my.cnf中的datadir来查看），一张表主要对应着三个文件，一个是frm存放表结构的，一个是myd存放表数据的，一个是myi存表索引的。如果一张表的数据量太大的话，那么myd、myi就会变的很大，查找数据就会变的很慢，这个时候我们可以利用mysql的分区功能，在物理上将这一张表对应的三个文件，分割成许多个小块，这样呢，我们查找一条数据时，就不用全部查找了，只要知道这条数据在哪一块，然后在那一块找就行了。如果表的数据太大，可能一个磁盘放不下，这个时候，我们可以把数据分配到不同的磁盘里面去。

二、分区的二种方式
1，横向分区
什么是横向分区呢？就是横着来分区了，举例来说明一下，假如有100W条数据，分成十份，前10W条数据放到第一个分区，第二个10W条数据放到第二个分区，依此类推。也就是把表分成了十分，跟用merge来分表，有点像哦。取出一条数据的时候，这条数据包含了表结构中的所有字段，也就是说横向分区，并没有改变表的结构。

2，纵向分区
什么是纵向分区呢？就是竖着来分区了，举例来说明，在设计用户表的时候，开始的时候没有考虑好，而把个人的所有信息都放到了一张表里面去，这样这个表里面就会有比较大的字段，如个人简介，而这些简介呢，也许不会有好多人去看，所以等到有人要看的时候，在去查找，分表的时候，可以把这样的大字段，分开来。

感觉数据库的分区好像是切苹果，到底是横着切呢，还是竖着切，根据个人喜好了，mysql提供的分区属于第一种，横向分区，并且细分成很多种方式。下面将举例说明一下。

三、表分区
a.range分区
按照range分区的表是通过如下一种方式进行分区的，每个分区包含那些分区表达式的值位于一个给定的连续区间内的行

//创建range分区表

mysql> create table if not exists `user` (

    `id` int(11) not null auto_increment comment '用户id',

    `name` varchar(50) not null default '' comment '名称',

    `sex` int(1) not null default '' comment '0为男，1为女',

    primary key (`id`)

) engine=myisam default charset=utf8 auto_increment=1  

partition by range (id) (

    partition p0 values less than (3),

    partition p1 values less than (6),

    partition p2 values less than (9),

    partition p3 values less than (12),

    partition p4 values less than maxvalue

);

//查看表分区信息

mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p0~p4 5个表分区

//插入一些数据

mysql> insert into `user` (`name` ,`sex`) values

('tank', '') ,('zhang',1),('ying',1),('张',1),

('映',0),('test1',1),('tank2',1),('tank1',1),

('test2',1),('test3',1),('test4',1),('test5',1),

('tank3',1),('tank4',1),('tank5',1),('tank6',1),

('tank7',1),('tank8',1),('tank9',1),('tank10',1),

('tank11',1),('tank12',1),('tank13',1),('tank21',1),('tank42',1);

//到存放数据库表文件的地方看一下，如：D:\div\MySQL\MySQL Server 5.6\data\liying_order

//取出数据
mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 25 |
+-------+

//删除第四个分区
mysql> alter table user drop partition p4;

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p0~p3 4个表分区

mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 11 |
+-------+
注意：存放在分区里面的数据丢失了，p4分区里面有14条数据，其他分区只有11条数据。

//第四个区块已删除

可以对现有表进行分区,并且会按規则自动的将表中的数据分配相应的分区中，这样就比较好了，可以省去很多事情，看下面的操作

mysql> alter table user partition by range(id) (

    partition p1 values less than (1),

    partition p2 values less than (5),

    partition p3 values less than maxvalue

);

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p1~p3 3个表分区

mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
| 11 |
+----------+

//查看重新整理后的表分区

b.list分区

list分区中每个分区的定义和选择是基于某列的值从属于一个值列表集中的一个值，而range分区是从属于一个连续区间值的集合。

//这种方式失败

mysql> create table if not exists `list_part` (

    `id` int(11) not null auto_increment comment '用户id',

    `province_id` int(2) not null default 0 comment '省',

    `name` varchar(50) not null default '' comment '名称',

    `sex` int(1) not null default '' comment '0为男，1为女',

    primary key (`id`)

) engine=innodb  default charset=utf8 auto_increment=1  

partition by list (province_id) (

      partition p0 values in (1,2,3,4,5,6,7,8),

      partition p1 values in (9,10,11,12,16,21),

      partition p2 values in (13,14,15,19),

      partition p3 values in (17,18,20,22,23,24)

);

ERROR 1503 (HY000): A PRIMARY KEY must include all columns in the table's partitioning function 

//这种方式成功

mysql> create table if not exists `list_part` (

    `id` int(11) not null  comment '用户id',

    `province_id` int(2) not null default 0 comment '省',

    `name` varchar(50) not null default '' comment '名称',

    `sex` int(1) not null default '0' comment '0为男，1为女'

) engine=innodb  default charset=utf8  

partition by list (province_id) (

      partition p0 values in (1,2,3,4,5,6,7,8),

      partition p1 values in (9,10,11,12,16,21),

      partition p2 values in (13,14,15,19),

      partition p3 values in (17,18,20,22,23,24)

);

Query OK, 0 rows affected (0.33 sec)

上面的这个创建list分区时，如果有主銉的话，分区时主键必须在其中，不然就会报错。如果我不用主键，分区就创建成功了，一般情况下，一张表肯定会有一个主键，这算是一个分区的局限性吧。

如果对数据进行测试，请参考range分区的测试来操作

c.hash分区
hash分区主要用来确保数据在预先确定数目的分区中平均分布，你所要做的只是基于将要被哈希的列值指定一个列值或表达式，以及指定被分区的表将要被分割成的分区数量。

mysql> create table if not exists `hash_part` (

    `id` int(11) not null auto_increment comment '评论id',

    `comment` varchar(1000) not null default '' comment '评论',

    `ip` varchar(25) not null default '' comment '来源ip',

    primary key (`id`)

) engine=innodb  default charset=utf8 auto_increment=1

partition by hash(id)

partitions 3;

Query OK, 0 rows affected (0.06 sec)

测试请参考range分区的操作。

d.key分区
按照key进行分区类似于按照hash分区，除了hash分区使用的用户定义的表达式，而key分区的哈希函数是由mysql 服务器提供。

mysql> create table if not exists `key_part` (

    `news_id` int(11) not null  comment '新闻id',

    `content` varchar(1000) not null default '' comment '新闻内容',

    `u_id` varchar(25) not null default '' comment '来源ip',

    `create_time` date not null default '0000-00-00 00:00:00' comment '时间'

) engine=innodb  default charset=utf8  

partition by linear hash(year(create_time))

partitions 3;

Query OK, 0 rows affected (0.07 sec)

测试请参考range分区的操作。

四，分区管理

1，分区移除/删除分区

alter table tablename remove partitioning;移除全部分区，不会删除数据
alter table tablename drop partition partitionname 删除分区同时删除数据

mysql> alter table user drop partition p4;  删除p4分区，同时删除分区数据

2，新增分区

//range添加新分区

mysql> alter table user add partition(partition p4 values less than maxvalue);

query ok, 0 rows affected (0.06 sec)

records: 0  duplicates: 0  warnings: 0

新增分区，已分区的基础上才能进行新增分区
mysql> alter table dd add partition (
partition p04 values less than (to_days('2018-08-08'))
)

　　添加分区
　　alter table `lot_order_vjoptr-0` add partition(partition pmax values less than maxvalue);
　　删除所有分区
　　alter table lot_order remove partitioning;

//list添加新分区

mysql> alter table list_part add partition(partition p4 values in (25,26,28));

query ok, 0 rows affected (0.01 sec)

records: 0  duplicates: 0  warnings: 0  

//hash重新分区

mysql> alter table hash_part add partition partitions 4;

query ok, 0 rows affected (0.12 sec)

records: 0  duplicates: 0  warnings: 0  

//key重新分区

mysql> alter table key_part add partition partitions 4;

query ok, 1 row affected (0.06 sec)    //有数据也会被重新分配

records: 1  duplicates: 0  warnings: 0  

3，重新分区

//range重新分区

mysql> alter table user reorganize partition p0,p1,p2,p3,p4 into (partition p0 values less than maxvalue);

query ok, 11 rows affected (0.08 sec)

records: 11  duplicates: 0  warnings: 0  

//list重新分区

mysql> alter table list_part reorGANIZE PARTITION p0,p1,p2,p3,p4 INTO (PARTITION p0 VALUES in (1,2,3,4,5));

Query OK, 0 rows affected (0.28 sec)

Records: 0  Duplicates: 0  Warnings: 0  

//hash和key分区不能用REORGANIZE，官方网站说的很清楚

mysql> ALTER TABLE key_part REORGANIZE PARTITION COALESCE PARTITION 9;

ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'PARTITION 9' at line 1

五、分区优点
1，分区可以分在多个磁盘，存储更大一点
2，根据查找条件，也就是where后面的条件，查找只查找相应的分区不用全部查找了
3，进行大数据搜索时可以进行并行处理。
4，跨多个磁盘来分散数据查询，来获得更大的查询吞吐量

六、分区允许的列函数

day()

dayofmonth()

dayofweek()

dayofyear()

datediff()

extract()

hour()

microsecond()

minute()

mod()

month()

quarter()

second()

time_to_sec()

to_days()

weekday()

year()

yearweek()

mysql表分区实战的更多相关文章

MySQL表分区技术
MySQL表分区技术 MySQL有4种分区类型: 1.RANGE 分区 - 连续区间的分区 - 基于属于一个给定连续区间的列值,把多行分配给分区: 2.LIST 分区 - 离散区间的分区 - 类似于按 ...
Mysql 表分区和性能
以下内容节选自<Mysql技术内幕InnoDB存储引擎> mysql表分区: 分区功能并不是所有存储引擎都支持的,如CSV.MERGE等就不支持.mysql数据库支持的分区类型为水平分区( ...
Mysql表分区的选择与实践小结
在一些系统中有时某张表会出现百万或者千万的数据量,尽管其中使用了索引,查询速度也不一定会很快.这时候可能就需要通过分库,分表,分区来解决这些性能瓶颈. 一. 选择合适的解决方法 1. 分库分表. 分库 ...
Mysql 表分区
是否支持分区:mysql> show variables like '%partition%';+-----------------------+-------+| Variable_name ...
MySQL 表分区详解MyiSam引擎和InnoDb 区别（实测）
一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了1000万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...
mysql表分区（摘自 MySQL表的四种分区类型）
一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了. 如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...
MySQL表分区
MySQL的表分区一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以 ...
mysql表分区、查看分区
原文地址:http://blog.csdn.net/feihong247/article/details/7885199 一. mysql分区简介数据库分区数据库分区是一种物理数据库设 ...
MYSQL 表分区的 3 方法
背景知识: 表分区是把逻辑上同一范围的数据保存到同一个文件中,就和超市一样,把同类商品放在同一个区域,把不同的商品放在不同的地方.不同的是超市中是根据用途分类的,表分区是根据它的取值区间来分的. 分 ...

随机推荐

Django-ConttentType
一 content-type 在django中,有一个记录了项目中所有model元数据的表,就是ContentType,表中一条记录对应着一个存在的model,所以可以通过一个ContentType表 ...
CSS 样式中的两个方法
在很多时候,我们需要LI开头空一点距离.结尾不能再有下划线了.这个效果在以前是很难实现的.但是有了下面两个选择器,非常容易做出这种东西. .slideTxtBox .bd ul > :first ...
python基础 (编码进阶，文件操作和深浅copy)
1.编码的进阶字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码. 即先将其他编码的字符串解码(decode)成unicode,再从uni ...
dbus 消息和消息总线实例讲解-一
应用程序A和消息总线连接,这个连接获取了一个众所周知的公共名(记作连接A).应用程序A中有对象A1提供了接口I1,接口I1有方法M1. 应用程序B和消息总线连接,要求调用连接A上对象A1的接口I1的方 ...
[费用流][BZOJ1070]修车
修车题目描述同一时刻有位车主带着他们的爱车来到了汽车维修中心.维修中心共有M位技术人员,不同的技术人员对不同的车进行维修所用的时间是不同的.现在需要安排这M位技术人员所维修的车及顺序,使得顾客平均 ...
python页面解析_beautifulsoup试玩
最近玩爬虫,先把python解析器 beautifulsoup 练练这个 tainiu.html 是从百度网盘里拷贝一段html from bs4 importBeautifulSoup wit ...
VUE 动态给对象增加属性，并触发视图更新。
在开发过程中,我们时常会遇到这样一种情况:当vue的data里边声明或者已经赋值过的对象或者数组(数组里边的值是对象)时,向对象中添加新的属性,如果更新此属性的值,是不会更新视图的. 根据官方文档定义 ...
rapidjson常见使用示例
目录目录 1 1. 前言 2 2. Move语意 2 3. rapidjson::Document 2 4. 成员迭代器MemberIterator 3 5. 数组迭代器ValueIterator ...
Latex 模版生成会议论文不显示Keywords，而是显示 Index Terms- ，改成Keywords 方法
一. 不管显示何种内容,TEX 文件都是 \begin{IEEEKeywords} 关键词1.关键词2,..... \end{IEEEKeywords} 其中:模版文件 IEEETran.cls存在下 ...
[转]kaldi中的特征提取
转:http://blog.csdn.net/wbgxx333/article/details/25778483 本翻译原文http://kaldi.sourceforge.net/feat.html ...

mysql表分区实战

mysql表分区实战的更多相关文章

随机推荐

热门专题