一,什么是数据库分区
以mysql为例,mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面 (可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存表 索引的。如果一张表的数据量太大的话,那么myd、myi就会变的很大,查找数据就会变的很慢,这个时候我们可以利用mysql的分区功能,在物理上将这 一张表对应的三个文件,分割成许多个小块,这样呢,我们查找一条数据时,就不用全部查找了,只要知道这条数据在哪一块,然后在那一块找就行了。如果表的数 据太大,可能一个磁盘放不下,这个时候,我们可以把数据分配到不同的磁盘里面去。

二、分区的二种方式
1,横向分区
什么是横向分区呢?就是横着来分区了,举例来说明一下,假如有100W条数据,分成十份,前10W条数据放到第一个分区,第二个10W条数据放到第二个分区,依此类推。也就是把表分成了十分,跟用merge来分表,有点像哦。取出一条数据的时候,这条数据包含了表结构中的所有字段,也就是说横向分区,并没有改变表的结构。

2,纵向分区
什么是纵向分区呢?就是竖着来分区了,举例来说明,在设计用户表的时候,开始的时候没有考虑好,而把个人的所有信息都放到了一张表里面去,这样这个表里面就会有比较大的字段,如个人简介,而这些简介呢,也许不会有好多人去看,所以等到有人要看的时候,在去查找,分表的时候,可以把这样的大字段,分开来。

感觉数据库的分区好像是切苹果,到底是横着切呢,还是竖着切,根据个人喜好了,mysql提供的分区属于第一种,横向分区,并且细分成很多种方式。下面将举例说明一下。

三、表分区
a.range分区
按照range分区的表是通过如下一种方式进行分区的,每个分区包含那些分区表达式的值位于一个给定的连续区间内的行

//创建range分区表

mysql> create table if not exists `user` (
`id` int(11) not null auto_increment comment '用户id',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '' comment '0为男,1为女',
primary key (`id`)
) engine=myisam default charset=utf8 auto_increment=1 partition by range (id) (
partition p0 values less than (3),
partition p1 values less than (6),
partition p2 values less than (9),
partition p3 values less than (12),
partition p4 values less than maxvalue
);

//查看表分区信息

mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';


可以看到user表有p0~p4 5个表分区

//插入一些数据

mysql> insert into `user` (`name` ,`sex`) values
('tank', '') ,('zhang',1),('ying',1),('张',1),
('映',0),('test1',1),('tank2',1),('tank1',1),
('test2',1),('test3',1),('test4',1),('test5',1),
('tank3',1),('tank4',1),('tank5',1),('tank6',1),
('tank7',1),('tank8',1),('tank9',1),('tank10',1),
('tank11',1),('tank12',1),('tank13',1),('tank21',1),('tank42',1);

//到存放数据库表文件的地方看一下,如:D:\div\MySQL\MySQL Server 5.6\data\liying_order

//取出数据
mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 25 |
+-------+

//删除第四个分区
mysql> alter table user drop partition p4;

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p0~p3 4个表分区

mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 11 |
+-------+
注意:存放在分区里面的数据丢失了,p4分区里面有14条数据,其他分区只有11条数据。

//第四个区块已删除

可以对现有表进行分区,并且会按規则自动的将表中的数据分配相应的分区中,这样就比较好了,可以省去很多事情,看下面的操作

mysql> alter table user partition by range(id) (
partition p1 values less than (1),
partition p2 values less than (5),
partition p3 values less than maxvalue
);

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p1~p3 3个表分区

mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
| 11 |
+----------+

//查看重新整理后的表分区

b.list分区

list分区中每个分区的定义和选择是基于某列的值从属于一个值列表集中的一个值,而range分区是从属于一个连续区间值的集合。

//这种方式失败
mysql> create table if not exists `list_part` (
`id` int(11) not null auto_increment comment '用户id',
`province_id` int(2) not null default 0 comment '省',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '' comment '0为男,1为女',
primary key (`id`)
) engine=innodb default charset=utf8 auto_increment=1 partition by list (province_id) (
partition p0 values in (1,2,3,4,5,6,7,8),
partition p1 values in (9,10,11,12,16,21),
partition p2 values in (13,14,15,19),
partition p3 values in (17,18,20,22,23,24)
);
ERROR 1503 (HY000): A PRIMARY KEY must include all columns in the table's partitioning function //这种方式成功
mysql> create table if not exists `list_part` (
`id` int(11) not null comment '用户id',
`province_id` int(2) not null default 0 comment '省',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '0' comment '0为男,1为女'
) engine=innodb default charset=utf8 partition by list (province_id) (
partition p0 values in (1,2,3,4,5,6,7,8),
partition p1 values in (9,10,11,12,16,21),
partition p2 values in (13,14,15,19),
partition p3 values in (17,18,20,22,23,24)
);
Query OK, 0 rows affected (0.33 sec)

上面的这个创建list分区时,如果有主銉的话,分区时主键必须在其中,不然就会报错。如果我不用主键,分区就创建成功了,一般情况下,一张表肯定会有一个主键,这算是一个分区的局限性吧。

如果对数据进行测试,请参考range分区的测试来操作

c.hash分区
hash分区主要用来确保数据在预先确定数目的分区中平均分布,你所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。

mysql> create table if not exists `hash_part` (
`id` int(11) not null auto_increment comment '评论id',
`comment` varchar(1000) not null default '' comment '评论',
`ip` varchar(25) not null default '' comment '来源ip',
primary key (`id`)
) engine=innodb default charset=utf8 auto_increment=1 partition by hash(id)
partitions 3;
Query OK, 0 rows affected (0.06 sec)

测试请参考range分区的操作。

d.key分区
按照key进行分区类似于按照hash分区,除了hash分区使用的用 户定义的表达式,而key分区的 哈希函数是由mysql 服务器提供。

mysql> create table if not exists `key_part` (
`news_id` int(11) not null comment '新闻id',
`content` varchar(1000) not null default '' comment '新闻内容',
`u_id` varchar(25) not null default '' comment '来源ip',
`create_time` date not null default '0000-00-00 00:00:00' comment '时间'
) engine=innodb default charset=utf8 partition by linear hash(year(create_time))
partitions 3;
Query OK, 0 rows affected (0.07 sec)

测试请参考range分区的操作。

四,分区管理

1,分区移除/删除分区

alter table tablename remove partitioning;移除全部分区,不会删除数据
  alter table tablename drop partition partitionname 删除分区同时删除数据

mysql> alter table user drop partition p4;  删除p4分区,同时删除分区数据

2,新增分区
//range添加新分区
mysql> alter table user add partition(partition p4 values less than maxvalue);
query ok, 0 rows affected (0.06 sec)
records: 0 duplicates: 0 warnings: 0

新增分区,已分区的基础上才能进行新增分区
  mysql> alter table dd add partition (
             partition p04 values less than (to_days('2018-08-08'))
        )

  添加分区
  alter table `lot_order_vjoptr-0` add partition(partition pmax values less than maxvalue);
  删除所有分区
  alter table lot_order remove partitioning;

//list添加新分区
mysql> alter table list_part add partition(partition p4 values in (25,26,28));
query ok, 0 rows affected (0.01 sec)
records: 0 duplicates: 0 warnings: 0 //hash重新分区
mysql> alter table hash_part add partition partitions 4;
query ok, 0 rows affected (0.12 sec)
records: 0 duplicates: 0 warnings: 0 //key重新分区
mysql> alter table key_part add partition partitions 4;
query ok, 1 row affected (0.06 sec) //有数据也会被重新分配
records: 1 duplicates: 0 warnings: 0 3,重新分区
//range重新分区
mysql> alter table user reorganize partition p0,p1,p2,p3,p4 into (partition p0 values less than maxvalue);
query ok, 11 rows affected (0.08 sec)
records: 11 duplicates: 0 warnings: 0 //list重新分区
mysql> alter table list_part reorGANIZE PARTITION p0,p1,p2,p3,p4 INTO (PARTITION p0 VALUES in (1,2,3,4,5));
Query OK, 0 rows affected (0.28 sec)
Records: 0 Duplicates: 0 Warnings: 0 //hash和key分区不能用REORGANIZE,官方网站说的很清楚
mysql> ALTER TABLE key_part REORGANIZE PARTITION COALESCE PARTITION 9;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'PARTITION 9' at line 1

五、分区优点
1,分区可以分在多个磁盘,存储更大一点
2,根据查找条件,也就是where后面的条件,查找只查找相应的分区不用全部查找了
3,进行大数据搜索时可以进行并行处理。
4,跨多个磁盘来分散数据查询,来获得更大的查询吞吐量

六、分区允许的列函数

day()
dayofmonth()
dayofweek()
dayofyear()
datediff()
extract()
hour()
microsecond()
minute()
mod()
month()
quarter()
second()
time_to_sec()
to_days()
weekday()
year()
yearweek()

mysql表分区实战的更多相关文章

  1. MySQL表分区技术

    MySQL表分区技术 MySQL有4种分区类型: 1.RANGE 分区 - 连续区间的分区 - 基于属于一个给定连续区间的列值,把多行分配给分区: 2.LIST 分区 - 离散区间的分区 - 类似于按 ...

  2. Mysql 表分区和性能

    以下内容节选自<Mysql技术内幕InnoDB存储引擎> mysql表分区: 分区功能并不是所有存储引擎都支持的,如CSV.MERGE等就不支持.mysql数据库支持的分区类型为水平分区( ...

  3. Mysql表分区的选择与实践小结

    在一些系统中有时某张表会出现百万或者千万的数据量,尽管其中使用了索引,查询速度也不一定会很快.这时候可能就需要通过分库,分表,分区来解决这些性能瓶颈. 一. 选择合适的解决方法 1. 分库分表. 分库 ...

  4. Mysql 表分区

    是否支持分区:mysql> show variables like '%partition%';+-----------------------+-------+| Variable_name ...

  5. MySQL 表分区详解MyiSam引擎和InnoDb 区别(实测)

    一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了1000万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...

  6. mysql表分区(摘自 MySQL表的四种分区类型)

    一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了. 如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...

  7. MySQL表分区

    MySQL的表分区 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以 ...

  8. mysql表分区、查看分区

    原文地址:http://blog.csdn.net/feihong247/article/details/7885199 一.       mysql分区简介 数据库分区 数据库分区是一种物理数据库设 ...

  9. MYSQL 表分区的 3 方法

    背景知识: 表分区是把逻辑上同一范围的数据保存到同一个文件中,就和超市一样,把同类商品放在同一个区域,把不同的商品放在不同的地方.不同的是超市中 是根据用途分类的,表分区是根据它的取值区间来分的. 分 ...

随机推荐

  1. 探索未知种族之osg类生物---呼吸分解之更新循环二

    _scene->updateSceneGraph(*_updateVisitor); 我们用了前面4节才刚刚算是完成对DatabasePager::DatabaseThread::run()函数 ...

  2. 20172325 2018-2019-2 《Java程序设计》第七周学习总结

    20172325 2018-2019-2 <Java程序设计>第七周学习总结 教材学习内容总结 二叉查找树 二叉查找树:是含附加属性的二叉树,即其左孩子小于父节点,而父节点又小于或等于右孩 ...

  3. HQL-Query接口

    org.hibernate.Query接口 1.Query接口定义有执行查询的方法(完成HQL语句的解析和执行过程并返回查询结果,就像SQL语句没了JDBC接口就成了一个普通的字符串变量) 2.Que ...

  4. Hiberbate注解

    JPA:出现后,所有的ORM框架都有@注解  ,在所有的ORM框架里面是通用的,因此一般是建议大家使用注解进行配置. 实体类一般都有唯一属性,普通属性,集合属性 如何体现ORM思想的? @Entity ...

  5. Beta冲刺 (7/7)

    Part.1 开篇 队名:彳艮彳亍团队 组长博客:戳我进入 作业博客:班级博客本次作业的链接 Part.2 成员汇报 组员1:(组长)柯奇豪 过去两天完成了哪些任务 部分代码的整合 编辑文章部分的完成 ...

  6. [算法专题] stack

    1. Convert Expression to Reverse Polish Notation http://www.lintcode.com/en/problem/convert-expressi ...

  7. ajax跨域问题小结

    跨域:跨域名的访问,是浏览器对ajax的一种限制,这样可以有效的房子跨站攻击 跨域的范畴: 域名不同  或 端口不同 或 二级域名不同 解决方案: 第一种:由于前端基础薄弱,且该方式老掉牙,不讲解: ...

  8. word文档的python解析

    主要两块,第一个是文件类型的转换,第二个是用docx包去对word文档中的table进行parse 1. 文件格式装换 因为很多各种各样的原因,至今还有一些word文档是doc的格式存的,对于这种,如 ...

  9. 详解Android中的四大组件之一:Activity详解

    activity的生命周期 activity的四种状态 running:正在运行,处于活动状态,用户可以点击屏幕,是将activity处于栈顶的状态. paused:暂停,处于失去焦点的时候,处于pa ...

  10. 阿里开源项目arthas在docker环境初始化

    需求 我前一篇是在window环境下做的测试,实际情况现在的生成环境程序都部署在了docker环境下,此环境对arthas可能会缺失很多必要组件 目前的基础环境是在docker容器中,只存在基本的to ...