一,什么是数据库分区
以mysql为例,mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面 (可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存表 索引的。如果一张表的数据量太大的话,那么myd、myi就会变的很大,查找数据就会变的很慢,这个时候我们可以利用mysql的分区功能,在物理上将这 一张表对应的三个文件,分割成许多个小块,这样呢,我们查找一条数据时,就不用全部查找了,只要知道这条数据在哪一块,然后在那一块找就行了。如果表的数 据太大,可能一个磁盘放不下,这个时候,我们可以把数据分配到不同的磁盘里面去。

二、分区的二种方式
1,横向分区
什么是横向分区呢?就是横着来分区了,举例来说明一下,假如有100W条数据,分成十份,前10W条数据放到第一个分区,第二个10W条数据放到第二个分区,依此类推。也就是把表分成了十分,跟用merge来分表,有点像哦。取出一条数据的时候,这条数据包含了表结构中的所有字段,也就是说横向分区,并没有改变表的结构。

2,纵向分区
什么是纵向分区呢?就是竖着来分区了,举例来说明,在设计用户表的时候,开始的时候没有考虑好,而把个人的所有信息都放到了一张表里面去,这样这个表里面就会有比较大的字段,如个人简介,而这些简介呢,也许不会有好多人去看,所以等到有人要看的时候,在去查找,分表的时候,可以把这样的大字段,分开来。

感觉数据库的分区好像是切苹果,到底是横着切呢,还是竖着切,根据个人喜好了,mysql提供的分区属于第一种,横向分区,并且细分成很多种方式。下面将举例说明一下。

三、表分区
a.range分区
按照range分区的表是通过如下一种方式进行分区的,每个分区包含那些分区表达式的值位于一个给定的连续区间内的行

//创建range分区表

mysql> create table if not exists `user` (
`id` int(11) not null auto_increment comment '用户id',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '' comment '0为男,1为女',
primary key (`id`)
) engine=myisam default charset=utf8 auto_increment=1 partition by range (id) (
partition p0 values less than (3),
partition p1 values less than (6),
partition p2 values less than (9),
partition p3 values less than (12),
partition p4 values less than maxvalue
);

//查看表分区信息

mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';


可以看到user表有p0~p4 5个表分区

//插入一些数据

mysql> insert into `user` (`name` ,`sex`) values
('tank', '') ,('zhang',1),('ying',1),('张',1),
('映',0),('test1',1),('tank2',1),('tank1',1),
('test2',1),('test3',1),('test4',1),('test5',1),
('tank3',1),('tank4',1),('tank5',1),('tank6',1),
('tank7',1),('tank8',1),('tank9',1),('tank10',1),
('tank11',1),('tank12',1),('tank13',1),('tank21',1),('tank42',1);

//到存放数据库表文件的地方看一下,如:D:\div\MySQL\MySQL Server 5.6\data\liying_order

//取出数据
mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 25 |
+-------+

//删除第四个分区
mysql> alter table user drop partition p4;

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p0~p3 4个表分区

mysql> select count(id) as count from user;
+-------+
| count |
+-------+
| 11 |
+-------+
注意:存放在分区里面的数据丢失了,p4分区里面有14条数据,其他分区只有11条数据。

//第四个区块已删除

可以对现有表进行分区,并且会按規则自动的将表中的数据分配相应的分区中,这样就比较好了,可以省去很多事情,看下面的操作

mysql> alter table user partition by range(id) (
partition p1 values less than (1),
partition p2 values less than (5),
partition p3 values less than maxvalue
);

//查看表分区信息
mysql> select * from information_schema.partitions where table_schema='liying_order' and table_name='user';

可以看到user表有p1~p3 3个表分区

mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
| 11 |
+----------+

//查看重新整理后的表分区

b.list分区

list分区中每个分区的定义和选择是基于某列的值从属于一个值列表集中的一个值,而range分区是从属于一个连续区间值的集合。

//这种方式失败
mysql> create table if not exists `list_part` (
`id` int(11) not null auto_increment comment '用户id',
`province_id` int(2) not null default 0 comment '省',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '' comment '0为男,1为女',
primary key (`id`)
) engine=innodb default charset=utf8 auto_increment=1 partition by list (province_id) (
partition p0 values in (1,2,3,4,5,6,7,8),
partition p1 values in (9,10,11,12,16,21),
partition p2 values in (13,14,15,19),
partition p3 values in (17,18,20,22,23,24)
);
ERROR 1503 (HY000): A PRIMARY KEY must include all columns in the table's partitioning function //这种方式成功
mysql> create table if not exists `list_part` (
`id` int(11) not null comment '用户id',
`province_id` int(2) not null default 0 comment '省',
`name` varchar(50) not null default '' comment '名称',
`sex` int(1) not null default '0' comment '0为男,1为女'
) engine=innodb default charset=utf8 partition by list (province_id) (
partition p0 values in (1,2,3,4,5,6,7,8),
partition p1 values in (9,10,11,12,16,21),
partition p2 values in (13,14,15,19),
partition p3 values in (17,18,20,22,23,24)
);
Query OK, 0 rows affected (0.33 sec)

上面的这个创建list分区时,如果有主銉的话,分区时主键必须在其中,不然就会报错。如果我不用主键,分区就创建成功了,一般情况下,一张表肯定会有一个主键,这算是一个分区的局限性吧。

如果对数据进行测试,请参考range分区的测试来操作

c.hash分区
hash分区主要用来确保数据在预先确定数目的分区中平均分布,你所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。

mysql> create table if not exists `hash_part` (
`id` int(11) not null auto_increment comment '评论id',
`comment` varchar(1000) not null default '' comment '评论',
`ip` varchar(25) not null default '' comment '来源ip',
primary key (`id`)
) engine=innodb default charset=utf8 auto_increment=1 partition by hash(id)
partitions 3;
Query OK, 0 rows affected (0.06 sec)

测试请参考range分区的操作。

d.key分区
按照key进行分区类似于按照hash分区,除了hash分区使用的用 户定义的表达式,而key分区的 哈希函数是由mysql 服务器提供。

mysql> create table if not exists `key_part` (
`news_id` int(11) not null comment '新闻id',
`content` varchar(1000) not null default '' comment '新闻内容',
`u_id` varchar(25) not null default '' comment '来源ip',
`create_time` date not null default '0000-00-00 00:00:00' comment '时间'
) engine=innodb default charset=utf8 partition by linear hash(year(create_time))
partitions 3;
Query OK, 0 rows affected (0.07 sec)

测试请参考range分区的操作。

四,分区管理

1,分区移除/删除分区

alter table tablename remove partitioning;移除全部分区,不会删除数据
  alter table tablename drop partition partitionname 删除分区同时删除数据

mysql> alter table user drop partition p4;  删除p4分区,同时删除分区数据

2,新增分区
//range添加新分区
mysql> alter table user add partition(partition p4 values less than maxvalue);
query ok, 0 rows affected (0.06 sec)
records: 0 duplicates: 0 warnings: 0

新增分区,已分区的基础上才能进行新增分区
  mysql> alter table dd add partition (
             partition p04 values less than (to_days('2018-08-08'))
        )

  添加分区
  alter table `lot_order_vjoptr-0` add partition(partition pmax values less than maxvalue);
  删除所有分区
  alter table lot_order remove partitioning;

//list添加新分区
mysql> alter table list_part add partition(partition p4 values in (25,26,28));
query ok, 0 rows affected (0.01 sec)
records: 0 duplicates: 0 warnings: 0 //hash重新分区
mysql> alter table hash_part add partition partitions 4;
query ok, 0 rows affected (0.12 sec)
records: 0 duplicates: 0 warnings: 0 //key重新分区
mysql> alter table key_part add partition partitions 4;
query ok, 1 row affected (0.06 sec) //有数据也会被重新分配
records: 1 duplicates: 0 warnings: 0 3,重新分区
//range重新分区
mysql> alter table user reorganize partition p0,p1,p2,p3,p4 into (partition p0 values less than maxvalue);
query ok, 11 rows affected (0.08 sec)
records: 11 duplicates: 0 warnings: 0 //list重新分区
mysql> alter table list_part reorGANIZE PARTITION p0,p1,p2,p3,p4 INTO (PARTITION p0 VALUES in (1,2,3,4,5));
Query OK, 0 rows affected (0.28 sec)
Records: 0 Duplicates: 0 Warnings: 0 //hash和key分区不能用REORGANIZE,官方网站说的很清楚
mysql> ALTER TABLE key_part REORGANIZE PARTITION COALESCE PARTITION 9;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'PARTITION 9' at line 1

五、分区优点
1,分区可以分在多个磁盘,存储更大一点
2,根据查找条件,也就是where后面的条件,查找只查找相应的分区不用全部查找了
3,进行大数据搜索时可以进行并行处理。
4,跨多个磁盘来分散数据查询,来获得更大的查询吞吐量

六、分区允许的列函数

day()
dayofmonth()
dayofweek()
dayofyear()
datediff()
extract()
hour()
microsecond()
minute()
mod()
month()
quarter()
second()
time_to_sec()
to_days()
weekday()
year()
yearweek()

mysql表分区实战的更多相关文章

  1. MySQL表分区技术

    MySQL表分区技术 MySQL有4种分区类型: 1.RANGE 分区 - 连续区间的分区 - 基于属于一个给定连续区间的列值,把多行分配给分区: 2.LIST 分区 - 离散区间的分区 - 类似于按 ...

  2. Mysql 表分区和性能

    以下内容节选自<Mysql技术内幕InnoDB存储引擎> mysql表分区: 分区功能并不是所有存储引擎都支持的,如CSV.MERGE等就不支持.mysql数据库支持的分区类型为水平分区( ...

  3. Mysql表分区的选择与实践小结

    在一些系统中有时某张表会出现百万或者千万的数据量,尽管其中使用了索引,查询速度也不一定会很快.这时候可能就需要通过分库,分表,分区来解决这些性能瓶颈. 一. 选择合适的解决方法 1. 分库分表. 分库 ...

  4. Mysql 表分区

    是否支持分区:mysql> show variables like '%partition%';+-----------------------+-------+| Variable_name ...

  5. MySQL 表分区详解MyiSam引擎和InnoDb 区别(实测)

    一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了1000万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...

  6. mysql表分区(摘自 MySQL表的四种分区类型)

    一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了. 如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以根据所在地将表分区 ...

  7. MySQL表分区

    MySQL的表分区 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了.如:某用户表的记录超过了600万条,那么就可以根据入库日期将表分区,也可以 ...

  8. mysql表分区、查看分区

    原文地址:http://blog.csdn.net/feihong247/article/details/7885199 一.       mysql分区简介 数据库分区 数据库分区是一种物理数据库设 ...

  9. MYSQL 表分区的 3 方法

    背景知识: 表分区是把逻辑上同一范围的数据保存到同一个文件中,就和超市一样,把同类商品放在同一个区域,把不同的商品放在不同的地方.不同的是超市中 是根据用途分类的,表分区是根据它的取值区间来分的. 分 ...

随机推荐

  1. laravel控制器之资源控制器

    资源控制器 Laravel 的资源控制器可以让我们很便捷地构建基于资源的 RESTful 控制器,例如,你可能想要在应用中创建一个控制器,用于处理关于文章存储的 HTTP 请求,使用 Artisan ...

  2. MD5=======RBAC权限管理

    经过网上查阅相关的说明原来,MD5全名Message-Digest Algorithm 5(信息-摘要算法)是一种不可逆的加密算法. MD5为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性 ...

  3. JavaBean四个作用域范围

    使用 useBeans的scope属性可以用来指定javabean的作用范围 page //仅在当前页面有效 request //可以通过HttpRequest.getAttribute()方法取得J ...

  4. python 实践项目

    项目一:让用户输入圆的半径,告诉用户圆的面积 思路: 1.首先需要让用户输入一个字符串,即圆的半径 2.判断用户输入的字符串是否为数字  isalpha 3.求圆的面积需要调用到math模块,所以要导 ...

  5. VUE 动态给对象增加属性,并触发视图更新。

    在开发过程中,我们时常会遇到这样一种情况:当vue的data里边声明或者已经赋值过的对象或者数组(数组里边的值是对象)时,向对象中添加新的属性,如果更新此属性的值,是不会更新视图的. 根据官方文档定义 ...

  6. vue使用路由跳转到上一页

    this.$router.go(-1) <template> <div> <button class="btn btn-success" @click ...

  7. SGU 176 Flow construction (有源有汇有上下界最小流)

    题意:给定 n 个点,m 条有向边,如果有向边的标号是1的话,就表示该边的上界下界都为容量 ,如果有向边的标号为0的哈,表示该边的下界为0,上界为容量 ,现在问,从 1 到 n 的最小流是多少,并输出 ...

  8. JS图片验证码

    !(function(window, document) { var size = 5;//设置验证码长度 function GVerify(options) { //创建一个图形验证码对象,接收op ...

  9. VDD,VCC,VSS,VEE,VDDA,VSSA,

    VDD是主供电电源,也是IO口输出电平的输入电源.VDDA(A表示模拟)是模拟电源,当使用到模拟信号的时候,比如AD(模数)或者DA(数模)的时候,系统会使用VDDA的电压作为参考电压来.不要求精准使 ...

  10. hdu 4022 Bombing

    Bombing Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 65768/65768 K (Java/Others)Total Sub ...