欢迎和大家交流技术相关问题:
邮箱: jiangxinnju@163.com
博客园地址: http://www.cnblogs.com/jiangxinnju
GitHub地址: https://github.com/jiangxincode
知乎地址: https://www.zhihu.com/people/jiangxinnju

原作:陈敏  2008-05-21

熟悉IBM DB2 UDB的都知道,构筑DB2数据库对象的层次关系,既每台物理机器可以配置多个实例,而每个实例是一个独立的运行环境,在每个实例下可以创建多个数据库,每个数据库可以有多个表空间,而数据库中的表会存放在这些表空间中。那分区数据库中他们的关系又如何,是如何分区的呢?本文就分区数据库的基本概念做简单介绍。
    有了数据库分区后,在原来构筑DB2数据库对象的层次关系里发生了一些变化,实例增加了一个物理特性,就是实例所拥有的数据库分区,为了使使用者能够充分利用分区数据库的特性,在数据库和表空间之间增加了一层,——数据库分区组。与之相关的名词包括数据库分区,数据库分区组,分区映射,分区键,下面就详细解释一下:
数据库分区
    首先说一下什么是数据库分区,数据库分区是DB2数据库的一部分,由它自己的数据、索引、配置文件和事务日志组成。分区数据库就是具有两个或多个分区的数据库。这样,表就可以位于一个或多个数据库分区中。与每个数据库分区相关联的处理器都用来满足表请求。数据检索和更新请求将自动分解为子请求,并在适当的数据库分区中并行执行。
数据库分区组
    数据库分区组是一个或多个数据库分区的集合。想要为数据库创建表时,首先创建用来存储表空间的数据库分区组,然后创建用来存储表的表空间。
    可以在数据库中定义一个或多个数据库分区组成的命名子集。您定义的每个子集称为 数据库分区组 。包含多个数据库分区的每个子集称为 多分区数据库分区组 。多分区数据库分区组只能使用属于相同实例的数据库分区定义。

   图 1 给出了一个含五个分区的数据库示例,在这个示例中:
• 数据库分区组横跨除一个数据库分区外的所有其它分区(数据库分区组 1)。
• 数据库分区组包含一个数据库分区(数据库分区组 2)。
• 数据库分区组包含两个数据库分区(数据库分区组 3)。
• 数据库分区组 2 中的数据库分区与数据库分区组 1 共享并与之相交。
• 数据库分区组 3 中存在单个数据库分区,该分区与数据库分区组 1 共享并与之相交。
    可使用 CREATE DATABASE PARTITION GROUP 语句创建数据库分区组。此语句指定表空间容器和表数据将驻留其上的一组数据库分区。此语句还可以:
• 为数据库分区组创建分区映射。
• 生成分区映射标识。
• 将记录插入下列目录表:
o SYSCAT.DBPARTITIONGROUPS
o SYSCAT.PARTITIONMAPS
o SYSCAT.DBPARTITIONGROUPDEF
    创建数据库时创建的缺省数据库分区组由数据库管理器使用。IBMCATGROUP 是包含系统目录的表空间的缺省数据库分区组,只在主节点上(主数据库分区)。IBMTEMPGROUP 是系统临时表空间的缺省数据库分区组,包含所有数据库分区。
IBMDEFAULTGROUP 是包含用户定义的表的表空间的缺省数据库分区组,包含所有数据库分区。
    通过将表空间放置在多分区数据库分区组中,将该表空间内的所有表划分或分区到该数据库分区组的每个分区中。由此该表空间被创建到了一个数据库分区组中。一旦位于某个数据库分区组中,该表空间就必须保留在该处;而不能更改至另一数据库分区组。CREATE TABLESPACE 语句用于将表空间与数据库分区组关联。
建数据库分区组示例:
CREATE DATABASE PARTITION GROUP MAXGROUP ON ALL DBPARTITIONNUMS
CREATE DATABASE PARTITION GROUP MEDGROUP ON DBPARTITIONNUMS( 0 TO 2, 5, 8)

分区映射
    在分区数据库环境中,数据库管理器必须具有弄清一个表的哪些行存储在哪些数据库分区上的方法。数据库管理器必须知道到哪里去查找所需的数据,并使用一个称为 分区映射 的映射来查找数据。
    分区映射是一个内部生成的数组,对于多分区数据库分区组,它包含 4 096 个条目,对于单一分区数据库分区组,只包含一个条目。对于单一分区数据库分区组,分区映射只有一个条目,该条目包含存储数据库表的所有行的数据库分区的分区号。对于多分区数据库分区组,以循环方式指定数据库分区组的分区号。正如使用网格将城市地图划分为区一样,数据库管理器使用 分区键 来确定存储数据的位置(数据库分区)。
    例如,假定您将一个数据库创建在四个数据库分区(编号为 0-3)上。此数据库的 IBMDEFAULTGROUP 数据库分区组的分区映射将是:
0 1 2 3 0 1 2 ...
   若已使用数据库分区 1 和 2 在该数据库中创建了一个数据库分区组,则该数据库分区组的分区映射将是:
1 2 1 2 1 2 1 ...
    若要装入数据库的一个表的分区键是一个可能在范围 1 至 500 000 之间的整数,则会将分区键散列至 0 至 4 095 之间的一个  分区号。将该编号用作分区映射中的索引,以选择用于该行的数据库分区。

    图 2 显示如何将具有分区键值 (c1, c2, c3) 的行映射至分区 2,然后引用数据库分区 n5。
    分区映射可以灵活地控制将数据存储在分区数据库中的哪个位置。若将来需要更改数据库中各数据库分区上的数据分发,可以使用数据再分发实用程序。此实用程序允许重新平衡或调整数据分发的偏差。

分区键
    分区键 是一列(或一组列),用于确定将某行数据存储在什么分区。分区键是使用 CREATE TABLE 语句在表上定义的。如果没有为分布在数据库分区组中的多个数据库分区中的表空间中的表定义分区键,在缺省情况下将会根据主键的第一列创建分区键。若未指定主键,则缺省分区键是在该表中定义的第一个非长型字段列。( 长型 包括所有长型数据类型和所有大对象(LOB)数据类型)。若没有列满足缺省分区键的要求,则不会不带键创建该表。
    好的表分区键就是将数据均匀分布在数据库分区组中的所有数据库分区上的分区键。不适当的分区键会导致数据分发不均匀。数据分发不均匀的列和含有少数特异值的列不应选作分区键。特异值的数目必须足够大,才能确保将行均匀分布在数据库分区组中的所有数据库分区上。应用分区散列算法的成本与分区键的大小是成正比的。分区键不能超过 16 列,而且列越少,性能越好。不应将不需要的列包括在分区键中。
当定义分区键时,应该考虑下列几点:
• 不支持创建只包含长型数据类型(LONG VARCHAR、LONG VARGRAPHIC、BLOB、CLOB 或 DBCLOB)的多分区表。
• 不能改变分区键定义。
• 分区键应该包括最频繁连接的列。
• 分区键应该由经常参与 GROUP BY 子句的列组成。
• 任何唯一键或主键必须包含所有分区键列。
• 在联机事务处理(OLTP)环境中,分区键中的所有列都应该使用带常量或主机变量的等于(=)谓词来参与该事务。例如,假
定有一个在事务中经常使用的职员号 emp_no,如:
• UPDATE emp_table SET ... WHERE
emp_no = host-variable
散列分区 是确定分区表中每一行的位置的方法。该方法的原理如下:
1. 将散列算法应用于分区键的值,并生成介于 0 与 4095 之间的分区号。
2. 创建数据库分区组时将创建分区映射。每个分区号依次以循环方式重复,以填写该分区映射。
3. 该分区号用作分区映射中的一个索引。分区映射中该位置处的编号是存储该行的数据库分区的编号。
在分区数据库中跨越几个分区创建一个表在性能上有几个优点。与检索数据相关联的工作可分成几部分在各个数据库分区中进行。
    必须小心地选择适当的分区键,因为 以后再也不能更改它 。再者,必须将任何唯一索引(因此也是唯一键或主键)定义为分区键的一个超集。即,若定义了分区键,则唯一键和主键必须包括所有与分区键相同的列(它们可能有多列)。
    表的一个分区大小不能超过 64 GB 和可用的磁盘空间中较小的那一个。(假设表空间具有 4 KB 的页大小。)该表的最大大小可以是 64 GB(或可用磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 8 KB,则该表最大的大小可以为 128 GB(或可用的磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 16 KB,则该表的最大大小可为 256 GB(或可用的磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 32 KB,则该表的最大大小可为 512 GB(或可用的磁盘空间)乘以数据库分区数之积。
以下是一个示例:
CREATE TABLE MIXREC (MIX_CNTL INTEGER NOT NULL,
MIX_DESC CHAR(20) NOT NULL,
MIX_CHR CHAR(9) NOT NULL,
MIX_INT INTEGER NOT NULL,
MIX_TMSTMP TIMESTAMP NOT NULL)
IN MIXTS12
PARTITIONING KEY (MIX_INT) USING HASHING
    在上一个示例中,表空间是 MIXTS12,而分区键是 MIX_INT。若未显式指定分区键,则它是 MIX_CNTL。(若未指定主键且未定义分区键,则分区键是该列表中的第一个非长型字段的列。)

建立分区数据库
有了上述了解,就可以建一个分区数据库了,示例如下:
1) 了解分区定义
     分区定义可以从节点配置文件(db2nodes.cfg)得到,其位于实例所有者的主目录中,它包含一些配置信息,告诉 DB2 有哪些服务器参与分区数据库环境的实例。分区数据库环境中的每个实例都有一个 db2nodes.cfg 文件。对于每个参与实例的服务器,db2nodes.cfg 文件必须包含一个条目。当创建实例时,会自动创建 db2nodes.cfg 文件并对拥有实例的服务器添加条目。这里我们假设有4个分区。
2) 创建数据库
create db dpfdb;
默认会创建3个分区组IBMCATGROUP(只在0号分区上)
IBMTEMPGROUP ,IBMDEFAULTGROUP(在所有分区上),如果用户没有创建其他分区组,所创建的表空间会默认放在IBMDEFAULTGROUP上
3) 创建分区组
   我们在 1到3号分区建立一个分区组
CREATE DATABASE PARTITION GROUP USERGROUP ON DBPARTITIONNUMS(1,2,3);
4) 创建表空间
CREATE TABLESPACE TS IN USERGROUP MANAGED BY DATABASE USING (file '/DB2containers/TScontainer $N' 10000)
有4个containers被创建
/DB2containers/TScontainer0 - on DATABASE PARTITION 0
/DB2containers/TScontainer1 - on DATABASE PARTITION 1
/DB2containers/TScontainer2 - on DATABASE PARTITION 2
/DB2containers/TScontainer3 - on DATABASE PARTITION 3
5) 创建表
CREATE TABLE DPFTABLE (ID INTEGER NOT NULL,
NAME CHAR(20) NOT NULL)
IN TS
PARTITIONING KEY (ID) USING HASHING;
如果想了解如何配置分区数据库环境,请参考
http://www.ibm.com/developerworks/cn/aix/library/au-db2-dpf/index.html#N100A7

如何建立DB2分区数据库?(转)的更多相关文章

  1. DB2创建数据库常用参数详解

    转自http://czmmiao.iteye.com/blog/1335801 DB2创建数据库常用参数详解 本文只介绍DB2 create database语法中的常用参数http://publib ...

  2. 如何将DB2的数据库转换到mySQL中?

    经过几次尝试最终找到解决的办法,因为网上并没有详细说明,所以下面我将详细的步骤记录如下: 1. 大前提是你已经安装好DB2服务器和mySQL服务器,现在只是借用Navicat for MySQL这个软 ...

  3. DB2重启数据库实例

    DB2重启数据库实例时,有时停止实例会失败,此时需要先确认没有应用链接数据库,然后再关闭数据库实例,并重新启动. 1.查看是否有活动的链接 命令:db2 list applications for d ...

  4. db2删除数据库

    1.断开所有连接  db2 stop application all   force 2.停止数据库    db2stop 3.删除数据库(系统管理员权限下)db2 drop  数据库name

  5. DB2通用数据库性能调整的常用方法

    DB2通用数据库性能调整的常用方法 DB2通用数据库性能调整的常用方法 Agenda 统计值更新--runstats  调整Buffer pool  调整日志缓冲区大小  应用程序堆大小  排序堆大小 ...

  6. (转)Oracle与DB2在数据库高可用技术上的相同与差异探讨

    原文:http://www.talkwithtrend.com/Article/178339 数据库建设过程中,高可用是每一个企业数据中心数据库建设过程中至关重要的一个关注点,直接关系到业务连续性和稳 ...

  7. DB2报“数据库日志已满”问题解决

    用控制中心直接改会比较容易一点,在数据库名称上点右键-->配置-->日志-->日志文件大小.主日志文件数.辅助日志文件数改大一点. 也可用命令行db2cmd db2 update d ...

  8. db2新建数据库

    一.建表空间和数据库 1.在db2ad.db2db和db2ap上均执行: [sql] view plaincopyprint? db2set db2comm=tcpip db2set db2codep ...

  9. DB2还原数据库备份

    用命令还原数据库备份 1.建立一个新的数据库db2 create db 数据库名 on 路径 using codeset GBK territory zh_CN 2.将需要恢复的数据库恢复得到这个新的 ...

随机推荐

  1. 一次清除SQL SERVER错误日志的体会!

    之前在UAT环境搭建的SQL SERVER 2008 R2数据库一直用得比较正常,但最近发现在Sharepoint中不能进行任何操作了,开始以为是什么配置出了问题(因为一直在研究一些新的应用和集成,需 ...

  2. Codeforces Round #186 (Div. 2).D

    纠结的一道dp. 状态转移方程还是比较好想的,优化比较纠结 D. Ilya and Roads time limit per test 3 seconds memory limit per test ...

  3. spring容器加载完毕做一件事情(利用ContextRefreshedEvent事件)

    关键字:spring容器加载完毕做一件事情(利用ContextRefreshedEvent事件) 应用场景:很多时候我们想要在某个类加载完毕时干某件事情,但是使用了spring管理对象,我们这个类引用 ...

  4. SSM框架---搭建

    SSM框架简介 SSM框架,是spring + spring MVC + MyBatis的缩写,这个是继SSH之后,目前比较主流的Java EE企业级框架,适用于搭建各种大型的企业级应用系统. Spr ...

  5. 小程序用scroll-view的scroll-to-view属性实现锚链接跳转

    小程序没有锚链接,通过scroll-view可以实现类似锚链接的功能,点击锚链接,滚动条滚动到相应的位置 wxml <view class="wrap"> <!- ...

  6. node 事件监听器

    创建文件events.js,依次写入下列代码: 事件模块引入与实例化监听器 // 引入事件模块 var e = require('events'); // 实例化事件监听 var emitter = ...

  7. SharePoint PerformancePoint开发实例

    前言 由于工作的原因,有一段时间没有发新的随笔了,最近使用了SharePoint PerformancePoint做了一些报表,与大家分享经验. 本文完全原创,转载请说明出处,希望对大家有用. 阅读目 ...

  8. hibernate的二级缓存----collection和query的二级缓存

    collection二级缓存: 不使用集合的二级缓存时: 运行下面的代码: @Test public void testCollectionSecondLevelCache1(){ Departmen ...

  9. Hibernate的大对象映射

    1在持久类中直接声明是java.sql.Blob类型 2在.hbm.xml文件中配置一下信息 <!-- 映射大对象 (就是字符长度超过255和图片想转换成二进制的数据)--> <!- ...

  10. 操作数组可以通过Array这个类来操作(不需要考虑数组的类型!!!)

    这段代码通过Array这个类,把值取出来,存到collection里,不需要考虑数组的类型