Postgresql分表与优化

--1、创建主表

CREATE TABLE tbl_partition

(

  date_key date,

  hour_key smallint,

  client_key integer,

  item_key integer,

  account integer,

  expense numeric

);

--2、创建多个分表。每个分区表必须继承自主表，并且正常情况下都不要为这些分区表添加任何新的列。

CREATE TABLE tbl_partition_2016_01() inherits (tbl_partition);

CREATE TABLE tbl_partition_2016_02() inherits (tbl_partition);

CREATE TABLE tbl_partition_2016_03() inherits (tbl_partition);

--CREATE TABLE tbl_partition_2016_04() inherits (tbl_partition);

--3、TODO为分区表添加限制。这些限制决定了该表所能允许保存的数据集范围。这里必须保证各个分区表之间的限制不能有重叠。

ALTER TABLE tbl_partition_2016_01

ADD CONSTRAINT tbl_partition_2016_01_check_date_key

CHECK (date_Key >= '2016-01-01'::date AND date_Key < '2016-02-01'::date);

ALTER TABLE tbl_partition_2016_02

ADD CONSTRAINT tbl_partition_2016_02_check_date_key

CHECK (date_Key >= '2016-02-01'::date AND date_Key < '2016-03-01'::date);

ALTER TABLE tbl_partition_2016_03

ADD CONSTRAINT tbl_partition_2016_03_check_date_key

CHECK (date_Key >= '2016-03-01'::date AND date_Key < '2016-04-01'::date);

--4、为每一个分区表，在主要的列上创建索引。该索引并不是严格必须创建的，但在大部分场景下，它都非常有用。

---CREATE INDEX tbl_partition_all_date_key ON tbl_partition_all (date_key,client_key);

CREATE INDEX tbl_partition_date_key_2016_01

ON tbl_partition_2016_01 (date_key,client_key);

CREATE INDEX tbl_partition_date_key_2016_02

ON tbl_partition_2016_02 (date_key,client_key);

CREATE INDEX tbl_partition_date_key_2016_03

ON tbl_partition_2016_03 (date_key,client_key);

--5、定义一个trigger或者rule把对主表的数据插入操作重定向到对应的分区表。

--创建分区函数

CREATE OR REPLACE FUNCTION tbl_partition_trigger()

  RETURNS TRIGGER AS $$

BEGIN

  IF NEW.date_key >= DATE '2016-01-01' AND NEW.date_Key < DATE '2016-02-01'

  THEN

    INSERT INTO tbl_partition_2016_01 VALUES (NEW.*);

  ELSIF NEW.date_key >= DATE '2016-02-01' AND NEW.date_Key < DATE '2016-03-01'

    THEN

      INSERT INTO tbl_partition_2016_02 VALUES (NEW.*);

  ELSIF NEW.date_key >= DATE '2016-03-01' AND NEW.date_Key < DATE '2016-04-01'

    THEN

      INSERT INTO tbl_partition_2016_03 VALUES (NEW.*);

  END IF;

  RETURN NULL;

END;

$$

LANGUAGE plpgsql;

--6、挂载分区Trigger

CREATE TRIGGER insert_tbl_partition_trigger

BEFORE INSERT ON tbl_partition

FOR EACH ROW EXECUTE PROCEDURE tbl_partition_trigger();

--7、创建全表

CREATE TABLE tbl_partition_all

(

  date_key date,

  hour_key smallint,

  client_key integer,

  item_key integer,

  account integer,

  expense numeric

);

--8、自动建表触发器

CREATE OR REPLACE FUNCTION tbl_partition_trigger()

  RETURNS TRIGGER AS $$

DECLARE month_text TEXT;

        this_month_first_day_text TEXT;

        next_month_first_day_text TEXT;

        insert_statement TEXT;

BEGIN

  SELECT to_char(NEW.date_key, 'YYYY_MM') INTO month_text;

  SELECT get_month_first_day(NEW.date_key) INTO this_month_first_day_text;

  SELECT to_char(to_date(this_month_first_day_text,'YYYY-MM-DD') + interval '1 month', 'YYYY-MM-DD') INTO next_month_first_day_text;

  insert_statement := 'INSERT INTO tbl_partition_'

                      || month_text||' VALUES ($1.*)';

  EXECUTE insert_statement USING NEW;

  RETURN NULL;

  EXCEPTION

  WHEN UNDEFINED_TABLE

    THEN

      EXECUTE

      'CREATE TABLE IF NOT EXISTS tbl_partition_'

      || month_text

      || '(CHECK (date_key >= '''

      || this_month_first_day_text

      || ''' and date_key<'''

      || next_month_first_day_text

      || ''')) INHERITS (tbl_partition)';

      RAISE NOTICE 'CREATE NON-EXISTANT TABLE tbl_partition_%', month_text;

      EXECUTE

      'CREATE INDEX tbl_partition_date_key_'

      || month_text

      || ' ON tbl_partition_'

      || month_text

      || '(date_key)';

      EXECUTE insert_statement USING NEW;

      RETURN NULL;

END;

$$

LANGUAGE plpgsql;

--get_month_first_day

CREATE OR REPLACE FUNCTION get_month_first_day(in in_date date,out out_date text)

AS $$

BEGIN

  SELECT to_char(in_date, 'YYYY_MM')||'_01' INTO out_date;

END;

$$

LANGUAGE plpgsql;

--插入数据脚本

INSERT INTO

    tbl_partition_all

select

    (select

        array_agg(i::date)

    from

        generate_series(

        '2015-12-01'::date,

        '2015-12-30'::date,

        '1 day'::interval) as t(i)

    )[floor(random()*4)+1] as date_key,

    floor(random()*24) as hour_key,

    floor(random()*1000000)+1 as client_key,

    floor(random()*100000)+1 as item_key,

    floor(random()*20)+1 as account,

    floor(random()*10000)+1 as expense

from

    generate_series(1,300000000,1);

INSERT INTO tbl_partition SELECT * FROM tbl_partition_all;

-------------------------------------------------主体结束-----------------------------------------

-------------------------------------------------主体结束-----------------------------------------

--使用rule创建分表

CREATE RULE tbl_partition_rule_2016_01 AS

ON INSERT TO tbl_partition

  WHERE

    date_key >= DATE '2016-01-01' AND date_Key < DATE '2016-02-01'

DO INSTEAD

  INSERT INTO tbl_partition_2016_01 VALUES (NEW.*);

--删除继承关系

ALTER TABLE tbl_partition_2016_01 NO INHERIT tbl_partition;

--查询对比测试

EXPLAIN  ANALYZE

select count(account) ,client_key  from  tbl_partition  v

where v.date_key >='2016-03-02'   and v.date_key <='2016-03-07' group by client_key ;

EXPLAIN  ANALYZE

select count(account) ,client_key  from  tbl_partition_all  v

where v.date_key >='2016-03-02'   and v.date_key <='2016-03-12' group by client_key ;

Postgresql分表与优化的更多相关文章

WebGIS项目中利用mysql控制点库进行千万条数据坐标转换时的分表分区优化方案
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1. 背景项目中有1000万条历史案卷,为某地方坐标系数据,我们的真实 ...
sharding-jdbc结合mybatis实现分库分表功能
最近忙于项目已经好久几天没写博客了,前2篇文章我给大家介绍了搭建基础springMvc+mybatis的maven工程,这个简单框架已经可以对付一般的小型项目.但是我们实际项目中会碰到很多复杂的场景, ...
Mysql性能优化三（分表、增量备份、还原）
接上篇Mysql性能优化二对表进行水平划分如果一个表的记录数太多了,比如上千万条,而且需要经常检索,那么我们就有必要化整为零了.如果我拆成100个表,那么每个表只有10万条记录.当然这需要数据在逻 ...
C#.NET 大型通用信息化系统集成快速开发平台 4.1 版本 - 大数据支持分表优化
公司的短信平台,数据量越来越大了,需要对数据进行一些优化,下面是拆分后的数据库量参考. 新开发的软件模块,必须支持分表,拆表的功能一个数据表里,不适合保存1000万以上的记录新开发的业务模块,能分表的 ...
mysql中的优化, 简单的说了一下垂直分表, 水平分表(有几种模运算),读写分离.
一.mysql中的优化 where语句的优化 1.尽量避免在 where 子句中对字段进行表达式操作select id from uinfo_jifen where jifen/60 > 100 ...
MYSQL性能优化分享(分库分表)
1.分库分表很明显,一个主表(也就是很重要的表,例如用户表)无限制的增长势必严重影响性能,分库与分表是一个很不错的解决途径,也就是性能优化途径,现在的案例是我们有一个1000多万条记录的用户表mem ...
Sql的分库分表，及优化
对Sql细节优化在sql查询中为了提高查询效率,我们常常会采取一些措施对查询语句进行sql优化,下面总结的一些方法,有需要的可以参考参考. 首先给大家介绍一下分库分表分库分表分库垂直分库业务 ...
Mysql MyISAM与InnoDB 表锁行锁以及分库分表优化
一. 两种存储引擎:MyISAM与InnoDB 区别与作用 1. count运算上的区别: 因为MyISAM缓存有表meta-data(行数等),因此在做COUNT(*)时对于一个结构很好的查询是不需 ...
MySQL优化(一)：MySQL分库分表
一.分库分表种类 1.垂直拆分在考虑数据拆分的时候,一般情况下,应该先考虑垂直拆分.垂直可以理解为分出来的库表结构是互相独立各不相同的. - 如果有多个业务,每个业务直接关联性不大,那么就可以把每个 ...

随机推荐

Linux内核同步：RCU
linux内核 RCU机制详解简介 RCU(Read-Copy Update)是数据同步的一种方式,在当前的Linux内核中发挥着重要的作用.RCU主要针对的数据对象是链表,目的是提高遍历读取数据的 ...
如何提升RDS响应速度
如果采用短连接的方式连接RDS,请在与RDS相连的云服务器上执行以下命令来提升RDS响应速度.(注:云服务器要有公网带宽) 1.安装nscd 云服务器上执行命令 Ubuntu系统执行:apt-get ...
sql server2008系统表详细说明sys.开头的表
一.库里有多少个表,表名等 select * from INFORMATION_SCHEMA.TABLES 二.查询表.字段.类型.是否主键.长度.小数位.是否允许空.默认值等详细查询效果: SEL ...
【转】在一个Job中同时写入多个HBase的table
在进行Map/Reduce时,有的业务需要在一个job中将数据写入到多个HBase的表中,下面是实现方式. 原文地址:http://lookfirst.com/2011/07/hbase-multit ...
js关闭当前页面和给子页面的对象赋值
代码如下: function saveData(){ //给父页面的对象赋值 frameElement.api.opener.document.getElementById("userNam ...
iphone 4s插件的安装,问题及美化
此处iphone4s为美版,系统版本为5.0.1 首先添加我自己的weiphone源:http://apt.weiphone.com/u/2903862以及破解资源源:http://cydia.xse ...
nginx静态资源缓存与压缩
一.静态资源缓存参考文章 (1)apache设置max-age或expires 这里需要修改.htaccess文件. <IfModule mod_headers.c> <Files ...
IOS 缓存方案（按需缓存、预缓存）及低网速模拟
1,在设备中设置开发者模式. 参照上面设置自定义添加.丢包率 35. 或者参照这个文章:http://ivoryxiong.org/devops/2013/05/24/ios_dev_handl ...
vue2.0 组件化及组件传值
组件 (Component) 是 Vue.js 最强大的功能之一.组件可以扩展 HTML 元素,封装可重用的代码.在较高层面上,组件是自定义元素,Vue.js 的编译器为它添加特殊功能.在有些情况下, ...
【React Native开发】React Native应用设备执行(Running)以及调试(Debugging)(3)
),React Native技术交流4群(458982758),请不要反复加群.欢迎各位大牛,React Native技术爱好者加入交流!同一时候博客左側欢迎微信扫描关注订阅号,移动技术干货,精彩文章 ...

Postgresql分表与优化

Postgresql分表与优化的更多相关文章

随机推荐

热门专题