经历了前两轮优化之后，saiku由不可使用，优化到可以使用，不过在分析大量日志数据的时候，还有顿卡的感觉！继续观察背后执行的Sql，决定将注意力关注到索引上面！

日志的主要使用场景是：固定日期维度的数据分析，也就是说where条件一定跟着日期等于某一天，那么纠结的是：每个字段都建立索引，还是和日期建立联合索引。归结到底就是单个字段的索引效率与联合索引的效率优劣对比！

Postgresql数据表：saiku_search_detail

表结构：

CREATE TABLE test.saiku_search_detail

(

  rpt_date date,

  from_area_id bigint,

  from_value_id bigint,

  in_track_id bigint,

  gid character varying,

  current_city_id bigint,

  dist_city_id bigint,

  category_name_id bigint,

  page_id bigint,

  utmr_page_id bigint,

  num bigint,

  id bigint,

  partner smallint

)

条数：8,510,490。大概851万

测试步骤：

一、裸表

对一个日期进行查询：

1.1 单个条件

select

  count(1)

from test.saiku_search_detail

where rpt_date = '2016-05-13'

结果：1110ms

"Aggregate  (cost=160934.85..160934.86 rows=1 width=0)"

"  ->  Seq Scan on saiku_search_detail  (cost=0.00..160816.78 rows=47230 width=0)"

"        Filter: (rpt_date = '2016-05-13'::date)"

1.2 两个条件

select

  count(1)

from test.saiku_search_detail

where rpt_date = '2016-05-13'

and from_area_id = 135

结果：1782ms

"Aggregate  (cost=184432.32..184432.33 rows=1 width=0)"

"  ->  Seq Scan on saiku_search_detail  (cost=0.00..184431.73 rows=236 width=0)"

"        Filter: ((rpt_date = '2016-05-13'::date) AND (from_area_id = 135))"

没有任何异议，0个索引！

二、对两个字段分别添加索引：

--btree索引

CREATE INDEX saiku_search_detail_from_area_id_idx

  ON saiku_search_detail

  USING btree

  (from_area_id);

--hash索引

CREATE INDEX saiku_search_detail_rpt_date_idx

  ON saiku_search_detail

  USING hash

  (rpt_date);

2.1 单个条件

select

  count(1)

from saiku_search_detail

where rpt_date = '2016-05-13'

结果：83ms

"Aggregate  (cost=8.02..8.03 rows=1 width=0)"

"  ->  Index Scan using saiku_search_detail_rpt_date_idx on saiku_search_detail  (cost=0.00..8.02 rows=1 width=0)"

"        Index Cond: (rpt_date = '2016-05-13'::date)"

使用了索引

2.2 两个条件

select

  count(1)

from saiku_search_detail

where rpt_date = '2016-05-13'

and from_area_id = 135

结果：149ms

"Aggregate  (cost=8.02..8.03 rows=1 width=0)"

"  ->  Index Scan using saiku_search_detail_rpt_date_idx on saiku_search_detail  (cost=0.00..8.02 rows=1 width=0)"

"        Index Cond: (rpt_date = '2016-05-13'::date)"

"        Filter: (from_area_id = 135)"

使用了一个索引，第二个索引没有生效。尝试修改sql的条件顺序：

select

  count(1)

from saiku_search_detail

where from_area_id = 135

and rpt_date = '2016-05-13'

结果一样！这说明在Postgresql里面，建立两个索引字段，只会一个起作用！

三、建立联合索引

--复合索引，两个字段都添加索引

CREATE INDEX saiku_search_detail_rpt_date_from_area_idx

  ON test.saiku_search_detail

  USING btree

  (rpt_date, from_area_id);

3.1 单个条件查询&建立索引的第一个字段

select

  count(1)

from test.saiku_search_detail

where rpt_date = '2016-05-13'

结果：66ms

"Aggregate  (cost=47843.00..47843.01 rows=1 width=0)"

"  ->  Bitmap Heap Scan on saiku_search_detail  (cost=2220.63..47362.94 rows=192025 width=0)"

"        Recheck Cond: (rpt_date = '2016-05-13'::date)"

"        ->  Bitmap Index Scan on saiku_search_detail_rpt_date_from_area_idx  (cost=0.00..2172.62 rows=192025 width=0)"

可见使用了部分索引

3.2 两个条件查询

select

  count(1)

from test.saiku_search_detail

where rpt_date = '2016-05-13'

and from_area_id = 135

结果：65ms

"Aggregate  (cost=46124.99..46125.00 rows=1 width=0)"

"  ->  Bitmap Heap Scan on saiku_search_detail  (cost=1509.67..45857.37 rows=107047 width=0)"

"        Recheck Cond: ((rpt_date = '2016-05-13'::date) AND (from_area_id = 135))"

"        ->  Bitmap Index Scan on saiku_search_detail_rpt_date_from_area_idx  (cost=0.00..1482.90 rows=107047 width=0)"

使用了索引

总结

废话：如果两个字段做为筛选条件，那么联合索引最优。
收益：在日志分析过程中，除了日期的单个字段做为索引，其他的单个字段索引都不起作用，应该删除
纠结：仅仅在日期建立单个索引，还是建立多个包含日期的复合索引？根据使用场景自己决定吧

saiku之行速度优化（三）的更多相关文章

【SQL server初级】数据库性能优化三：程序操作优化
数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第三部分数据库性能优化三:程序操作优化概述:程序访问优化也可以认为是访问SQL语句的优化,一个好的SQL语句是可以减少 ...
dWebpack编译速度优化实战
当你的应用的规模还很小时,你可能不会在乎Webpack的编译速度,无论使用3.X还是4.X版本,它都足够快,或者说至少没让你等得不耐烦.但随着业务的增多,嗖嗖嗖一下项目就有上百个组件了,也是件很简单的 ...
MySQL优化三（InnoDB优化）
body { font-family: Helvetica, arial, sans-serif; font-size: 14px; line-height: 1.6; padding-top: 10 ...
Tone Mapping算法系列二：一种自适应对数映射的高对比度图像显示技术及其速度优化。
办公室今天停电,幸好本本还有电,同事们好多都去打麻将去了,话说麻将这东西玩起来也还是有味的,不过我感觉我是输了不舒服,赢了替输的人不舒服,所以干脆拜别麻坛四五年了,在办公室一个人整理下好久前的一片论文 ...
App架构师实践指南六之性能优化三
App架构师实践指南六之性能优化三 2018年08月02日 13:57:57 nicolelili1 阅读数:190 内存性能优化1.内存机制和原理 1.1 内存管理内存时一个基础又高深的话题,从 ...
MySQL性能优化(三)：索引
原文:MySQL性能优化(三):索引版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/vbi ...
[转]Asp.net mvc 网站之速度优化 -- 页面缓存
网站速度优化的一般方法由于网站最重要的用户体验就是速度,特别是对于电子商务网站而言. 一般网站速度优化会涉及到几个方面: 1. 数据库优化 — 查询字段简历索引,使用数据库连接池和持久化,现在还有种 ...
web访问速度优化分析
请求从发出到接收完成一共经历了DNS Lookup.Connecting.Blocking.Sending.Waiting和Receiving六个阶段,时间共计38ms.请求完成之后是DOM加载和页面 ...
记一次cocos项目的加载速度优化
半个月前,我们用cosos creator做了一个简单的小游戏,也许算不上小游戏吧..一边学cocos,一边做,几经波折后终于上线了.然鹅,功能是实现了,但是加载速度十分感人(毕竟没经验嘛,无辜脸). ...

随机推荐

centos7 安装 notejs
1.安装集成工具 yum -y install gcc make gcc-c++ 2.安装notejs 自行选择版本:https://nodejs.org/dist/ wget https://nod ...
C#设计模式(23)——备忘录模式（Memento Pattern）
一.引言在上一篇博文分享了访问者模式,访问者模式的实现是把作用于某种数据结构上的操作封装到访问者中,使得操作和数据结构隔离.而今天要介绍的备忘者模式与命令模式有点相似,不同的是,命令模式保存的是发起 ...
Kali linux系列之 zmap 安装
Kali linux系列之 zmap 安装官方文档地址:https://zmap.io/ 准备:保证有比较顺畅的更新源,可以更新系统,下载安装包. 安装第一步:sudo apt-get insta ...
Nginx学习笔记（一） Nginx架构
Nginx架构 Nginx全程是什么? Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器. ...
使用media Queries实现一个响应式的菜单
Media queries是CSS3引入的一个特性,使用它可以方便的实现各种响应式效果.在这个示例中我们将会使用media queries实现一个响应式的菜单.这个菜单会根据当前浏览器屏幕的大小变化而 ...
AngularJS应用页面切换优化方案
葡萄城的一款尚在研发中的产品,对外名称暂定为X项目.其中使用了已经上市的Wijmo中SpreadJS产品,另外,在研发过程中整理了一些研发总结分享给大家.如本篇的在页面切换的过程中优化方案,欢迎大家跟 ...
1120练习，CSS制作网页
<title>智博星主页</title> <style type="text/css"> *{ margin:0px auto; padding ...
Atitit selenium3 新特性
Atitit selenium3 新特性 Selenium2.0 支持了webdriver api,,原来自己的api放弃了. Selenium v2.45.0 发布,支持Firefox 3 ...
atitit.404错误的排查流程总结vOa6
atitit.404错误的排查流程总结vOa6 1. 场景 1 1.1. 子应用猛个腊擦不能使用 404 兰.. 1 2. 服务器配置问题 2 2.1. 登录服务器管理子应用,查看应用是否启动okk ...
php类自动装载、链式操作、魔术方法
1.自动装载实例目录下有3个文件:index.php load.php tests文件夹 tests文件夹里有 test1.php <?php namespace Tests; class T ...

saiku之行速度优化（三）