数据立方体(Cube)】的更多相关文章

如上图所示,这是由三个维度构成的一个OLAP立方体,立方体中包含了满足条件的cell(子立方块)值,这些cell里面包含了要分析的数据,称之为度量值.显而易见,一组三维坐标唯一确定了一个子立方. 多位模型的基本概念介绍:  立方体:由维度构建出来的多维空间,包含了所有要分析的基础数据,所有的聚合数据操作都在立方体上进行.  维度:就是观察数据的一种角度.在这个例子中,路线,源,时间都是维度,  这三个维度构成了一个立方体空间.维度可以理解为立方体的一个轴.要注意的是有一个特殊的维度,即度量…
前面的一篇文章——数据仓库的多维数据模型中已经简单介绍过多维模型的定义和结构,以及事实表(Fact Table)和维表(Dimension Table)的概念.多维数据模型作为一种新的逻辑模型赋予了数据新的组织和存储形式,而真正体现其在分析上的优势还需要基于模型的有效的操作和处理,也就是OLAP(On-line Analytical Processing,联机分析处理). 数据立方体 关于数据立方体(Data Cube),这里必须注意的是数据立方体只是多维模型的一个形象的说法.立方体其本身只有三…
在Bi领域,cube是一个非常重要的概念,是多维立方体的简称,主要是用于支持联机分析应用(OLAP),为企业决策提供支持.Cube就像一个坐标系,每一个Dimension代表一个坐标系,要想得到一个一个点,就必须在每一个坐标轴上取得一个值,而这个点就是Cube中的Cell. 如下图: Cube是联机分析的关键.他们是一种多维结构,包含原始事实数据.聚合数据,这些数据聚合允许用户快速进行复杂的查询,Mdx语言就应用它更是如鱼得水. Cube包含两个基本概念:维度和度量 维度(Dimension):…
这是我在2015年高德负责P6晋升评审为团队成员准备的要点,整理下. 1. 数据仓库难点 1.1 分布式OLAP设计与选型 传统BI 友盟,Talking Data 启明星 keylin phoniex ocean base garuda drds impala drill 框架优劣,实现方式,性能对比 1.2 分布式OLAP优势 支持ad-hoc 上卷,下钻,切片,切块 数据端开发迅速 1.3 分布式OLAP 难点 海量数据聚合 要求RT可用 阿里生态系统限制 时间紧迫 1.4 分布式OLAP…
产品与服务 - 商务智能 目前,商业智能产品及解决方案大致可分为数据仓库产品.数据抽取产品.OLAP产品.展示产品.和集成以上几种产品的针对某个应用的整体解决方案     商业智能是什么? 简而言之,它是能够帮助用户对自身业务经营做出正确明智决定的工具.一般现代化的业务操作,通常都会产生大量的数据,如订单.库存.交易帐目.通话记录.及客户资料等.如何利用这些数据增进. 对业务情况的了解,帮助我们在业务管理及发展上作出及时.正确的判断,也就是说,怎样从业务数据中提取有用的信息,然后根据这些信息来采…
OLTP和OLAP 传统的数据库系统都是OLTP,只能提供数据原始的操作.不支持分析工作. OLTP系统::执行联机事务和查询处理.一般超市进销存系统,功能:注册,记账,库存和销售记录等等, OLAP系统:数据分析与决策服务,组织不同格式数据,满足不同用户需求. 区别: 面向性.OLTP面向顾客,就是操作员,如超市收银员,银行柜台人员.OLAP面向市场,用于数据分析,分析人员包括数据分析员,做出决策的业务经理,或者策略制定部分. 数据内容:OLTP当前数据.OLAP历史数据的汇总与聚集. 数据库…
本篇文章就概念.工作机制.数据备份.优势与不足4个方面详细介绍了Apache Kylin. Apache Kylin 简介 1. Apache kylin 是一个开源的海量数据分布式预处理引擎.它通过 ANSI-SQL 接口,提供基于 hadoop 的超大数据集(TB-PB 级)的多维分析(OLAP)功能. 2. kylin 可实现超大数据集上的亚秒级(sub-second latency)查询. 1)确定 hadoop 上一个星型模式的数据集. 2)构建数据立方体 cube. 3)可通过 OD…
原帖地址:http://blog.csdn.net/sgtzzc/archive/2009/10/10/4649770.aspx [前言] 昨天论坛的SQL Server大版新增了一个BI板块,大家讨论得热火朝天,由于此前因为客户环境的问题,一直在使用sql 2000,没怎么关注这一块的东西,最近刚好要做购物篮的分析,所以到网上搜集了一些资料.为了跟大家保持“步调一致”,也写点或转点东西出来,和大家一起学习和分享. 这是很好的BI入门资料,对于还不知道BI是什么,为什么要搞BI,以及BI能做什么…
企业中常常会出现这样一幕幕尴尬的场景: 企业的决策人员需要从不同的角度来审视业务,协助他们分析业务,例如分析销售数据,可能会综合时间周期.产品类别.地理分布.客户群类等多种因素来考量.IT人员在每一个分析角度上都建了一张报表.然而,决策人员需要更多的分析数据,他们需要在各个角度不同组合上再生成报表,IT人员就需要大量的时间来制作报表.IT人员表示终于可以喘口气的时候,决策者又有了新的想法,得了,再做报表吧.为了避免这种尴尬的情况,多维数据库(Cube)的构建便应运而生. Cube,即多维数据库,…
以前介绍了几个基本工具:saiku 和 Schema Workbench,算是入门级别的了解多维报表,如果要继续深入,需要深入了解如下几个概念: 1.OLAP 联机分析处理,和他对应的是OLTP(联机事务处理). OLTP:做为一个开发人员,OLTP是最常用的,甚至都不需要理解这个概念!比如各种门票销售系统.付款系统等等.这些系统对相应速度要求特别高 OLAP:主要用于分析和决策,是数据仓库的主要应用.比如:渠道A在2015-10-01给产品B带来多少pv.uv.订单.销售额等数据,这就对分析的…