数据仓库搭建——Inmon与Kimball】的更多相关文章

一.简介 1.1 历史 搞数据仓库这么久,实践中发现首先搭建数据集市,还是清洗数据之后,直接进入数据立方体(形成维度表和实施表)形成核心数据仓库层,是个选择题... 随后发现这其实涉及到了数据仓库的历史问题,是采用Inmon建模还是采用Kimball建模?甚至有人称之为数据仓库界的宗教之争.下面我说一下自己的理解: 1.2 Inmon 2000年5月,W.H.Inmon在DM Review杂志上发表一篇文章,正是揭示了他的企业信息化工厂的特点.下图是我理解的企业信息化工厂架构图: 数据获取到之后…
Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为“数据仓库之父”.Inmon的<数据仓库>和Kimball的<数据仓库工具箱>都是此领域的经典之作.后来人把这两人的数据仓库思想总结为“Inmon理论”和“Kimball理论”.他们的思想有共同点,也有不同点.下面按照我的想法总结一下,理解如有偏颇,还请多多指正. 1. 共同点 (1)均极力推崇数据仓库,认为从OLTP到BI分析之间建立数据仓库是很有必要的: (2)均认为数据仓库的…
对于数据仓库体系结构的最佳问题,始终存在许多不同的看法,甚至有人把Inmon和Kimball之争称之为数据仓库界的“宗教战争”,那么本文就通过对两位提倡的数据仓库体系和市场流行的另一种体系做简单描述和比较,不是为了下定义那个好,那个不好,而是让初学者更明白两位数据仓库鼻祖对数据仓库体系的见解而已. 首先,我们谈Inmon的企业信息化工厂. 2000年5月,W.H.Inmon在DM Review杂志上发表一篇文章,里面写到一句话“……如果明天非得设计一个数据集市,我将不考虑使用其他的方法”:正是揭…
为了方便公司的数据分析平台的独立运行和数据挖掘的探索,今年上半年在公司搭建了支持数据平台和数据挖掘的数据仓库:现就数据仓库的创建工作总结如下,供大家参考: 首先介绍下数据仓库搭建的缘由: 公司创建两年,用户量不多,也有几十万吧,就我来的时候,公司功能性平台基本上都有,例如:用户管理平台.订单管理平台.财务管理平台.运营管理平台.客服管理平台.系统管理平台等相关功能平台算齐全,基本能满足功能,但是数据平台还没有,老板.运营.市场,及相关人员对相关数据指标的了解还是通过看每周发上来的数据报表,这样就…
数据仓库主要有四种架构,Kimball的DW/BI架构.独立数据集市架构.辐射状企业信息工厂Inmon架构.混合Inmon与Kimball架构.不过不管是那种架构,基本上都会使用到维度建模. <b>Kimball的DW/BI架构</b>,可以参考这篇文章 数据仓库(4)基于维度建模的KimBall架构. <b>独立数据集市架构</b>,采用这种架构的数据仓库,数据以部门为基础来部署,不考虑企业级别的信息共享和集成.也就是各个部门各自按照需要,各自在数据源同步…
摘要: 2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的“阿里云栖开发者沙龙大数据技术专场”走近北京联合大学,本次技术沙龙上,人人车大数据平台负责人吴水永从人人车数据平台的整体架构.如何基于阿里云打造一个轻盈的数据平台以及人人车企业基于阿里云技术开发的BI数据报表平台等三个方面进行了精彩分享. 以下内容根据演讲视频以及PPT整理而成. 一.人人车数据平台 快速搭建,一年时间完成6大平台的搭建 基于阿里云平台上成熟的技术,人人车企业只用了一年时间便实现了6大数…
从此处转载 http://blog.sina.com.cn/s/blog_615f9dba0100f67p.html 比尔·恩门(Bill Inmon),被称为数据仓库之父,最早的数据仓库概念提出者,在数据库技术管理与数据库设计方面,拥有逾35年的经验.他是“企业信息工厂”的合作创始人与“政府信息工厂”的创始人. 比尔·恩门的思想与见识在所有重量级的计算机协会.许多产业会议.技术研讨会上,都博得了无比的敬重.他写过650多篇文章,大多发布在世界最知名的IT刊物里,DMReview杂志每期都有恩门…
介绍 之前在去哪儿做数据RD,今年来到美团做数据RD,碰巧都是门票方向(现在去哪儿叫度假,美团叫境内),下面都是基于这两个部门的对比 相同点 都有独立的数据团队,老大都重视数据,主要开发语言都是SQL,都用jira管理任务 不同点 一.团队人数 去哪儿数据RD3-5个人,美团数据RD10-13人.去哪儿有3-5个产品/分析师,数据产品设计.数据分析什么都做.美团有专业的商分团队.BI团队和数据产品数据分析人员,共15-20人 二.业务划分 去哪儿各个事业部需要独自承接数据同步.传输.清洗.仓库.…
当数据仓库搭建好后,我们就可以通过sqlserver的管理工具查看服务器上的数据集了.但是这样挺不方便的,如果要远程访问,那么就可以通过http来连接数据仓库.要配置数据仓库http连接非常的简单.如果是sqlserver 2000的版本,那么可以找到Msolap.asp这个文件,通过配置到IIS站点中就可以连接了.不过如果是sqlserver 2005之后的版本,这个方法就不适用了.这时的操作步骤是,找到sqlserver安装文件夹中的isapi文件夹,把里面的文件包括文件夹全部复制到我们ii…
0.TIDB优势 1.和MySql相比,具备OLAP能力.省去了很多数据仓库搭建成本和学习成本.这在业务层是非常受欢迎的.可以在其他分库分表业务中,通过 syncer 同步,进行合并,然后进行统计分析2.数据量增长极快的OLTP场景,这些数据库的数据在一年内轻松达到数百亿量级.TiDB 的所有特性都非常契合这种海量高并发的 OLTP 场景. 3.弥补单机容量上限,支持水平扩展,无限扩容存储 4.传统 Sharding 方案查询维度单一,TIDB支持多维度查询 5.支持在线 DDL 这个特性特别适…