简要总结 数据仓库VS数据库
版权声明:本文为博主原创文章,未经博主同意不得转载。 https://blog.csdn.net/wl101yjx/article/details/31015367
本文简要总结以下两个问题,旨在高速理解“数据仓库”
1、什么是“数据仓库”?
2、“数据仓库”与“数据库”的差别?
以下做详细阐述:
1、什么是“数据仓库”?
“一个数据仓库通常是一个面向主题的、集成的、与时间相关且不可改动的(能够加入)数据集合。它用于对管理决策过程的支持。”
此句话包括几个关键点:面向主题的、集成的、与时间相关的、不可改动的。详细含义欢迎留言交流。
2、数据仓库与数据库的主要差别
企业的数据处理大致分为两类:
一类是操作型处理。也称为联机事务处理,它是针对详细业务在数据库联机的日常操作,通常对少数记录进行查询、改动。
还有一类是分析型处理,一般针对某些主题的历史数据进行分析,支持管理决策。
主要差别例如以下:
(1)数据库是面向事务的设计。数据仓库是面向主题设计的。
(2)数据库一般存储在线交易数据,数据仓库存储的通常是历史数据。
(3)数据库设计是尽量避免冗余,一般採用符合范式的规则来设计;数据仓库在设计是有意引入冗余,採用反范式的方式来设计。
(4)数据库是为捕获数据而设计。数据仓库是为分析数据而设计。它的两个主要的元素是维表和事实表。
维是看问题的角度,比方时间,部门。维表放的就是这些东西的定义。事实表里放着要查询的数据。同一时候有维的ID。
单从概念上讲,有些晦涩。不论什么技术都是为应用服务的。结合应用能够非常easy地理解。以银行业务为例。数据库是事务系统的数据平台。客户在银行做的每笔交易都会写入数据库,被记录下来,这里。能够简单地理解为用数据库记帐。
数据仓库是分析系统的数据平台。它从事务系统获取数据,并做汇总、加工,为决策者提供决策的根据。
比方。某银行某分行一个月发生多少交易,该分行当前存款剩余金额是多少。
假设存款又多。消费交易又多。那么该地区就有必要设立ATM了。
显然。银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性。客户存一笔钱须要几十秒是无法忍受的,这就要求数据库仅仅能存储非常短一段时间的数据。
而分析系统是事后的。它要提供关注时间段内全部的有效数据。这些数据是海量的。汇总计算起来也要慢一些,可是,仅仅要能够提供有效的分析数据就达到目的了。
附“数据仓库”示意图例如以下:
简要总结 数据仓库VS数据库的更多相关文章
- 数据仓库 VS 数据库
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented).集成的(Integrate).相对稳定的(Non-Volatile).反映历史变化(Time Varian ...
- 【clickhouse专栏】数据库、数据仓库之间的区别与联系
从本篇文章开始,笔者打算写一个系列的<clickhouse专栏>,其全称是Click Stream,Data WareHouse,简称ClickHouse.从其全称中的"Data ...
- 数据库技术丛书:SQL Server 2016 从入门到实战(视频教学版) PDF
1:书籍下载方式: SQL Server2016从入门到实战 PDF 下载 链接:https://pan.baidu.com/s/1sWZjdud4RosPyg8sUBaqsQ 密码:8z7w 学习 ...
- 对Oracle 、SQL Server、MySQL、PostgreSQL数据库优缺点分析
对Oracle .SQL Server.MySQL.PostgreSQL数据库优缺点分析 Oracle Database Oracle Database,又名Oracle RDBMS,或简称Oracl ...
- Oracle 数据库安装
下载 www.oracle.com ->Downloads -> Oracle Database 安装: 解压到同一文件夹下 仅安装数据库软件 单实例数据库安装 企业版 oracle基目录 ...
- 数据仓库之ETL漫谈
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取.转换和加载. 大多数据仓库的数据架构可以概括为: 数据源-->ODS(操作型数据存储)--& ...
- (转载)MySQL默认INFORMATION_SCHEMA,MySQL,TEST三个数据库用途
(转载)http://www.45it.com/database/201204/29390.htm 本文简要说明了MySQL数据库安装好后自带的INFORMATION_SCHEMA,MySQL,TES ...
- MySQL默认INFORMATION_SCHEMA,MySQL,TEST三个数据库用途
本文简要说明了MySQL数据库安装好后自带的INFORMATION_SCHEMA,MySQL,TEST三个数据库的用途. 第一个数据库INFORMATION_SCHEMA:提供了访问数据库元数据的方式 ...
- WebSphere--用户简要表
Application Server 含有 com.ibm.servlet.personalization.userprofile 软件包中的类,这些类使维护关于 Web 站点访问者的持久信息和利用 ...
随机推荐
- MySQL wait_timeout参数设置与网上常见错误小纠
discard connection com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link fail ...
- C#操作Redis Hash数据表
/// <summary> /// Redis Hash /// </summary> public static void Redis_Hash() { RedisClien ...
- isnull函数
isnull是判断一个字段是否为空值,返回一个特定的值 列: isnull(a,0) 如果a字段有空值返回0 没有空值就返回a的本身 isnull(a,1)=2 字段a有空值返回1,判断isnull ...
- 模拟Springboot一:(零xml配置搭建SSM项目)
在spring官网文档中无论是spring的基础文档,还是spring-mvc文档都推荐我们使用javaconfig的方式来搭建项目 间接说明 (优点:javaconfig配置>xml配置) 其 ...
- 六、Spring之DI的Bean的作用域
Spring提供“singleton”和“prototype”两种基本作用域,另外提供“request”.“session”.“global session”三种web作用域:Spring还允许用户定 ...
- hdu 4055 Number String(递推DP)
给一个只含‘I','D','?'三种字符的字符串,I表示当前数字大于前面的数字,D表示当前的数字小于前面一位的数字,?表示当前位既可以小于又可以大于. 问1~n的排列中有多少个满足该字符串. http ...
- MySql中存储引擎MyISAM与InnoDB区别于选择
InnoDB: 支持事务处理等 不加锁读取 支持外键 支持行锁 不支持FULLTEXT类型的索引 不保存表的具体行数,扫描表来计算有多少行 DELETE 表时,是一行一行的删除 InnoDB 把数据和 ...
- 一台电脑启动多个tomcat
原文 http://dong-shuai22-126-com.iteye.com/blog/1763666 如果现在一台机器上已经部署了一个tomcat服务,无论这个tomcat是否已经注册为服务了, ...
- <Android 应用 之路> MPAndroidChart~LineChart
简介 MPAndroidChart是PhilJay大神给Android开发者带来的福利.MPAndroidChart是一个功能强大并且使用灵活的图表开源库,支持Android和IOS两种,这里我们暂时 ...
- 基础架构之日志管理平台搭建及java&net使用
在现代化的软件开发流程中,日志显得非常的重要,不可能再零散的游离在各个项目中,等查看日志的时候再登录服务器去到特定的目录去查看,这显然很繁琐且效率低下,所有整合一套日志管理平台,也显得非常重要,这篇文 ...