版权声明:本文为博主原创文章,未经博主同意不得转载。 https://blog.csdn.net/wl101yjx/article/details/31015367

本文简要总结以下两个问题,旨在高速理解“数据仓库”

1、什么是“数据仓库”?

2、“数据仓库”与“数据库”的差别?

以下做详细阐述:

1、什么是“数据仓库”?

“一个数据仓库通常是一个面向主题的集成的与时间相关不可改动的(能够加入)数据集合。它用于对管理决策过程的支持。”

此句话包括几个关键点:面向主题的、集成的、与时间相关的、不可改动的。详细含义欢迎留言交流。

2、数据仓库与数据库的主要差别 

企业的数据处理大致分为两类:

一类是操作型处理。也称为联机事务处理,它是针对详细业务在数据库联机的日常操作,通常对少数记录进行查询、改动。

还有一类是分析型处理,一般针对某些主题的历史数据进行分析,支持管理决策。

 主要差别例如以下:

(1)数据库是面向事务的设计。数据仓库是面向主题设计的。

(2)数据库一般存储在线交易数据,数据仓库存储的通常是历史数据。

(3)数据库设计是尽量避免冗余,一般採用符合范式的规则来设计;数据仓库在设计是有意引入冗余,採用反范式的方式来设计。

(4)数据库是为捕获数据而设计。数据仓库是为分析数据而设计。它的两个主要的元素是维表和事实表。

维是看问题的角度,比方时间,部门。维表放的就是这些东西的定义。事实表里放着要查询的数据。同一时候有维的ID。

        单从概念上讲,有些晦涩。不论什么技术都是为应用服务的。结合应用能够非常easy地理解。以银行业务为例。数据库是事务系统的数据平台。客户在银行做的每笔交易都会写入数据库,被记录下来,这里。能够简单地理解为用数据库记帐。

数据仓库是分析系统的数据平台。它从事务系统获取数据,并做汇总、加工,为决策者提供决策的根据。

比方。某银行某分行一个月发生多少交易,该分行当前存款剩余金额是多少。

假设存款又多。消费交易又多。那么该地区就有必要设立ATM了。

  显然。银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性。客户存一笔钱须要几十秒是无法忍受的,这就要求数据库仅仅能存储非常短一段时间的数据。

而分析系统是事后的。它要提供关注时间段内全部的有效数据。这些数据是海量的。汇总计算起来也要慢一些,可是,仅仅要能够提供有效的分析数据就达到目的了。

附“数据仓库”示意图例如以下:

简要总结 数据仓库VS数据库的更多相关文章

  1. 数据仓库 VS 数据库

    数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented).集成的(Integrate).相对稳定的(Non-Volatile).反映历史变化(Time Varian ...

  2. 【clickhouse专栏】数据库、数据仓库之间的区别与联系

    从本篇文章开始,笔者打算写一个系列的<clickhouse专栏>,其全称是Click Stream,Data WareHouse,简称ClickHouse.从其全称中的"Data ...

  3. 数据库技术丛书:SQL Server 2016 从入门到实战(视频教学版) PDF

    1:书籍下载方式: SQL Server2016从入门到实战 PDF 下载  链接:https://pan.baidu.com/s/1sWZjdud4RosPyg8sUBaqsQ 密码:8z7w 学习 ...

  4. 对Oracle 、SQL Server、MySQL、PostgreSQL数据库优缺点分析

    对Oracle .SQL Server.MySQL.PostgreSQL数据库优缺点分析 Oracle Database Oracle Database,又名Oracle RDBMS,或简称Oracl ...

  5. Oracle 数据库安装

    下载 www.oracle.com ->Downloads -> Oracle Database 安装: 解压到同一文件夹下 仅安装数据库软件 单实例数据库安装 企业版 oracle基目录 ...

  6. 数据仓库之ETL漫谈

    ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取.转换和加载. 大多数据仓库的数据架构可以概括为: 数据源-->ODS(操作型数据存储)--& ...

  7. (转载)MySQL默认INFORMATION_SCHEMA,MySQL,TEST三个数据库用途

    (转载)http://www.45it.com/database/201204/29390.htm 本文简要说明了MySQL数据库安装好后自带的INFORMATION_SCHEMA,MySQL,TES ...

  8. MySQL默认INFORMATION_SCHEMA,MySQL,TEST三个数据库用途

    本文简要说明了MySQL数据库安装好后自带的INFORMATION_SCHEMA,MySQL,TEST三个数据库的用途. 第一个数据库INFORMATION_SCHEMA:提供了访问数据库元数据的方式 ...

  9. WebSphere--用户简要表

     Application Server 含有 com.ibm.servlet.personalization.userprofile 软件包中的类,这些类使维护关于 Web 站点访问者的持久信息和利用 ...

随机推荐

  1. java 并发(六) --- 锁

          阅读前阅读以下参考资料,文章图片或代码部分来自与参考资料 概览 一张图了解一下java锁. 注 : 阻塞将会切换线程,切换内核态和用户态,是比较大的性能开销 各种锁 为什么要设置锁的等级 ...

  2. SpringBoot 开启debug

    项目基于gradle ,今天想断点debug一下springboot,查阅资料后,纪录一下步骤. 创建Remote 创建gradle.properities 在当前项目下创建gradle.proper ...

  3. Mybatis插入、查询自定义的数据类型的方式

    1.首先创建JavaBean对象 package com.zuo.Mybatis.bean; public class PhoneNumber { private String countryCode ...

  4. ReentrantReadWriteLock简介

    对象的方法中一旦加入synchronized修饰,则任何时刻只能有一个线程访问synchronized修饰的方法.假设有个数据对象拥有写方法与读方法,多线程环境中要想保证数据的安全,需对该对象的读写方 ...

  5. What is the relation of theme and it's derived theme.

    You know, a theme can derive from other theme in two ways: xx.xxx implicit way and parent="xxx& ...

  6. Cocos2d-js 开发记录:基本图形绘制

    做着做着想要用基本绘图函数画个矩形,在cocos2d-js 3.0里可以使用DrawNode var dn = new cc.DrawNode(); var ltp = cc.p(0, 32); va ...

  7. CentOS 7运维管理笔记(7)----Apache 基于端口的虚拟主机配置

    如果一台服务器只有一个IP或需要通过不同的端口访问不同的虚拟主机,可以使用基于端口的虚拟主机配置. (1) 在虚拟机的CentOS7服务器上配置 eth0:4 为192.168.1.214: (2) ...

  8. Python爬虫教程-32-Scrapy 爬虫框架项目 Settings.py 介绍

    本篇介绍项目开发的过程中,对 Setting 文件的配置和使用 Python爬虫教程-32-Scrapy 爬虫框架项目 Settings.py 介绍 settings.py 文件的使用 想要详细查看 ...

  9. ES6入门——正则的扩展

    1.RegExp构造函数 在ES5中,RegExp构造函数的参数有两种情况.第一种情况是参数是字符串,这时第二个参数表示正则表达式的修饰符:第二种情况是,参数是一个正则表示式,这时会返回一个原有正则表 ...

  10. Python学习系列----第三章 控制流

    在python中有三种控制流语句,分别是: if.for.while. 2.1 if 语句 if 语句用来检验一个条件,如果条件为真,我们运行一块语句(称为 if-块),否 则我们处理另外一块语句(称 ...