ODS设计】的更多相关文章

1.数据调研 2.确定数据范围 需要把上端应用需求与ODS数据范围进行验证,以确保应用所需的数据都已经从业务系统中抽取出来,并且得到了很好的组织,以ER模型表示数据主题关系 3.根据数据范围进行进一步的数据分析和主题定义 把第一步生成的每个ER图中的实体进行分解,分解的结果仍以ER表示为佳 4.定义主题元素 定义主题.粒度.维.度量.存储期限 a.定义维的概念特性:     维名称,名称应该能够清晰表示出这个维的业务含义.     维成员,也就是这个维所代表的具体的数据,     维层次,维成员…
这两天接触到ODS,开始很纳闷,有了DW(Data Warehouse)干嘛还要ODS(Operational Data Store),于是不查不知道,一查吓一跳,这里面还有这么多道道,这里总结一下,当作学习了. 简单说: DW 数据仓库存储是一个面向主题的,反映历史变化数据,用于支撑管理决策. ODS 操作型数据存储,存储的是当前的数据情况,给使用者提供当前的状态,提供即时性的.操作性的.集成的全体信息的需求. ODS作为数据库到数据仓库的一种过渡形式,与数据仓库在物理结构上不同,能提供高性能…
这两天看书,发现了和数据仓库相关的还有一个叫ODS的概念,它是企业级的全局数据库,用于提供集成的,企业级一致的数据,包含如何从各个子系统中向ODS抽取数据以及面向主题的角度存储数据. 它和数据仓库的主要区别: 数据仓库是面向主题的.集成的.随时间变化的.非易失的.用于进行战略型决策的数据集合. ODS是一个面向主题的.集成的.可变的.当前的细节数据集合,用于支持企业对于即时性的.操作性的.集成的全体信息的需求.常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一. 在Kimball的<<数据…

ODS

一般在带有ODS的系统体系结构中,ODS都设计为如下几个作用: 1.在业务系统和数据仓库之间形成一个隔离层 一般的数据仓库应用系统都具有非常复杂的数据来源,这些数据存放在不同的地理位置.不同的数据库.不同的应用之中,从这些业务系统对数据进行抽取并不是一件容易的事.因此,ODS用于存放从业务系统直接抽取出来的数据,这些数据从数据结构.数据之间的逻辑关系上都与业务系统基本保持一致,因此在抽取过程中极大降低了数据转化的复杂性,而主要关注数据抽取的接口.数据量大小.抽取方式等方面的问题. 2.转移一部分…
整体结构 在具体分析数据仓库之前先看下一下数据中心的整体架构以及数据流向   数据中心整体架构.png DB 是现有的数据来源,可以为mysql.SQLserver.文件日志等,为数据仓库提供数据来源的一般存在于现有的业务系统之中. ETL的是 Extract-Transform-Load 的缩写,用来描述将数据从来源迁移到目标的几个过程: Extract,数据抽取,也就是把数据从数据源读出来. Transform,数据转换,把原始数据转换成期望的格式和维度.如果用在数据仓库的场景下,Trans…
ODS (操作数据存储) 编辑 讨论 操作数据存储ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分,也被称为贴源层.ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的.集成的.当前或接近当前的.不断变化的”数据.   中文名 操作数据存储 外文名 Operational Data Store 用    途 业务系统 功    能 存储.查询以及形成隔离层 目录 1 作用 2 设计方法 3 设计指南 ▪ 数据调研 ▪ 数据范围 ▪ 主题元…
初识ETL 概念 ETL即Extract-Transform-Load.目的是将分散.凌乱.异质的数据整合在一起,为决策提供分析数据,是BI项目(Business Intellifence)项目中重要的一个环节,占据1/3左右时间.难点在于清洗转换数据,最终一般存入DW(Data Warehousing)中. 常用的实现方法有 工具:(如Qracle的OWB,SQL Server 2000 的DTS),工具么,肯定是方便但不灵活. SQL:编码实现,灵活但复杂 SQL与工具结合:结合两者的优点…
转载http://bigdata.51cto.com/art/201710/554810.htm 一.文章主题 本文主要讲解数据仓库的一个重要环节:如何设计数据分层!其它关于数据仓库的内容可参考之前的文章. 本文对数据分层的讨论适合下面一些场景,超过该范围场景 or 数据仓库经验丰富的大神就不必浪费时间看了. 数据建设刚起步,大部分的数据经过粗暴的数据接入后就直接对接业务. 数据建设发展到一定阶段,发现数据的使用杂乱无章,各种业务都是从原始数据直接计算而得. 各种重复计算,严重浪费了计算资源,需…
ETL是BI项目最重要的一个环节,通常情况下ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败.ETL也是一个长期的过程,只有不断的发现问题并解决问题,才能使ETL运行效率更高,为项目后期开发提供准确的数据. ETL的设计分三部分:数据抽取.数据的清洗转换.数据的加载.在设计ETL的时候也是从这三部分出发.数据的抽取是从各个不同的数据源抽取到ODS中(这个过程也可以做一些数据的清洗和转换),在抽取的过程中需要挑选不同的抽取方法,尽可能的提高ETL的运行效率.ETL三个部…
浅析ODS与EDW 关系 刘智琼 (中国电信集团广州研究院广州510630) 摘要 本文重点介绍了企业运营数据仓储(ODS)和企业数据仓库(EDW )的概念,并对ODS与EDW 之间的关系,包括两者相同点与不同点进行了详尽的对比与阐述,文章还对业界公认的ODS和EDW 两种不同建设方法也分别进行了说明,并给出了作者认为合理的建设方法. 1 前言 ODS(运营数据仓储)与EDW(企业数据仓储)都是中国电信企业数据架构的重要组成部分,它们一起构成企业统一数据平台.2007年大多数省级电信公司都陆续启…