以阿里云的maxcompute的数据仓库架构为例,

从上往下定义,

dwp的数据,来源是dws+dim,最主要是dws。这里不讨论dim的作用。

dws的数据来源于dwd。

dwd的数据来源于ods。

--------

接下来我们定义原子指标和派生指标。

派生指标定义在dws层。并且绑定原子指标。所有的应用数据由派生指标去group by。

原子指标定义在dwd层+虚拟层。原子指标绑定一个dwd的度量值,但是有可能会有计算,所以不完全在dwd,运行的时候可能会进行计算。称为一个虚拟的层。

当然可以把这个虚拟层做出来,专门做一层原子指标层。

这个时候我们的指标管理系统里面应该有以下东西:

  指标名称  指标来源 指标口径
原子指标 可以与度量值一致,也可以不一致 绑定dwd的表名和字段

1.和绑定的dwd的度量值完全对应

2.需要一点计算,录入计算逻辑

派生指标 修饰词+原子指标名称+时间周期 绑定一个原子指标   

①修饰词:作为where过滤的字段

②时间周期:近7天,近一个月等

③聚合操作:平均,求和等

③聚合维度,也可以不录,在模型管理里录

应用指标 同环比+修饰词+派生指标 绑定一个派生指标

①聚合的维度:派生指标所在表的字段

②可能有一些简单的过滤。

③可能会有一些同环比的计算

绝对不允许有字段计算,如加减乘除,if转化等,如果有,说明逻辑没有下沉。

举个例子:

应用指标需要:当月人流量大于2w次并且支付渠道为支付宝的的平均订单金额净增长,维度:每一个城市

拥有的业务过程:订单表。门店人流量表。

  名称   来源 口径
原子指标 订单金额 交易表:支付金额,退款金额 支付金额-退款金额
派生指标

当月人流量大于2w次

并且支付渠道为支付宝的的平均订单金额

订单金额

①修饰词:

where 支付渠道=支付宝

having 月人流量>2w

②时间周期

where 订单时间是一个月

③聚合操作:平均

③维度:城市,品类

(聚合维度比业务指标更宽)

应用指标

当月人流量大于2w次

并且支付渠道为支付宝的的平均订单金额净增长

当月人流量大于2w次

并且支付渠道为支付宝的的平均订单金额

①聚合维度:城市

②环比计算,当月减上月

以上将一个应用指标的计算逻辑沉淀到不同的层次中的指标管理方式,实现了从度量值到最后应用指标的统一,再加上术语管理系统,

可以解决指标同名不同义,同义不同名的口径问题。称之为one data,即一个应用指标有且只有唯一的计算逻辑。

----------------------------------------------------------------------------------------

《模型的作用》

dws的表可以称之为派生指标的模型。

一个派生指标可以有不同的维度。比如近7月,近一个月,城市品类的,城市商圈的,所以 派生指标:模型 = 1:n

可以在录入不同维度的派生指标时,

①当做是不同的派生指标,将维度当做口径记录下来

②当做是同一个派生指标,建设不同维度的模型(表),绑定这个派生指标。如果这么做,应用指标绑定的将不是派生指标,而是dws模型里的字段。

----------------------------------------------------------------------------------------

《是否可以将度量值认为是原子指标》

原子指标代表的是指标的最底层,是服务于指标系统的。度量值代表的是业务发生的过程中产生的数据,是记录业务客观现象的。

虽然两者的字段有很多重合的地方,最好将原子指标重新定义,防止指标管理体系和数仓公共表建设过于耦合而增大统一指标口径的难度。

----------------------------------------------------------------------------------------

《派生指标和应用指标的区别》

应用指标的来源是派生指标,不一定要计算同环比,很多时候名称是一模一样的。

他们的区别在于维度。

dws为了满足更多的应用指标的计算,维度会更多 更细。

打个比方,维度为城市 品类 商圈 门店等级 的订单金额,可以上卷 城市维度,品类维度,商圈维度,城市+品类维度,等多达15个组合的应用指标。

这样BI计算应用指标的时候,就只要根据自己关心的维度做group by即可,非常简单方便。

简单设计一个onedata指标管理体系的更多相关文章

  1. 学生与部门管理app-产品功能与界面的简单设计

    学生与部门管理app-产品功能与界面的简单设计 1. 结对成员学号 我:********* 大佬:*******10 2. 需求分析(NABCD模型) 2.1 N-需求 各个部门在开学初占据学校青春广 ...

  2. Tomcat详解系列(1) - 如何设计一个简单的web容器

    Tomcat - 如何设计一个简单的web容器 在学习Tomcat前,很多人先入为主的对它的认知是巨复杂的:所以第一步,在学习它之前,要打破这种观念,我们通过学习如何设计一个最基本的web容器来看它需 ...

  3. 设计一个简单的,低耗的能够区分红酒和白酒的感知器(sensor)

    学习using weka in your javacode 主要学习两个部分的代码:1.过滤数据集 2 使用J48决策树进行分类.下面的例子没有对数据集进行分割,完全使用训练集作为测试集,所以不符合数 ...

  4. 180626-Spring之借助Redis设计一个简单访问计数器

    文章链接:https://liuyueyi.github.io/hexblog/2018/06/26/180626-Spring之借助Redis设计一个简单访问计数器/ Spring之借助Redis设 ...

  5. 设计一个简单的devops系统

    前言 公司设计的RDMS挺好用的,我也照猫画虎简单的设计一个DevOps系统,与大家分享,不足之处欢迎拍砖,以免误人子弟 前置条件 gitlab gitlab-runner k8s 1. gitlab ...

  6. 【python免费代码】设计一个简单的学生信息管理系统

    文章目录 前言 一.理解 二.部分截图展示 三.代码 四.总结 前言 设计一个简单的学生信息管理系统,实现以下功能(bug) : 录入学生信息,信息以文件方式存储 以学生学号或者学生姓名为条件查询该学 ...

  7. 如何设计一个简单的C++ ORM

    2016/11/15 "没有好的接口,用C++读写数据库和写图形界面一样痛苦" 阅读这篇文章前,你最好知道什么是 Object Relation Mapping (ORM) 阅读这 ...

  8. ERP设计之系统基础管理(BS)-日志模块设计(转载)

    原文地址:8.ERP设计之系统基础管理(BS)-日志模块设计作者:ShareERP 日志模块基本要素包括: 用户会话.登录.注销.模块加载/卸载.数据操作(增/删/改/审/弃/关等等).数据恢复.日志 ...

  9. 如何一步一步用DDD设计一个电商网站(九)—— 小心陷入值对象持久化的坑

    阅读目录 前言 场景1的思考 场景2的思考 避坑方式 实践 结语 一.前言 在上一篇中(如何一步一步用DDD设计一个电商网站(八)—— 会员价的集成),有一行注释的代码: public interfa ...

随机推荐

  1. X-Deep Learning功能模块

    X-Deep Learning功能模块 特征体系 样本 特征 网络 数据准备 样本格式 使用DataReader读取数据 自定义python reader 定义模型 稀疏部分 稠密部分 优化器 训练模 ...

  2. QT基本数据类型

    因为Qt是一个C++框架, 因此C++中所有的语法和数据类型在Qt中都是被支持的, 但是Qt中也定义了一些属于自己的数据类型, 下边给大家介绍一下这些基础的数类型. QT基本数据类型定义在#inclu ...

  3. 再看 Java 中的单例

    此前面试遇到了单例问题,本以为已经背的滚瓜烂熟,没想到被问单例如何避免被反射和序列化破坏,虽然后来还是等到了通知,但还是复习一下单例的实现方式,并学习防止反射和序列化破坏的手段. 基本实现方式 其他相 ...

  4. jd一面面经

    1.讲一下hashmap原理. 2.concurrentHashMap的原理.concurrentHashMap和hashmap有什么不同? 3.synchnized底层实现?讲讲AQS 4.sync ...

  5. NX二次开发-通过3x3矩阵获取XYZ轴矢量

    函数:UF_CSYS_ask_wcs() 函数说明:通过3x3矩阵获取XYZ轴矢量 用法: 1 #include <uf.h> 2 #include <uf_mtx.h> 3 ...

  6. 使用VS code编写C++无法实时检测代码的解决办法

    更新:其实微软是有官方文档配置VS code 的C++的.地址是: https://code.visualstudio.com/docs/cpp 更改工作区后就发现不能再使用VS CODE愉快地写C+ ...

  7. 剑指0ffer59.滑动窗口的最大值

    给定一个数组 nums 和滑动窗口的大小 k,请找出所有滑动窗口里的最大值. 示例: 输入: nums = [1,3,-1,-3,5,3,6,7], 和 k = 3输出: [3,3,5,5,6,7] ...

  8. SCP,SSH应用

  9. 30、LNAP(php和nginx相关优化)

    30.1.php-fpm.conf参数优化: [global] pid = run/php-fpm.pid #php后台运行pid路径 error_log = log/php-fpm.log #php ...

  10. CRM系统不仅给企业带来更多收益而且提升销售效率

    将客户信息记录在CRM系统的数据库中,同时共享沟通数据给售前.售后.SDR等上下游,客户资源还能够按照分配规则分配给适合的销售人员,帮助更快成单.全面使用CRM系统会给企业带来更多业绩. 1.全方位客 ...