数据可视化之DAX篇(一)Power BI时间智能函数如何处理2月29日的?
https://zhuanlan.zhihu.com/p/109964336
今年是闰年,有星友问我,在Power BI中,2月29日的上年同期是怎么计算的?
这是个好问题,正好梳理一下,PowerBI时间智能函数是如何处理不规则日期的对比数据的。
以一个模拟的订单表数据为例,订单日期涵盖了2015年、2016年和2017年,其中2016年是闰年,添加一个相匹配的日期表与之建立关系,
先建立一个基础度量值:
收入 = SUM('订单表'[销售额])
然后通过下面几个示例,来看看几个和2月29日相关的各种数据,是怎么计算的?以及时间智能函数处理闰年的计算逻辑。
2月29日-上年同期
建个上年同期的度量值:
收入 PY = CALCULATE( [收入], SAMEPERIODLASTYEAR('日期表'[日期]) )
把这个度量值放入到矩阵中看看结果:
从上面的数据可以看出,2016年2月29日和28日的上年同期数据都是48000,与2015年2月28日的数据是一样的。
2016年2月28日的上年同期数据是2015年2月28日很正常,那么为什么2016年2月29日的上年同期数据也是2015年2月28日呢?
对于不规则的日期,根据特定的要求和逻辑,可以设计不同的对比方式。比如2015年是没有2月29日的,那么2016年2月29日的上年同期可以设计为空值。而PowerBI的时间智能函数的计算逻辑,是2月29日的上年同期数据为上年2月28日的,换个角度可能更容易理解,就是2月最后一天的数据对比,无论是不是闰年。
并且观察2017年2月28日的上年同期数据,与2016年2月28日的数据一样,这很正常。只是在2017年,找不到这样的日期:它的上年同期数据,可以与2016年2月29日对应。
2月29日-本年累计的上年同期
本年累计以及本年累计的上年同期度量值可以这样写:
收入 YTD = TOTALYTD([收入],'日期表'[日期])
收入 YTD PY = CALCULATE( [收入 YTD], SAMEPERIODLASTYEAR('日期表'[日期]))
计算结果如下:
本年累计的同期对比结果,与上面当日数据的同期对比逻辑是一样的,依然是2016年2月29日的上年同期,是2015年2月28日的数据。
从上图可以看到2017年2月28日上年同期的本年累计是4087000,但是如果看2017年2月份的上年同期本年累计,却是4129000,
也就是说在本年累计的上年同期的计算中,2017年2月28日的数据和2017年2月份的数据是不一致的。
但在月份这个粒度上,2017年2月的上年同期,与2016年2月的数据完全一致,并没有问题。
2月29日-本月累计的上月
需要建本月累计和上月累计的度量值,可以这样写:
收入 MTD = TOTALMTD([收入],'日期表'[日期])
收入 MTD PM = CALCULATE( [收入 MTD], DATEADD('日期表'[日期],-1,MONTH))
结果如下:
在月度环比上,因为每个月都有29号,29号本身的数据没有问题,但在3月30号和3月31号的上月同期计算中,因为2月没有对应的日期,所以都等于2月29日的数据。
关于月度环比,这个很正常,因为即使不是闰年,3月30日和3月31日的上月同期数据,也是都等于2月28日的数据。
在日期维度月度环比的计算上,不只是闰年有2月29日才存在这个问题,其实每年都存在,因为有的月份是31天,有的月份是30天,比如7月31号的上月同期数据就是6月30日的数据。
总结
通过上面几个示例,对时间智能函数的计算逻辑总结如下:
- 日期粒度上的计算,如果没有对应的日期,会自动等于上期最后一天的数据;
- 月份粒度上的计算,是否为闰年,没有任何影响;
- 在本期累计的上期计算中,可能会出现,当月最后一天的累计数与当月的累计数不一致的情况。
以上就是时间智能函数的计算逻辑,其实没有必要担心2月29日的计算问题,就像不用担心某个月是否有31号一样。如果你的业务中,需要的计算逻辑不是时间智能函数的逻辑,应根据需求调整,按通用的DAX函数和规则来写度量值,并不是一定要用时间智能函数。
数据可视化之DAX篇(一)Power BI时间智能函数如何处理2月29日的?的更多相关文章
- 数据可视化之DAX篇(六) 利用ISINSCOPE函数,轻松按层级计算占比
https://zhuanlan.zhihu.com/p/70590683 关于占比,之前有篇文章(利用ALL和ALLSELECTED灵活计算占比)详细介绍了各种情况下占比的度量值. 经星友咨询,还有 ...
- 数据可视化之DAX篇(二十八)Power BI时间序列分析用到的度量值,一次全给你
https://zhuanlan.zhihu.com/p/88528732 在各种经营分析报告中,我们常常会看到YTD,YOY这样的统计指标,这样的数据计算并不难,尤其是在PowerBI中,因为有时间 ...
- 数据可视化之DAX篇(二十七)半累加度量,在Power BI 中轻松处理
https://zhuanlan.zhihu.com/p/96823622 开始半累加的计算之前,我们先看看什么是累加.半累加以及不可累加数据. 在含有大量行的数据表中,各种数据处理语言,包括DAX ...
- 数据可视化之DAX篇(二十六)Power BI度量值:滚动聚合
https://zhuanlan.zhihu.com/p/85996745 上一篇文讲了累计聚合,这篇文章继续讲一下滚动聚合,比如常用的MAT计算,Moving Annual Total,滚动年度总计 ...
- 数据可视化之DAX篇(十二)掌握时间智能函数,同比环比各种比,轻松搞定!
https://zhuanlan.zhihu.com/p/55841964 时间可以说是数据分析中最常用的独立变量,工作中也常常会遇到对时间数据的对比分析.假设要计算上年同期的销量,在PowerBI中 ...
- 数据可视化之DAX篇(二十五)PowerBI常用的度量值:累计至今
https://zhuanlan.zhihu.com/p/64999937 经常碰到本年至今.本月至今的数据计算,其实还有一类计算是,从历史最早日期至今的累计计算,比如从开业到现在总共卖出了多少件商品 ...
- 数据可视化之DAX篇(二)Power BI中的度量值和计算列,你搞清楚了吗?
https://zhuanlan.zhihu.com/p/75462046 对于初学者,总是会把度量值和计算列搞混,我也经常碰到这样的问题,有些星友用文章中的代码总是报错,发给我一看,才知道TA把本来 ...
- 数据可视化之DAX篇(十一)Power BI度量值不能作为坐标轴?这个解决思路送给你
https://zhuanlan.zhihu.com/p/79522456 对于PowerBI使用者而言,经常碰到的一个问题是,想把度量值放到坐标轴上,却发现无法实现.尤其是初学者,更是习惯性的想这么 ...
- 数据可视化之DAX篇(十五)Power BI按表筛选的思路
https://zhuanlan.zhihu.com/p/121773967 数据分析就是筛选.分组.聚合的过程,关于筛选,可以按一个维度来筛选,也可以按多个维度筛选,还有种常见的方式是,利用几个特 ...
随机推荐
- [转] Socket通信实例
点击阅读原文 Client端: #include <stdio.h> #include <sys/socket.h> #include <sys/types.h> ...
- 2019-01-31 Python学习之BFS与DFS实现爬取邮箱
今天学习了python网络爬虫的简单知识 首先是一个爬取百度的按行读取和一次性爬取 逐行爬取 for line in urllib.request.urlopen("http://www.b ...
- numpy中数组(矩阵)的乘法
我们知道在处理数据的时候,使用矩阵间的运算将会是方便直观的.matlab有先天的优势,算矩阵是它的专长.当然我们用python,经常要用到的可能是numpy这个强大的库. 矩阵有两种乘法,点乘和对应项 ...
- 命令中"|"的意义
管道命令,是指 | 的左边运行结果是|右边的输入条件或者范围.如:history | grep date指从history这条命令运行的结果中显示包含有 “date” 的命令 下面举一个例子: 这是运 ...
- tensorflow-TFRecord 文件详解
TFRecord 是 tensorflow 内置的文件格式,它是一种二进制文件,具有以下优点: 1. 统一各种输入文件的操作 2. 更好的利用内存,方便复制和移动 3. 将二进制数据和标签(label ...
- add shell 出现 error: no devices/emulators found
解决方案: adb kill-server adb reconnect
- 一个老牌程序员说:做Java开发,怎么可以不会这 20 种类库和 API
- vue 生命周期:
vue 生命周期: 1. beforeCreate()创建组件; 2. created() 创建完成; 3. beforeMounte() 组件被挂裁前; ...
- Eureka心跳健康检查机制和Spring boot admin 节点状态一直为DOWN的排查(忽略某一个节点的健康检查)
https://www.jdon.com/springcloud/eureka-health-monitoring.html 运行阶段执行健康检查的目的是为了从Eureka服务器注册表中识别并删除不可 ...
- 四层发现-TCP发现
直接向目标ip发送一个ACK数据包,正常情况下up状态的目标ip会返回一个SRT数据包. 使用scapy构造TCP数据包: 然后在将一些数据类型设置好就可以发送了. 实用脚本实现批量扫描: #!/us ...