PowerBI的强大绝不仅是最后生成炫酷的可视化报告,她在第一步数据获取上就显示出了强大的威力,利用Power Query 的强大数据处理功能,几乎可以从任何来源.任何结构.任何形式上获取数据 https://zhuanlan.zhihu.com/p/64147364 数据的获取上不仅支持微软自己的数据格式,比如Excel.SQL Server.Access等;还支持SAP.Oracle.MySQL.DB2等几乎能见到的所有类型的数据格式,总有一种适合你: 不仅能能从本地获取数据,还能从网页抓取…
https://zhuanlan.zhihu.com/p/64146209 Power BI与PowerQuery.PowerPivot有什么关系? 刚开始学习PowerBI的时候,总是能碰到Power Query和Power Pivot这两个词(下文简称为PQ和PP),现在中文里面学习PowerBI的资源本来就不是很多,大部分资源还都是介绍PQ和PP的,那么她们到底和PowerBI是什么关系呢? 微软的很多办公工具都是以Power开头,最熟悉的当然就是PowerPoint了,如果ppt可以直译…
来自  https://zhuanlan.zhihu.com/p/64144024 Power BI是什么? Power BI是微软推出的数据分析和可视化工具,我们先来看看微软官方是怎么介绍的: Power BI 是一套商业分析工具,用于在组织中提供见解.可连接数百个数据源.简化数据准备并提供即席分析.生成美观的报表并进行发布,供组织在 Web 和移动设备上使用.每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解.在企业内实现扩展,内置管理和安全性. 简单来说就是可以从各种数据源中提取数…
https://mp.weixin.qq.com/s?__biz=MzA4MzQwMjY4MA==&mid=2484067158&idx=1&sn=4ad955112df2f40a93b684ed9147f26e&chksm=8e0c7181b97bf89777ae3d9de929867745edcbbfe1f2b396761c0cec716b86ee31e439279add&scene=21#wechat_redirec 对导入的数据进行数据整理的过程一般称为「数…
https://zhuanlan.zhihu.com/p/54700574 财务人员必学,使用Powerquery是一种什么体验? 你和Excel高手的距离只差了一个Power Query!!! 先思考一个财务日常工作中常遇到的问题:如何将多个工作簿的数据合并到一张表上? 可能不同的人有不同的做法? 普通青年用万能的复制粘贴二逼青年网上百度VBA代码一键汇总文艺青年找个崇拜自己的实习小MM帮忙 其实都不必这么麻烦,我们无需借助高级的数据处理软件,无需学习复杂的VBA语言,无需挖空心思找别人帮忙,…
https://zhuanlan.zhihu.com/p/64148928 前面我们学习PQ的时候都是用鼠标操作,虽然通过这些操作能完成大部分的数据处理,但是毕竟还有些复杂的工作是处理不了的,如果想彻底驾驭PQ,必须得掌握点高级玩法.就像学习Excel一样,做个表格我们只要会简单的操作就可以了,但要想学好Excel,必须会点公式.VBA是一样的道理,PQ的高级技能也是需要写公式函数的,在PQ中用的函数称之为M函数. 在之前的PQ操作中,其实M函数无处不在,比如做数据清洗的每一个步骤,背后都有M函…
https://zhuanlan.zhihu.com/p/64148432 上一篇文章都是在原表数据基础上的分分合合,但做数据分析的时候还经常需要在原有数据的基础上增加一些辅助数据,比如加入新列.新行,或者从其他表中添加进来更多维度的数据,这些就是数据丰富的过程. 01添加列 Power Query中添加列有四种形式,重复列.索引列.条件列.自定义列: (一)添加重复列 重复列就是把选中的列复制一列,以便对该列的数据进行处理而不损坏原有列的数据, (二)添加索引列 索引列就是为每行增加个序号,记…
https://zhuanlan.zhihu.com/p/64144595 体验PowerBI:零基础分分钟生成一份交互报表 首先我们准备一份数据,Excel格式 数据是从2006年到2015年10年间,中国大陆31个省市的三个产业的GDP,我们用Power BI来看看这三个产业结构近年来有什么趋势? 首先第一步,获取数据,选择Excel格式导入: 这里选择编辑,进入查询编辑器, 这个表格是二维表,为了分析的方便,需要把二维表转化为一维表,这个操作在Power BI里非常简单,这里把三个产业结构…
https://zhuanlan.zhihu.com/p/64150720 本文学习PowerBI最重要的概念:度量值 初学Power BI一般都会对度量值比较困惑,毕竟对长期接触Excel的人来说,这是个全新的概念,但一旦理解了她,肯定会立即喜欢上. 简单来说,度量值是用DAX公式创建一个虚拟字段的数据值,她不改变源数据,也不改变数据模型,如果你不在报表上使用她,甚至不知道她是什么样子的,而一旦被拖拽到报表上,便发挥巨大的作用,她可以随着切片器的筛选而闪转腾挪.变化万端,所以度量值一般在报表交…
https://zhuanlan.zhihu.com/p/64149834 数据建模并没有那么高深,你同样可以学会!这篇文章通过一个实例创建一个简单的数据建模,并引出两个重要的概念:度量值和DAX. 之前谈论PowerBI与Power Pivot的关系时就提到,Power BI数据建模其实就相当于Excel的Power Pivot插件,不过这个插件已内嵌到PowerBI Desktop中了,两者的功能基本相同.Pivot是透视的意思,那么PBI的数据建模也和透视有许多共通之处. 使用的数据透视表…
https://zhuanlan.zhihu.com/p/64383000 介绍过CALCULATE函数之后,有必要再介绍它的最佳搭档:FILTER函数. CALCULATE函数的第二个及之后的参数是筛选条件,而FILTER函数正是为筛选而生. FILTER语法 FILTER(<table>,<filter>) 第一个参数<table>是要筛选的表 第二个参数<filter>是筛选条件 返回的是一张表,不能单独使用,需要与其他函数结合使用 FILTER应用…
https://zhuanlan.zhihu.com/p/64382849 介绍DAX的时候,特别强调过一个重要的函数:CALCULATE,本文就来揭秘这个函数的计算原理以及它是如何影响上下文的. CALCULATE的语法结构 语法: CALCULATE(<expression>,<filter1>,<filter2>…) 第一个参数是计算表达式,可以执行各种聚合运算 从第二个参数开始,是一系列筛选条件,可以为空:如果多个筛选条件,用逗号分隔 所有晒选条件的交集形成最终…
DAX是英文Data Analysis Expression的缩写,意思是数据分析表达式,从名称上就可以看出,DAX公式是用作数据分析的,事实上也确实如此,从数据分析层面认识DAX会更有助于我们理解它. https://zhuanlan.zhihu.com/p/64272859 01 | 认识DAX 数据分析就是从茫茫数据中提取有用的信息,执行一定的运算,形成结论的过程,而DAX的主要功能正是查询和运算,DAX查询函数负责筛选出有用的数据集合,然后利用DAX的聚合函数执行计算. 从前面的文章我们…
https://zhuanlan.zhihu.com/p/64415543 把Excel中数据加载到PowerBI中我们都已经熟悉了,但是怎么把在PowerBI中处理好的数据导出到Excel中呢?毕竟大多数时候,Excel工作簿才是与他人分享数据的通用格式. 特别是PowerBI对数量级没有限制,处理上亿行数据都有可能,那么这些数据是不是只能保存在pbix文件中呢?当然不是,依然可以通过csv格式来保存到Excel中. 下面就来介绍PowerBI中的不同形式的数据如何导出到Excel. (一)P…
https://zhuanlan.zhihu.com/p/64999937 Excel作为使用最频繁.应用最广泛.用户最庞大的数据处理工具,当然也应该是PowerBI最常用的数据获取方式,本文介绍一下将Excel数据导入到PowerBI的几种方式. 01 | 在PowerBI Desktop中获取数据 这种是PowerBI中最常用也是最简单的方式,这种方式导入进来后可以直接加载使用,也可以在Power Query编辑器中进行清洗整理. 本地文件更新,在PowerBI Desktop中通过刷新数据…
https://zhuanlan.zhihu.com/p/64413703 通常情况下,在PowerBI进行分析的各种数据表都是从外部的各种数据源导入进来的,但并不总是如此,某些情况下在PowerBI Desktop中也可以根据需要直接建立各种表格. 在进行数据分析的过程中,也许还需要加入新的数据表或者新的维度,而我们并不想再导入源数据或者回到PQ编辑器进行处理,那么就可以利用已加载到模型中的数据进行构建新表,下面就来看看如何在PowerBI Desktop中新建数据表,以及几种常见的使用场景.…
https://zhuanlan.zhihu.com/p/64406366 查看可视化图表的时候,我们可能想深入了解某个视觉对象的更详细信息,或者进行更细粒度的分析,比如看到2017年的总体数据,同时想知道每个季度甚至每个月的数据,通过PowerBI的钻取功能,可以点击鼠标轻松实现. 当图表中的数据存在层级结构时,可以在图表上直接下钻展示下一层级的数据,最常见的层级结构就是日期数据,从年度.季度.月份到日期,甚至到小时.分钟和秒,只要具体的日期数据的层次结构足够详细. 下面就来看看什么是钻取功能…
​性能分析器是Power BI前几个月推出的功能,主要用于检测视觉对象和DAX的性能如何,该功能的使用比较简单,首先勾选这个功能, 然后点击开始记录并刷新视觉对象,就可以看出每个元素耗费的时间,如下图, 上面的功能很直观,并不需要特别的介绍,关于性能分析器的另外一个功能才是本文要说的. 这个功能可以解决从可视化对象中导出数据的痛点. 关于导出PowerBI图表中的数据,以前也介绍过:PowerBI中的数据如何导出到Excel? 但是当我们利用左上角导出数据功能导出下面这个矩阵的数据时, 结果是这…
Power BI的增量刷新功能现在已经对Pro用户开通,但由于种种限制,很多人依然无法使用无这个功能,所以,每一次刷新,都要彻底更新数据集.这对于量级比较大的数据集来说,着实是一件耗费时间的事情. 拿我的亲身经历举个例子,我有一份报表涵盖了客户近3年的销售情况,由于客户的业务流量比较大,数据集的每一次手动刷新都在15分钟左右,而计划刷新更是会延迟到35分钟左右,严重影响到报表的日常使用. 不过呢,聪明如我( 偷笑 ),我还是发掘到了一个十分简单的”增量刷新”解决方案,使用一个DAX函数就可以实现…
目前PowerBI的表格已经支持多列排序,但是矩阵依然还不支持按多个字段排序,虽然这个需求很普遍,这里利用DAX提供一个变通的实现方式. 模拟数据如下,有两个数据指标: 对类别首先按[指标一]进行排序,如果[指标一]数据相同,则按[指标二]排序. 因为PowerBI目前只能按一列排序,自然会想到构造个辅助列来实现,比如这样来添加辅助列: 原理就是在主排序列上加上一个特别小的数,这个特别小的数是由次排序列生成,两个数据加到一起,就生成了一个由两个指标混合而成,并且不会损坏原数据大小顺序的列,然后按…
时间序列预测就是利用过去一段时间内的数据来预测未来一段时间内该数据的走势,比如根据过去5年的销售数据进行来年的收入增长预测,根据上个季度的股票走势推测未来一周的股价变化等等. 对于大部分人来说,这是个相对比较复杂的预测建模问题,但在工具如此丰富的今天,当然可以不用自己动手建模,很多工具都可以实现这一功能.本文介绍在PowerBI中如何进行时间序列预测. 折线图中的预测 时间序列数据一般使用折线图来展现,因此在PowerBI的折现图中也就有了预测功能. 先在PowerBI中创建一个折线图, 然后在…
https://zhuanlan.zhihu.com/p/64405494 图表很直观,但有时候我们不仅想看图,也想更进一步查看生成该图表的明细数据,在PowerBI中有三种方式. (一)在图表上单击右键,选择“查看数据” 数据可以显示在图表右侧,也可以放在图表下边,数据显示出来后,点击右上角的三个点,还可以导出数据. 若要隐藏数据,返回之前状态,点击“返回报表”即可. (二)选中图表,然后点击右上角三个点,选择“显示数据” 这种方式,还可以直接导出数据,在“查看数据”上边的功能就是“导出数据”…
在学习PowerBI的过程中,尤其是刚接触的时候,不可避免的会遇到各种各样的错误,有时自己怎么检查都没法消除,不解决这个错误又没法进行下一步的工作,经常会搞的自己烦闷无比,不过最后通过自己的苦苦摸索.或者他人的片语点拨而解决后,也会欣喜异常. 你遇到的问题,我同样也都遇到过,并且我遇到的更多(因为我还接收到星友们遇到的各种问题:),这里归纳了一下初学者使用PowerBI时,几个常见的错误以及解决的办法. 01 | DAX书写错误 刚开始在DAX编辑框建度量值时,总是眼前一堆红色的波浪线有没有,…
偏差 (Deviation) 有序条形图 (Ordered Bar Chart) 有序条形图有效地传达了项目的排名顺序. 但是,在图表上方添加度量标准的值,用户可以从图表本身获取精确信息. https://datawhalechina.github.io/pms50/#/chapter15/chapter15 导入所需要的库 import numpy as np # 导入numpy库 import pandas as pd # 导入pandas库 import matplotlib as mpl…
https://zhuanlan.zhihu.com/p/64418072 源数据常常包含各种差错值,为了进行下一步的分析,我们必须先找出并更正这些差错,做这些工作几乎不会有什么快乐感可言,但却往往需要耗费很多精力.如果利用数据准备工具就能够发现这些数据质量问题,我们就可以节省大量时间. PowerQuery恰好有个功能就是做这个的:列分析,下面就来看看这个功能如何帮助我们进行数据清洗的. 首先更新到最新版的 PowerBI Desktop,在预览功能中启用列分析. 然后在 Power Quer…
https://zhuanlan.zhihu.com/p/79036123 在 PowerBI 中还有一种有趣的交互方式:跨页钻取.它可以通过点击某个数据点,钻取到另一个页面,进一步展示该数据点的详细信息. 本文就给大家介绍一下这种交互方式的做法和效果. 以下面的气泡地图为例,要实现的效果是,当点击一个国家时,进入到该国家的详细数据页. /01/ 新建报表页 为便于区分报表页面,可以重命名,这里命名为"钻取页". /02/ 在钻取页添加钻取字段 目的是钻取地图上的国家数据,因此将生成地…
之前的文章(采悟:连接表的几个DAX函数,一次全掌握)介绍了产品A的客户与产品B的客户的各种交叉关系,其中最常用的应该是找出A和B的共同客户,以便进行产品关联分析. 之前的思路是计算出两个产品的共同客户数,那么能不能选择三个产品呢,当然是可以的,利用上篇文章的思路,把三种产品的客户找出来,然后求三个表的交集就可以了. 但是这种方法是不是显得太笨拙了?如果只是两三个产品的共同客户数,勉强还可以使用,但如果是十几个甚至几十个产品,难道要先计算出几十个产品的客户表,再一个个求交集? DAX当然不会这么…
https://zhuanlan.zhihu.com/p/67932754 在PowerBI报表中,切片器绝对是最常用的控件了,利用它可以进行各种维度的动态切换,同一个页面中的所有图表可以同步响应:利用PowerBI的同步切片器功能,不同页面也可以设置同步响应. 同步切片器 在[视图]选项卡下,勾选“同步切片器”即可打开面板, 然后画布右侧出现了新的面板,随便选中一个切片器, 在同步切片器面板中,会显示所有的页面,可以设置这个切片器在每个页面的属性:同步和可见. 同步就是在该页面中是否响应切片器…
今天给大家分享一个动态显示数据层级的技巧,效果如下: 无论想按什么维度.什么顺序查看分析数据,只需要选择不同的切片器组合就行了. 方法如下:01 | 把数据聚合为分析需要的最细粒度 本文假设最细分析粒度为月度,可以通过分组功能聚合,这样可以显著的降低数据的行数. 02 | 添加索引列 03 | 对分析维度逆透视 选中各个分析的各个维度,逆透视, 04 | 复制2个逆透视后的表,上载到数据模型并建立关系 这三个表是完全相同的表,通过索引列建立关系, 05 | 用三个表的属性生成三个切片器 按顺序分…
https://zhuanlan.zhihu.com/p/64412190 ​本文来自星球嘉宾"海艳"的分享,关于Power BI的问答功能以及各项细节,海艳详细为大家逐一介绍,下面就直接进入她的精彩分享吧. 深入了解Power BI的问答功能 作者:海艳 很开心能够加入星球 ,和伙伴们一起来学习PowerBI,学习DAX.作为星球学员.PowerBI学习者,今天来分享一下让我看到时超级震撼的PowerBI功能:问答功能. "问答"是什么? 问答是通过自然语言提问,…