按周进行数据分析,在零售业.电商等类型的公司中很常见,但是不少人觉得按周进行分析无从下手,一个主要的原因是找不到对应的函数,因为时间智能函数只对应年.季.月.天这几个粒度,没有关于周的时间智能函数. 没有相应的函数当然也能搞定,本文就介绍几种常见的周分析的思路,掌握后就可以灵活地进行各种时间分析. 进行周分析之前,我们首先应该构造含有周序列的日期表. 创建日期表 在日期表中,应该包含每个日期是周几,以及属于一年中的第几周的数据,这里直接用DAX生成一个日期表, 日期表 =ADDCOLUMNS(A…
1.前言 图表要素如下图所示 # sphinx_gallery_thumbnail_number = 3 import matplotlib.pyplot as plt import numpy as np 2 画布(Figure) https://matplotlib.org/api/figure_api.html#module-matplotlib.figure 这就类似于我们在电脑上画画一样,需要打开画图软件,创建一个空白的白板,这个白板就是我们后续画图的地方.  创建 fig = plt…
https://zhuanlan.zhihu.com/p/64510355 逛超市的时候,面对货架上琳琅满目的商品,你会觉得这些商品的摆放,或者不同品类的货架分布是随机排列的吗,当然不是. 应该都听说过啤酒与尿布的故事,这两个表面上毫不相关的商品,在超市中摆放在一起时二者的销量都大幅度提升.这里不论这个案例的真实性如何,但它对理解产品之间的关联十分形象,好的故事总是更有传播度. 购买某种商品的客户,对另一种商品,相对于其他商品,有更大的购买概率,这两种商品就具有更高的关联度,为了提高销售额,应尽…
本文源码:GitHub·点这里 || GitEE·点这里 一.数据可视化 1.基础概念 数据可视化,是关于数据视觉表现形式的科学技术研究.其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽取出来的信息,包括相应信息单位的各种属性和变量. 如果说的实际贴切的话:系统开发中常见的数据报表统计,将数据用图表或表格的形式呈现出来,帮助运营或者决策人员了解这些数据的规律或者价值,就是简单的可视化应用. 从开发角度来看,把系统中的核心数据,用一定的手段进行统计,在借助一些精美的图表样式,展示出来,或…
有了前两篇关于分组的铺垫,这篇文章就来学习一个分组的经典应用,图表的动态分组,并对分组动态配色. 假设有十几个产品,每个产品的销售额,是随着时间而变化的,想知道某个时间的每一个产品的销售额与平均销售额的对比,并重点关注超过平均值的明星产品. 利用分组计算,高于平均值的产品用蓝色显示,低于平均值的用红色显示,在PowerBI中实现的效果如下, 下面来看看是如何实现的. 01 | 创建一个辅助表 02 | 新建度量值 销售金额 = SUM('订单'[销售额]) 按平均分组销售额 =VAR avg_s…
​性能分析器是Power BI前几个月推出的功能,主要用于检测视觉对象和DAX的性能如何,该功能的使用比较简单,首先勾选这个功能, 然后点击开始记录并刷新视觉对象,就可以看出每个元素耗费的时间,如下图, 上面的功能很直观,并不需要特别的介绍,关于性能分析器的另外一个功能才是本文要说的. 这个功能可以解决从可视化对象中导出数据的痛点. 关于导出PowerBI图表中的数据,以前也介绍过:PowerBI中的数据如何导出到Excel? 但是当我们利用左上角导出数据功能导出下面这个矩阵的数据时, 结果是这…
时间序列预测就是利用过去一段时间内的数据来预测未来一段时间内该数据的走势,比如根据过去5年的销售数据进行来年的收入增长预测,根据上个季度的股票走势推测未来一周的股价变化等等. 对于大部分人来说,这是个相对比较复杂的预测建模问题,但在工具如此丰富的今天,当然可以不用自己动手建模,很多工具都可以实现这一功能.本文介绍在PowerBI中如何进行时间序列预测. 折线图中的预测 时间序列数据一般使用折线图来展现,因此在PowerBI的折现图中也就有了预测功能. 先在PowerBI中创建一个折线图, 然后在…
今天给大家分享一个动态显示数据层级的技巧,效果如下: 无论想按什么维度.什么顺序查看分析数据,只需要选择不同的切片器组合就行了. 方法如下:01 | 把数据聚合为分析需要的最细粒度 本文假设最细分析粒度为月度,可以通过分组功能聚合,这样可以显著的降低数据的行数. 02 | 添加索引列 03 | 对分析维度逆透视 选中各个分析的各个维度,逆透视, 04 | 复制2个逆透视后的表,上载到数据模型并建立关系 这三个表是完全相同的表,通过索引列建立关系, 05 | 用三个表的属性生成三个切片器 按顺序分…
https://zhuanlan.zhihu.com/p/64413000 在PowerBI的可视化对象中,还有两个「表格」对象,表格的作用不仅可以在报表提供明细数据,还经常用来测试度量值的返回结果, 因为它们使用起来十分简单,就是把字段拖进去就可以显示出来数据,看起来和Excel表格也没有什么不同,刚开始接触PowerBI的人都可以轻松使用它,但它们的功能远比看上去丰富的多. 下面就从内涵到颜值全方位介绍一下PowerBI中的表格. 先来看看相对复杂一点的“矩阵”对象,以这份电子产品的销售数据…
https://zhuanlan.zhihu.com/p/64146209 Power BI与PowerQuery.PowerPivot有什么关系? 刚开始学习PowerBI的时候,总是能碰到Power Query和Power Pivot这两个词(下文简称为PQ和PP),现在中文里面学习PowerBI的资源本来就不是很多,大部分资源还都是介绍PQ和PP的,那么她们到底和PowerBI是什么关系呢? 微软的很多办公工具都是以Power开头,最熟悉的当然就是PowerPoint了,如果ppt可以直译…
来自  https://zhuanlan.zhihu.com/p/64144024 Power BI是什么? Power BI是微软推出的数据分析和可视化工具,我们先来看看微软官方是怎么介绍的: Power BI 是一套商业分析工具,用于在组织中提供见解.可连接数百个数据源.简化数据准备并提供即席分析.生成美观的报表并进行发布,供组织在 Web 和移动设备上使用.每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解.在企业内实现扩展,内置管理和安全性. 简单来说就是可以从各种数据源中提取数…
https://zhuanlan.zhihu.com/p/64421933 经常有朋友问,当把文本字段放到坐标轴或者切片器上,显示的顺序都乱了,完全不是自己想要的,就像下面这些, ↑月份坐标轴 ↑星期切片器 ↑奖牌切片器 以上这些都是文本类的数据,文本数据默认是按照字母来排序的,但是这样的排序明显与我们的初衷不符,在图表的排序或者切片器的设置中,又没有办法直接调整过来,那怎么办呢? 还好PowerBI中有这个功能,可以轻松排序,它就是:按列排序. 以调整中文的月份字段为例,来看看这个功能是怎么使…
https://zhuanlan.zhihu.com/p/67564062 进行数据分析时,每个分析维度并不总是独立的,比如省份是一个维度,城市也是一个维度,而这两个维度之间是有逻辑关系的,那么在进行切片分析时,我们希望能达到动态联动的效果.在PowerBI中,只要维度表的数据有关系并建立了层次结构的,其实是可以自动实现联动的效果的,比如有个“省市表”如下, 分别利用[省份]和[城市]生成两个切片器,效果如下, 两个切片器是不是联动起来了呢? 如果维度表还有更细分的层次,三个切片器也是可以联动的…
https://zhuanlan.zhihu.com/p/64999937 Excel作为使用最频繁.应用最广泛.用户最庞大的数据处理工具,当然也应该是PowerBI最常用的数据获取方式,本文介绍一下将Excel数据导入到PowerBI的几种方式. 01 | 在PowerBI Desktop中获取数据 这种是PowerBI中最常用也是最简单的方式,这种方式导入进来后可以直接加载使用,也可以在Power Query编辑器中进行清洗整理. 本地文件更新,在PowerBI Desktop中通过刷新数据…
https://zhuanlan.zhihu.com/p/64415543 把Excel中数据加载到PowerBI中我们都已经熟悉了,但是怎么把在PowerBI中处理好的数据导出到Excel中呢?毕竟大多数时候,Excel工作簿才是与他人分享数据的通用格式. 特别是PowerBI对数量级没有限制,处理上亿行数据都有可能,那么这些数据是不是只能保存在pbix文件中呢?当然不是,依然可以通过csv格式来保存到Excel中. 下面就来介绍PowerBI中的不同形式的数据如何导出到Excel. (一)P…
随着云计算时代的到来,由于Web技术的快速革新以及为了提供高质量的用户体验,数据可视化成为了前端技术发展的一大方向.为了解决这个问题,现如今涌现了很多优秀的第三方的javascript图形库,比如highcharts.js,echarts.js,d3.js,go.js… 数据可视化javascript插件对比 在HTML5标准支持下,web实现图形标准主要分为canvas和svg,上述的javascript图形库都是依赖2者之一作为底层库.Canvas基于像素,提供2D绘制函数,是一种HTML标…
之前使用自定义图表,每次新打开一个新文件时,都需要重新添加,无法保存,在PowerBI 6月更新中,这个功能得到了很大改善,可以将自定义的图表固定在内置图表面板上了. 添加自定义图表后,右键>固定到可视化效果窗格, 这样下次再创建新的PowerBI文件,这些自定义图表也都在哦, 既然可以固定了,那么就可以将常用的一些自定义图表添加的可视化面板中了,不用每次都要下载. 目前PowerBI的自定图表有200多个,但是质量参差不齐,并不是每一个都好用,需要仔细甄别才能挑到合适的图表. 这里我就精心挑选…
丁香园制作的这个地图可视化,相信大家每天都会看好几遍,这里不讨论具体数据,仅来探讨一下PowerBI地图技术. 这个地图很简洁,主要有三个特征: 1,使用着色地图,根据数据自动配色 2,只显示中国地图,其他区域不显示 3,地图上显示类别标签 只要使用满足这三个特征的地图类型,就可以轻松模仿出这个地图. 首先我们来看一下Power BI中默认的着色地图,效果如下: 制作方法请参考:PowerBI默认地图可视化 这个着色地图因为是默认图表,制作起来最简单,并且颜色设置比较方便,可以使用度量值动态配色…
https://zhuanlan.zhihu.com/p/69187094 数据分析的源数据应该是规范的,而规范的其中一个标准就是数据源应该是一维表,它会让之后的数据分析工作变得简单高效. 在之前的文章中,我也经常强调一维表的易用性,也时常有人问我,什么是一维表,为什么要转为一维表呢,这篇文章就来帮你梳理清楚并告诉你如何将二维表转化为一维表. 什么是一维表 在Excel中常见的是二维表,你可能天天都在用, 而一维表是长这样的: 通过以上二维表和一维表的比较,你应该能分清楚什么是一维表.什么是二维…
最近我一直在做数据可视化的前端工作,我用的最多的绘图工具是d3.d3有点像photoshop,功能很强大,例子也很多,但是学习成本也不低,做项目是需要较大人力投入的.3月底由在亚马逊工作的同学介绍下使用了一下echart,一个由百度前端发起的canvas国产类库(官网:http://echarts.baidu.com/index.html).这个echart其实是在canvas类库zrender的基础上做的主题图库,优点有数据驱动,图例丰富,功能强大,支持数据拖拽重计算,数据区域漫游,全中文文档…
作业要求来自于https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 爬虫综合大作业 选择一个热点或者你感兴趣的主题. 选择爬取的对象与范围. 了解爬取对象的限制与约束. 爬取相应内容. 做数据分析与文本分析. 形成一篇文章,有说明.技术要点.有数据.有数据分析图形化展示与说明.文本分析图形化展示与说明. 文章公开发布. 1. 数据爬取 爬虫部分主要是调用官方API,本次用到的API主要有两个: ①获取评论:http://musi…
Echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生成 Echarts 图表的类库.实际上就是 Echarts 与 Python 的对接. 安装 pip install pyecharts 一.柱形图(条形图) 柱形图简明.醒目,是一种常用的统计图形.以下生成的图都可以点击 html 文件打开,点击图形右边下载按钮可以下载到本地. from pyecharts import Bar bar = Bar("成绩柱形图", "…
注:很早之前就打算专门写一篇与Python数据可视化相关的博客,对一些基本概念和常用技巧做一个小结.今天终于有时间来完成这个计划了! 0. Python中常用的可视化工具 Python在数据科学中的地位,不仅仅是因为numpy, scipy, pandas, scikit-learn这些高效易用.接口统一的科学计算包,其强大的数据可视化工具也是重要组成部分.在Python中,使用的最多的数据可视化工具是matplotlib,除此之外还有很多其他可选的可视化工具包,主要包括以下几大类: matpl…
前言 数据可视化,是指将相对晦涩的的数据通过可视的.交互的方式进行展示,从而形象.直观地表达数据蕴含的信息和规律. 早期的数据可视化作为咨询机构.金融企业的专业工具,其应用领域较为单一,应用形态较为保守.步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合.挖掘.分析.可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图.气泡图.树图.仪表盘等各式图形.表现之二是可用的开发工具越来越丰富,…
概述 Spark GraphX 本身并不提供可视化的支持, 我们通过第三方库 GraphStream 和 Breeze 来实现这一目标 详细 代码下载:http://www.demodashi.com/demo/10644.html Spark 和 GraphX 对并不提供对数据可视化的支持, 它们所关注的是数据处理.但是, 一图胜千言, 尤其是在数据分析时.接下来, 我们构建一个可视化分析图的 Spark 应用.需要用到的第三方库有: GraphStream: 用于画出网络图 BreezeVi…
PoPo数据可视化 聚焦于Web数据可视化领域, 发现前端可视化领域有意思的内容. 涵盖前端可视化领域最新资讯, 开源可视化库的发布更新消息, 可视化案例分析与讲解, 可视化技术文章, 可视化大神的日常, 可视化八卦等等...不想错过前端可视化领域的精彩内容, 就快快关注我们吧 :) 行业  DataHunte获Ventech China千万级A轮融资,致力于数据可视化分析 8月31日消息,近日,业务数据协作平台DataHunter宣布完成千万级人民币A轮融资,由Ventech China独家投…
数据可视化是数据科学家工作中的重要组成部分.在项目的早期阶段,你通常会进行探索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些理解.创建可视化方法确实有助于使事情变得更加清晰易懂,特别是对于大型.高维数据集.在项目结束时,以清晰.简洁和引人注目的方式展现最终结果是非常重要的,因为你的受众往往是非技术型客户,只有这样他们才可以理解. Matplotlib 是一个流行的 Python 库,可以用来很简单地创建数据可视化方案.但每次创建新项目时,设置数据.参数…
一.基本用法 import numpy as np import matplotlib.pyplot as plt x = np.linspace(-1,1,50) # 生成-1到1 ,平分50个点 y = 2*x+1 plt.plot(x,y) # 把 x 和 y 展示出来 plt.show() # 脚本当中要用.show()图才会出来 import numpy as np import matplotlib.pyplot as plt x = np.linspace(-1,1,50) # 生…
绝大多数的绘图案例都是以强大.灵活制图而著称的R包ggplot2实现的,充分展现了ggplot2生动.翔实的一面.从如何画点图.线图.柱状图,到如何添加注解.修改坐标轴和图例,再到分面的使用和颜色的选取等,本书都有清晰的讲解.虽然本书的大多数技巧使用的是ggplot2,但是并不仅仅局限于ggplot2的介绍.作者的理念是用合适的工具来完成合适的绘图任务,读者也可以学到许多其他有用的绘图函数和工具,来适应各种复杂的需求. 用合适的工具来完成合适的绘图任务,也可以学到许多其他有用的绘图函数和工具,来…
我的新书,<基于股票大数据分析的Python入门实战>,预计将于2019年底在清华出版社出版. 如果大家对大数据分析有兴趣,又想学习Python,这本书是一本不错的选择.从知识体系上来看,这本书的内容涵盖了开发Python企业级项目所需的知识点,包括但不限于Python基础语法知识.基于Pandas的大数据分析技术.基于Matplotlib的可视化编程技术.Python爬虫技术和基于Django的网络编程技术,甚至还在本书的最后,讲述了机器学习编程技术. 这本书的大多数范例程序是基于股票分析的…