1.csv导入 1.1 csv导入 .read_csv()函数 pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=Non…
关联 (Correlation) 关联图表用于可视化2个或更多变量之间的关系. 也就是说,一个变量如何相对于另一个变化. 散点图(Scatter plot) 散点图是用于研究两个变量之间关系的经典的和基本的图表. 如果数据中有多个组,则可能需要以不同颜色可视化每个组. 在 matplotlib 中,您可以使用 plt.scatterplot() 方便地执行此操作. 导入需要的模块库 import numpy as np # 导入numpy库 import pandas as pd # 导入pan…
目录 2.MySQL基础数据类型.完整性约束.sql_mode模式 1. MySQL常用数据类型 2. 完整性约束 3. MySQL的sql_mode模式说明以及设置 2.MySQL基础数据类型.完整性约束.sql_mode模式 1. MySQL常用数据类型 MySQL常用数据类型预览 1.数字: 整型: tinyinit int bigint 小数: float:在位数比较短的情况下不精准 double:在位数比较长的情况下不精准 decimal:精准.内部原理是以字符串形式去存,如果用小数,…
https://zhuanlan.zhihu.com/p/100070260 商业数据分析通常都可以简化为对数据进行筛选.分组.汇总的过程,本文通过一个实例来看看PowerBI是如何快速完成整个过程的. 假设数据为一个订单明细表,含有下单日期.客户名称.产品名称等数据,业务需求为: 根据订单表,计算出截止某个日期,购买次数为1-7次.8-14次.14-21次……的客户分别有多少? 看到要求就知道这是个分组问题,一般可以通过计算列或者度量值的方式来完成,之前PowerBI星球也分享过关于分组的文章…
https://zhuanlan.zhihu.com/p/64382849 介绍DAX的时候,特别强调过一个重要的函数:CALCULATE,本文就来揭秘这个函数的计算原理以及它是如何影响上下文的. CALCULATE的语法结构 语法: CALCULATE(<expression>,<filter1>,<filter2>…) 第一个参数是计算表达式,可以执行各种聚合运算 从第二个参数开始,是一系列筛选条件,可以为空:如果多个筛选条件,用逗号分隔 所有晒选条件的交集形成最终…
数据中的明细项一般都有很多,可是我们关注的往往只是前几名,所以在报表中只展示关注的部分,就十分常用. 有了上篇(这几个示例,帮你深入理解RANKX排名)关于排名的铺垫,仅显示前N名就简单多了. 依然以上篇文章数据中的数据为例,按销售额的高低来显示前几名的产品,使用最常用的排名方式, 排名 = RANKX(ALL('产品'),[销售额]) 有了这个排名,如果只想显示前5名,就可以这样写度量值, 销售额 前5名=CALCULATE([销售额],FILTER(VALUES('产品'),[排名]<=5)…
https://zhuanlan.zhihu.com/p/55841964 时间可以说是数据分析中最常用的独立变量,工作中也常常会遇到对时间数据的对比分析.假设要计算上年同期的销量,在PowerBI中可以用CALCULATE来写个度量值[上年同期], = CALCULATE([数量],SAMEPERIODLASTYEAR('日期表'[日期])) 这里SAMEPERIODLASTYEAR就是时间智能函数. 时间智能函数和普通函数的区别 时间智能函数与普通的时间或者日期函数的区别是, 日期函数直接依…
import pandas # 创建表格格式# ad = pandas.DataFrame({"a": range(1, 10), "b": range(10, 20)})ad = pandas.DataFrame({"name":['lala', 'bbb', 'ccc'], "成绩":[10, 20, 30]}) # 导入read = pandas.read_excel("C:\\xxx\\xx\\xx.xls&…
又是一月结束,打工人准时准点的汇报工作如期和大家见面啦.提到汇报,必不可少的一部分就是数据的汇总.分析. 作为一名合格的社会人,我们每天都在工作.生活.学习中和数字打交道.小到量化的工作内容,大到具体的工作指标,车间生产.批发零售各行各业都充斥着大量数据.在互联网诞生之后,网络把我们紧紧相连,也让数据更为密集地汇聚. 扯远了--当前,正在写月报的葡萄面对的是,后端发来铺天盖地的两万条数据. 这个数据能用吗? 能用,但不是完全能用. 毕竟做报告的时候,我们不能把两万条数据直接甩到领导的脸上,让他自…
基于Python的Grib数据可视化           利用Python语言实现Grib数据可视化主要依靠三个库——pygrib.numpy和matplotlib.pygrib是欧洲中期天气预报中心(ECMWF)的GRIG API C库的Python接口,通过这个库可以将Grib数据读取出来:numpy是Python的一种开源的数值计算扩展,这种工具可用来存储和处理大型矩阵:matplotlib是python著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图:…