一、效果演示

我用python开发了一个动态疫情地图,首先看下效果:

如图所示,地图根据实时数据通过时间线轮播的方式,动态展示数据的变化。随着时间的推移,疫情确诊数量的增多,地图各个省份颜色逐渐加深,可以很明显地看到动态可视化效果。

这个动态疫情地图,是通过python的第三方库pyecharts制作完成的。数据来源是github上的一位大神:

https://github.com/BlankerL/DXY-COVID-19-Data

在此,感谢github作者整理的数据来源,方便我们数据分析人员使用。

针对此数据源,我还开发了一个定时自动下载疫情数据的python脚本,有兴趣的小伙伴可以滴滴我。

二、代码分解

下面,通过python代码(部分核心代码)逐一分解,这个动态疫情地图是怎样实现的:

首先,导入需要的库:

import pandas as pd  # 用于读取excel文件
from pyecharts import options as opts # 可视化选项
from pyecharts.charts import Timeline, Map # 时间线、地图
from pyecharts.globals import ThemeType # 图表主题

然后,定义好数据源文件,并做一些初始的数据清洗、数据预处理工作:

# 数据源文件
src_file = 'DXYArea_0214.xls'
# 中间文件
mid_file = 'to_csv4.csv'
# 疫情地图所用颜色
list_color = ['#F4AD8B', '#EF826F', '#EE806E', '#BD3932', '#801D17']
# 读取数据
df = pd.read_excel(io=src_file, usecols=['provinceName',
'province_confirmedCount',
'updateTime'],
) # 读取数据源
df['updateTime'] = df['updateTime'].astype(str).str[0:10]
df2 = df.groupby(['provinceName', 'updateTime']).apply(
lambda t: t[t.province_confirmedCount == t.province_confirmedCount.max()]) # 按省份日期分组统计确诊数量
df2 = df2[['provinceName', 'province_confirmedCount', 'updateTime']]
df2 = df2.drop_duplicates() # 删除重复值
df2 = df2.reset_index(drop=True) # 重置索引
df2.to_csv(mid_file, index=False) # 保存csv
df3 = pd.read_csv(mid_file)

筛选出指定日期的数据,并做一定的数据处理,供后续可视化代码读取调用:

# 筛选出指定日期的数据
df_20200201 = df3[df3['updateTime'].str.contains("2020-02-01")]
df_20200202 = df3[df3['updateTime'].str.contains("2020-02-02")]
df_20200203 = df3[df3['updateTime'].str.contains("2020-02-03")]
df_20200204 = df3[df3['updateTime'].str.contains("2020-02-04")]
df_20200205 = df3[df3['updateTime'].str.contains("2020-02-05")]
df_20200206 = df3[df3['updateTime'].str.contains("2020-02-06")]
df_20200207 = df3[df3['updateTime'].str.contains("2020-02-07")]
df_20200208 = df3[df3['updateTime'].str.contains("2020-02-08")]
df_20200209 = df3[df3['updateTime'].str.contains("2020-02-09")]
df_20200210 = df3[df3['updateTime'].str.contains("2020-02-10")]
df_20200211 = df3[df3['updateTime'].str.contains("2020-02-11")]
df_20200212 = df3[df3['updateTime'].str.contains("2020-02-12")]
df_20200213 = df3[df3['updateTime'].str.contains("2020-02-13")]

最后,也是最关键的代码,可视化地图部分:

def timeline_map() -> Timeline:
tl = Timeline(init_opts=opts.InitOpts(page_title="疫情地图4",
theme=ThemeType.CHALK,
width="1000px", height="620px"),
)
for idx in range(0, 13):
provinces = []
confirm_value = []
for item_pv in df_list[idx]['provinceName']:
provinces.append(item_pv)
for item_pc in df_list[idx]['province_confirmedCount']:
confirm_value.append(item_pc)
zipped = zip(provinces, confirm_value)
f_map = (
Map(init_opts=opts.InitOpts(width="900px",
height="500px",
page_title="疫情地图4",
bg_color=None))
.add(series_name="确诊数量",
data_pair=[list(z) for z in zipped],
maptype="china",
is_map_symbol_show=False)
.set_global_opts(
title_opts=opts.TitleOpts(title="2月全国疫情地图",
subtitle="2月{}日-当天数据\n"
"数据源:https://github.com/BlankerL/DXY-COVID-19-Data\n"
"注:仅限个人研究使用,请勿用作商业用途!".format(
idx + 1),
pos_left="center", ),
legend_opts=opts.LegendOpts(is_show=True, pos_top="40px", pos_right="30px"),
visualmap_opts=opts.VisualMapOpts(
is_piecewise=True, range_text=['高', '低'], pieces=[
{"min": 10000, "color": "#751d0d"},
{"min": 1000, "max": 9999, "color": "#ae2a23"},
{"min": 500, "max": 999, "color": "#d6564c"},
{"min": 100, "max": 499, "color": "#f19178"},
{"min": 10, "max": 99, "color": "#f7d3a6"},
{"min": 1, "max": 9, "color": "#fdf2d3"},
{"min": 0, "max": 0, "color": "#FFFFFF"}
]),
)
.set_series_opts(label_opts=opts.LabelOpts(is_show=True),
markpoint_opts=opts.MarkPointOpts(
symbol_size=[90, 90], symbol='circle'),
effect_opts=opts.EffectOpts(is_show='True', )
)
)
tl.add(f_map, "{}日".format(idx + 1))
tl.add_schema(is_timeline_show=True, # 是否显示
play_interval=800, # 播放间隔
symbol=None, # 图标
is_loop_play=True # 循环播放
)
return tl

核心代码就是这些,执行成功之后,就是这样的效果啦:


首发公号文章:

https://mp.weixin.qq.com/s?__biz=MzU5MjQ2MzI0Nw==&mid=2247484584&idx=1&sn=9d41a5efea81d4b95a9b140a85733e64&chksm=fe1e1048c969995e96830f8affd9bfdce27ae554fba6cd70a3e92a00d0651f023f090214aded&payreadticket=HNX8rqPS1qQNF8HEZhyWNTfIrT5zodFL_C0RG3tb1iJ8CCDaGaWQmRBPhsc0VXsSzGT6VNw#rd

【python疫情可视化】用pyecharts开发全国疫情动态地图,效果酷炫!的更多相关文章

  1. 【python可视化系列】python数据可视化利器--pyecharts

    学可视化就跟学弹吉他一样,刚开始你会觉得自己弹出来的是噪音,也就有了在使用python可视化的时候,总说,我擦,为啥别人画的图那么溜: [python可视化系列]python数据可视化利器--pyec ...

  2. python数据可视化:pyecharts

    发现了一个做数据可视化非常好的库:pyecharts.非常便捷好用,大力推荐!! 官方介绍:pyecharts 是一个用于生成 Echarts 图表的类库.Echarts 是百度开源的一个数据可视化 ...

  3. Python数据可视化实战:实时更新海外疫情数据,实现数据可视化

    前言 我国的疫情已经得到了科学的控制,开始了全面的复工复产,但是国外的疫情却“停不下来”.国外现在可谓就是处于水深火热当中啊,病毒极强的传染性,导致了许多的人都“中招”了,我国已经全面复工复产了,人大 ...

  4. 【疫情动态条形图】用Python开发全球疫情排名动态条形图bar_chart_race

    一.开发背景 你好,我是 @马哥python说 ,这是我用Python开发的全球疫情动态条形图,演示效果: https://www.zhihu.com/zvideo/15603276220259696 ...

  5. Codevs 1218 疫情控制 2012年NOIP全国联赛提高组

    1218 疫情控制 2012年NOIP全国联赛提高组 时间限制: 2 s 空间限制: 128000 KB 题目等级 : 钻石 Diamond 题目描述 Description H 国有 n 个城市,这 ...

  6. 如何使用Python快速制作可视化报表----pyecharts

    如何使用Python快速制作可视化报表   数据可视化能力已经越来越成为各岗位的基础技能.领英的数据报告显示,数据可视化技能在2017年中国最热门技能中排名第一. 就数据分析而言,可视化探索几乎是你正 ...

  7. (数据科学学习手札108)Python+Dash快速web应用开发——静态部件篇(上)

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

  8. (数据科学学习手札121)Python+Dash快速web应用开发——项目结构篇

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

  9. Python数据可视化编程实战pdf

    Python数据可视化编程实战(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1vAvKwCry4P4QeofW-RqZ_A 提取码:9pcd 复制这段内容后打开百度 ...

随机推荐

  1. 面试问题之C++语言:说一下static关键字的作用

    1.全局静态变量 在全局变量加上关键字static,全局变量就定义成一个全局静态变量,存放于静态存储区,在整个程序运行期间一直存在:未经初始化的全局静态变量会被自动初始化为0:全局静态变量在声明他的文 ...

  2. MySQL 如何优化 DISTINCT?

    DISTINCT 在所有列上转换为 GROUP BY,并与 ORDER BY 子句结合使用. SELECT DISTINCT t1.a FROM t1,t2 where t1.a=t2.a;

  3. 什么是通知(Advice)?

    特定 JoinPoint 处的 Aspect 所采取的动作称为 Advice.Spring AOP 使用一 个 Advice 作为拦截器,在 JoinPoint "周围"维护一系列 ...

  4. Java 中的 TreeMap 是采用什么树实现的?

    Java 中的 TreeMap 是使用红黑树实现的.

  5. String s = new String(“xyz”);创建了几个字符串对象?

    两个对象,一个是静态区的"xyz",一个是用 new 创建在堆上的对象.

  6. SpringCloudAlibaba 微服务讲解(四)Sentinel--服务容错(二)

    4.7 Sentinel 规则 4.7.1 流控规则 流量控制,其原理是监控应用流量的QPS(每秒查询率)或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的榴莲高峰冲垮,从而保障应用 ...

  7. Python的数据基础库Numpy怎样对数组进行排序

    Numpy怎样对数组排序 Numpy给数组排序的三个方法: numpy.sort:返回排序后数组的拷贝 array.sort:原地排序数组而不是返回拷贝 numpy.argsort:间接排序,返回的是 ...

  8. IPython是什么?

    参考:IPython 中常用的魔法命令 Ipython中的魔法命令总结 IPython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩 ...

  9. 用jq实现移动端滑动轮播以及定时轮播效果

    Html的代码: <div class="carousel_img"> <div class="car_img" style="ba ...

  10. js和原生应用常用的数据交互方式

    场景1 在原生app中经常会使用到H5页面,比如说电商中的活动页,一些电商中的详情页,等等...这些页面都有一个特点,那就是在未来修改的可能性,和一次性的几率特别的大.所以用H5的页面是最睿智的一种选 ...