最近在公司做一个数据可视化相关的项目,使用了Airbnb开源维护的企业级BI数据平台superset,相较于tableau这种收费的商业软件,Superset是开源维护的,同时图表的种类和颜值普遍偏高。以下效果图:

![时间序列_柱状图.gif](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112118784-853879599.gif)

![饼状图.gif](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112124212-953945562.gif)

![折线图.gif](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112135242-514586707.gif)

以及另外几十种图表格式
![图标概览.gif](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112143373-910271645.gif)

话不多说,开始搭建吧。
##1.前期准备
**Linux服务器CentOS7(Windows系统的不作概述 一般缺少的whl文件在 [此网站](https://www.lfd.uci.edu/~gohlke/pythonlibs/)
可以下载**
**python3.+版本(此处我使用的是3.6.2版本)**
**yum安装 [163镜像](http://mirrors.163.com/)**

[superset官网](https://blog.csdn.net/zzy1078689276/article/details/78732183/)

##2.安装环境
####2.1 安装python3.6.2
[python3.6.2安装及测试](https://www.cnblogs.com/liongong/p/7858573.html)

####2.2.安装编译环境
```
sudo yum install gcc gcc-c++ libffi-devel openssl-devel libsasl2-devel openldap-devel
```
####2.3 更新pip及工具 使用python3下载
```
####pip3 install --upgrade setuptools pip
```
####2.4 安装virtualenv虚拟环境
```
pip3 install virtualenv
```

####2.5 进入虚拟环境
```
. ./venv/bin/activate
```

####2.6 使用豆瓣镜像源安装superset
```
pip3 install superset -i https://pypi.douban.com/simple
```

问题描述1:
ImportError: No module named flask_compress/ext/XXX
这是因为superset默认的flask版本要>1.0同时又不能太高,其他组件同理,一般都是版本过低或者过高
卸载原有的flask并且安装1.0版本的flask
```
pip3 uninstall flask
pip3 install -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com flask==1.0
```
问题描述2:
Was unable to import superset Error:No module named '_sqlite3'
这是系统默认的python解释器版本2.7与3.6冲突 网上也有解决方案修改默认的解释器版本或者对当前编译环境加入sqlite3模块

####2.7 创建管理员用户名和密码
```
fabmanager create-admin --app superset
```
问题描述:No module named '_sqlite3'
解决方案同上 其实是上一步出了问题

####2.8 初始化Superset数据库
```
superset db upgrade
```
####2.9 装载官方提供的系统案例
```
superset load_examples
```
####2.10 初始化
```
superset init
```
####2.10 启动superset
```
superset run -p 8088 --with-threads --reload --debugger
```

##3.启动superset,连接mysql数据源,根据表创建Charts
在浏览器输入IP:8888或者IP:8888/login/
出现如下界面

![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112143712-921148797.png)
3.1 登陆
右上角选择中文,输入刚才的用户名和密码
3.2 安装连接mysql数据源的数据库依赖
```
pip install mysqlclient
```
3.3 连接数据源
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112144126-29504031.png)

点击增加过滤条件旁边的+号
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112144593-1515271071.png)
连接数据库
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112145488-1764047230.png)

连接数据表,点击右上角的增加过滤条件
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112146556-544105135.png)

选择数据库 输入表名
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112146774-1833124605.png)

点击数据表 进入根据表创建Charts的界面 以饼状图为例:
选择数据源 图标类型 时间区间 指标数值 分组依据(这里是性别)
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112146907-2110940904.png)

执行Query: 点击Save保存

![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112147042-520372014.png)

到这里,BI数据平台生成图标已经完成了。以下是将图标引入自己的项目

##4.将生成的饼状图变为html,嵌入自己项目
修改superset中的config.py配置文件
将PUBLIC_ROLE_LIKE_GAMMA改为True
支持图表跨域
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112147180-1961179493.png)

在Charts中找到刚才保存的图标 点击右上尖括号 复制iframe的代码
![image.png](https://img2018.cnblogs.com/blog/1821710/201909/1821710-20190930112147315-948611537.png)

嵌入我们自己项目中的iframe标签中即可。

嵌入图表Demo网址浏览:[http://www.songlei.online:8777](http://www.songlei.online:8777/)

关注公众号:Code In Java
资源,项目,面试题一网打尽
希望与你成为Java技术的同路人

Airbnb开源 快速搭建企业级BI数据平台的更多相关文章

  1. HDP 企业级大数据平台

    一 前言 阅读本文前需要掌握的知识: Linux基本原理和命令 Hadoop生态系统(包括HDFS,Spark的原理和安装命令) 由于Hadoop生态系统组件众多,导致大数据平台多节点的部署,监控极其 ...

  2. 如何用MoveIt快速搭建机器人运动规划平台?

    MoveIt = RobotGo,翻译成中文就是“机器人,走你!”所以,MoveIt的主要就是一款致力于让机器人能够自主运动及其相关技术的软件,它的所有模块都是围绕着运动规划的实现而设计的. 两个月前 ...

  3. 2012开源项目计划-WPF企业级应用整合平台

    2012开源项目计划-WPF企业级应用整合平台 开篇 2012年,提前祝大家新年快乐,为了加快2012年的开发计划,特打算年前和大家分享一下2012年的开发计划和年后具体的实施计划,希望有兴趣或者有志 ...

  4. 【HADOOP】| 环境搭建:从零开始搭建hadoop大数据平台(单机/伪分布式)-下

    因篇幅过长,故分为两节,上节主要说明hadoop运行环境和必须的基础软件,包括VMware虚拟机软件的说明安装.Xmanager5管理软件以及CentOS操作系统的安装和基本网络配置.具体请参看: [ ...

  5. 搭建企业级全网数据定时备份方案[cron + rsync]

    1.1.1. 服务端的配置[192.168.25.141] Rsync的端口是:873 man rsyncd.conf 查看帮助 Rsync是Redhat默认自带的,这里只是做了rsync服务器端的后 ...

  6. 如何基于Go搭建一个大数据平台

    如何基于Go搭建一个大数据平台 - Go中国 - CSDN博客 https://blog.csdn.net/ra681t58cjxsgckj31/article/details/78333775 01 ...

  7. 搭建企业级实时数据融合平台难吗?Tapdata + ES + MongoDB 就能搞定

      摘要:如何打造一套企业级的实时数据融合平台?Tapdata 已经找到了最佳实践,下文将以 Tapdata 的零售行业客户为例,与您分享:基于 ES 和 MongoDB 来快速构建一套企业级的实时数 ...

  8. 单机,伪分布式,完全分布式-----搭建Hadoop大数据平台

    Hadoop大数据——随着计算机技术的发展,互联网的普及,信息的积累已经到了一个非常庞大的地步,信息的增长也在不断的加快.信息更是爆炸性增长,收集,检索,统计这些信息越发困难,必须使用新的技术来解决这 ...

  9. 基于开源Red5搭建的视频直播平台

    开始之前,为了便于大家了解Red5,此处引用网络文字,非原创 引言 流媒体文件是目前非常流行的网络媒体格式之一,这种文件允许用户一边下载一边播放,从而大大减少了用户等待播放的时间.另外通过网络播放流媒 ...

随机推荐

  1. #pragma 的使用(转)

    尽管 C 和 C++ 都已经有标准,但是几乎每个编译器 (广义,包含连接器等) 扩展一些 C/C++ 关键字. 合理地应用这些关键字,有时候能使我们的工作非常方便.下面随便说说 Visual C++ ...

  2. 带加载进度的Web图片懒加载组件Lazyload

    在Web项目中,大量的图片应用会导致页面加载时间过长,浪费不必要的带宽成本,还会影响用户浏览体验. Lazyload 是一个文件大小仅4kb的图片懒加载组件(不依赖其它第三方库),组件会根据用户当前浏 ...

  3. CSS3——PC以及移动端页面适配方法(响应布局)

    响应布局就是不同宽度应用不同的样式块,每个样式块对应的是该宽度下的布局方式,从而使页面适应不同宽度. <!DOCTYPE html> <html lang="en" ...

  4. 链表中倒数第k个节点(python)

    题目描述 输入一个链表,输出该链表中倒数第k个结点. 无力吐槽牛客网... class Solution: def FindKthToTail(self, head, k): # write code ...

  5. Spring IOC 实现方式

    Spring 中的 org.springframework.beans 包和 org.springframework.context 包构成了 Spring 框架 IoC 容器的基础. BeanFac ...

  6. Bugku web web基础$_GET

    web基础$_GET 打开网站后发现 $what=$_GET['what']; echo $what; if($what=='flag') echo 'flag{****}'; 根据这段话的意思是将w ...

  7. POJ 3280 Cheapest Palindrome ( 区间DP && 经典模型 )

    题意 : 给出一个由 n 中字母组成的长度为 m 的串,给出 n 种字母添加和删除花费的代价,求让给出的串变成回文串的代价. 分析 :  原始模型 ==> 题意和本题差不多,有添和删但是并无代价 ...

  8. 【CF686D】Kay and Snowflake(树的重心)

    题意:给定一棵n个点的树,q次询问,每次询问以某个点为根的子树编号是多少 n,q<=3e5 思路:设sz[u]为以u为根子树的size,v为u的size最大的儿子 若sz[v]*2<sz[ ...

  9. P1092 虫食算——题解

    题目传送 (据说官方正解为高斯消元,但用搜索也能过,这里就讲讲搜索算法吧.) 对于一道搜索题,首先考虑一下大体怎样搜索.因为要考虑加法的进位,所以从左往右搜索对于考虑进位来说十分麻烦,而从右往左搜索就 ...

  10. 用HTML5 Geolocation实现一个距离追踪器

    HTML5 Geolocation(地理定位)用于定位用户的位置.那么如何实现一个距离追踪器呢?我的思路是这样的,前提是浏览器支持h5地理定位,在这个基础上,获取用户位置,更新用户位置,计算距离,显示 ...