环境篇:Superset

Superset 是什么?

Apache Superset 是一个开源、现代、轻量的BI分析工具,能够对接多种数据源,拥有丰富的图表展示形式、支持自定义仪表盘,用户界面友好,易用。

如果没有Superset

大数据展示需要自行开发,费时费力,不能直观的展示数据报表,如数据仓库中大量的表信息图形化展示需要大量的开发周期。

http://superset.apache.org/

1 搭建

环境要求:Python3.6运行了全套测试控件(建议选择),3.7官网说的也是兼容的,但没有经过全套测试。

1.1 更新yum组件

yum install -y python-setuptools
yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel

1.2 安装 setuptools和pip

pip install --upgrade setuptools pip -i http://mirrors.aliyun.com/pypi/simple/
  • 报错

  • 需要配置默认镜像源创建或修改配置文件

linux的文件在~/.pip/pip.conf,

windows在%HOMEPATH%\pip\pip.ini

mkdir /root/.pip
vim /root/.pip/pip.conf
#>>>
[global]
index-url=http://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host=mirrors.aliyun.com
#<<<

1.3 安装superset

pip install apache-superset -i http://mirrors.aliyun.com/pypi/simple/

1.4 初始化superset数据库

superset db upgrade

1.5 创建管理员用户

export FLASK_APP=superset
superset fab create-admin

1.6 初始化

superset init

1.7 安装gunicorn

gunicorn 是一个Python WEB服务,可以理解为Tomcat

pip install gunicorn -i http://mirrors.aliyun.com/pypi/simple/

1.8 启动停止

  • 启动(注意python3.6)
gunicorn -w 5 --timeout 120 -b  10.28.13.85:8888 "superset.app:create_app()" --daemon

gunicorn 是一个Python WEB服务,可以理解为Tomcat

-w WORKERS:指定线程数

--timeout:worker进程超时时间,超过会自动重启

-b BIND:绑定Superset访问地址

--daemon:后台运行

  • 停止
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

2 对接数据源

http://superset.apache.org/installation.html#database-dependencies

从如上文档查看对接相关数据源

2.1 对接mysql

停止superset

conda install mysqlclient
pip install mysqlclient -i http://mirrors.aliyun.com/pypi/simple/

启动superset

3 使用demo

3.1 添加数据源

  • 添加数据库

上图为mysql例子,Database为Superbase取的别名。URI写法--> mysql://账号:密码@IP/数据库名称。

  • 添加表

3.2 制作仪表盘

  • 创建仪表盘

  • 创建图

测试数据有点喽,大家将就看了哈

仪表盘的设计,总体来说很简单了,是在不会用,可以点国旗切换文字来玩。

环境篇:Superset的更多相关文章

  1. 篇5 python自动化测试应用-Selenium环境篇

    篇5                            python自动化测试应用-Selenium环境篇 --lamecho 1.1概要 大家好!我是lamecho(辣么丑),从本篇开始我将开始 ...

  2. SpringBoot系列之profles配置多环境(篇二)

    SpringBoot系列之profles配置多环境(篇二) 继续上篇博客SpringBoot系列之profles配置多环境(篇一)之后,继续写一篇博客进行补充 写Spring项目时,在测试环境是一套数 ...

  3. 环境篇:Docker

    环境篇:Docker www.docker.com Docker 是什么? Docker 是一个开源的应用容器引擎,基于Go语言并遵从Apache协议的开源,让开发者可以打包他们的应用以及依赖包到一个 ...

  4. 环境篇:Virtualbox+Vagrant安装Centos7

    环境篇:Virtualbox+Vagrant安装Centos7 1 安装Vagrant Vagrant下载地址:https://www.vagrantup.com/ Vagrant百度网盘:https ...

  5. 环境篇:VMware Workstation安装Centos7

    环境篇:VMware Workstation安装Centos7 1 VMware Workstation安装 CentOS下载地址:http://isoredirect.centos.org/cent ...

  6. 环境篇:Atlas2.0.0兼容CDH6.2.0部署

    环境篇:Atlas2.0.0兼容CDH6.2.0部署 Atlas 是什么? Atlas是一组可扩展和可扩展的核心基础治理服务,使企业能够有效地满足Hadoop中的合规性要求,并允许与整个企业数据生态系 ...

  7. 环境篇:Kylin3.0.1集成CDH6.2.0

    环境篇:Kylin3.0.1集成CDH6.2.0 Kylin是什么? Apache Kylin™是一个开源的.分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析( ...

  8. 环境篇:Zeppelin

    环境篇:Zeppelin Zeppelin 是什么 Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的开源框架.Zeppelin提供了数据分析.数据可视化等功能. Zeppel ...

  9. 环境篇:CM+CDH6.3.2环境搭建(全网最全)

    环境篇:CM+CDH6.3.2环境搭建(全网最全) 一 环境准备 1.1 三台虚拟机准备 Master( 32g内存 + 100g硬盘 + 4cpu + 每个cpu2核) 2台Slave( 12g内存 ...

随机推荐

  1. IdentityServer4 QuckStart 授权与自定义Claims

    最近在折腾IdentityServer4,为了简单,直接使用了官方给的QuickStart示例项目作为基础进行搭建.有一说一,为了保护一个API,感觉花费的时间比写一个API还要多. 本文基于ASP. ...

  2. Python递归爬取头条用户的所有文章、视频

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http ...

  3. L2 Softmax与分类模型

    softmax和分类模型 内容包含: softmax回归的基本概念 如何获取Fashion-MNIST数据集和读取数据 softmax回归模型的从零开始实现,实现一个对Fashion-MNIST训练集 ...

  4. python操作数据库-SQLSERVER-pyodbc

    刚开始学python时,大家都习惯用pymssql去读写SQLSERVER.但是实际使用过程中,pymssql的读写性能以及可靠性的确不如pyodbc来的好. 正如微软官方推荐使用pyodbc库,作为 ...

  5. python selenium模块 xpath定位

    ''' 附w3xpath语法地址 https://www.w3school.com.cn/xpath/xpath_syntax.asp 总结: 返回匹配到所有符合条件的第一个节点,对象是 <cl ...

  6. 来个干货——使用VS2019发布.NET Core程序并部署到IIS的最新教程

    使用VS2019发布.NET Core程序并部署到IIS,不管你是使用.NET Core开发的是Web API还是网站类的程序,如果你是部署到IIS,那么下面的内容都适合于你,不会将.NET Core ...

  7. C#栈、堆的理解(2)

    接上一遍博文有关值类型和引用类型的相关概念. 所有值类型数据存放:栈(内存) 引用类型的数据存放:堆(内存) 栈:可以认为是一本书的目录部分称其为栈.栈可快速检索,运行速度比堆大,而且栈的空间小得多. ...

  8. Calendar日历类

    package com.yhqtv.demo02.ThreadPool; import java.util.Calendar; import java.util.Date; /* * java.uti ...

  9. tensorflow1.0 dropout层

    """ Please note, this code is only for python 3+. If you are using python 2+, please ...

  10. 双系统情况下,ubuntu开机挂载Windows分区

    首先:blkid,查看分区所属uuid 其中 /dev/sda5 就是Windows分区 其次:fdisk -l,查看分区情况 通过硬盘大小找到对应要设置的具体分区(其实这步也不用,我只是为了确定) ...