待尝试研究的可视化组件及产品:

  • 开源组件
  • 商业组件

开源组件


  • zeppelin
  • Caravel
  • D3.js
  • Flare
  • talend(ETL)
  • pentaho
  • spagoBI
  • NanoCubs
  • Dygraphs
  • Saiku
  • airpal
  • Chart.js
  • chartist.js
  • ECharts
  • FnordMetric
  • redash
  • zingchart

zeppelin


  • 主页:
  • apache 开源产品
  • 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前的工具
  • http://www.pointtec.de/zeppelin/

Caravel


  • Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析
  • 快速创建数据可视化互动仪表盘
  • 丰富的可视化图表模板,灵活可扩展
  • 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)
  • 简洁的语义层,可以控制数据资源在 UI 的展现方式
  • 与 Druid 深度集成,可以快速解析大规模数据集
  • https://github.com/airbnb/superset
  • https://segmentfault.com/a/1190000005083953

D3.js


  • 一个强调网页标准的用来创建数据可视化JavaScript库。使用HTML、SVG和CSS,可以让使用者以数据驱动的方式去操作DOM,能够满足现在浏览器的兼容性并且不受专用框架的限制。
  • 示例地址:https://github.com/d3/d3/wiki/Gallery

Flare


  • 处理复杂、交互式图表、支持数据管理、视觉编码、动画和交互作用,各种可视化表格从时间线到多层图表来说明关系
  • 演示地址:http://flare.prefuse.org/demo
  • 关注演示部分:
    1. layout -> intent

talend


  • 网址:https://www.talend.com/download/talend-open-studio/
  • 即提供免费版本,也提供收费版本
  • Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。

  • Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。 两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码

  • 易用性:

    1. Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供
    2. Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
  • 技术支持:
    1. Talend:主要在美国
    2. Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员
  • 部署:
    1. Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
    2. Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署
  • 速度
    1. Talend:需要手工调整,对特定数据源有优化知识
    2. Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计
  • 数据质量:
    1. Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
    2. Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。

pentaho


  • 网址:http://www.pentaho.com/product/big-data-analytics
  • pentaho自称为“全面的数据集成和商业智能平台”,该公司主要大力推销它的商业软件,该软件基于开源社区。
  • Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案
  • 功能和特点
    ◆ 工作流引擎:Shark and JaWE
    ◆ 数据库:Firebird RDBMS
    ◆ 集成管理和开发环境:Eclipse
    ◆ 报表工具:Eclipse BIRT
    ◆ ETL工具:Enhydra/Kettle
    ◆ OLAP Server:Mondrian
    ◆ OLAP展示:JPivot
    ◆ 数据挖掘组件:Weka
    ◆ 应用服务器和Portal服务器:JBoss
    ◆ 单点登陆服务及LDap认证:JOSSO
    ◆ 自定义脚本支持:Mozilla Rhino Javascript脚本处理器

spagoBI


NanoCubs


Dygraphs


Saiku


airpal


  • Airpal 是一个基于 Web 的查询执行工具,利用 Facebook 的 PrestoDB 进行查询和获取结果。提供了查找表、元数据、浏览数据行,编写和执行查询的功能,这些功能全部通过浏览器完成。一旦查询开始执行,用户可跟踪查询进度获取并下载结果。查询的结果可生成新的 Hive 表用于进一步的分析
  • 源码地址:https://github.com/airbnb/airpal
  • 项目特性:
    •可选的用户访问控制
    •SQL语法高亮
    •查询结果导出到CSV文件,或者存到Hive表中
    •可查看SQL查询的历史记录
    •可保存查询
    •根据表名搜索对应的表
    •可查看表结构,并预览前1000行数据

Chart.js


  • chart.js 是一个简单、面向对象、为设计者和开发者准备的图表绘制工具库
  • ChartJS 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库
  • 网址:http://www.bootcss.com/p/chart.js/

chartist.js


ECharts


FnordMetric


  • FnordMetric是一个使用SQL语句来实现数据收集和可视化的框架,它使用chartsql扩展了标准的sql,允许你编写查询语句来返回图表而不是返回表,查询结果作为SVG向量图或者images来呈现出来。这些图表可以很容易嵌入一个web站点中,这样你就可以在短短几分钟内绘制漂亮的图表
  • 网址: http://fnordmetric.io/
  • 参考:http://blog.csdn.net/itas109/article/details/52311390

redash


  • re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
  • 访问地址: https://redash.io/

zingchart


商业组件


  • Ethink
  • Tableau
  • PowerBI
  • FineReport
  • Style Intelligence
  • sisense

EThink


  • 公司地址: http://www.ethinkbi.com/#
  • 演示: http://www.ethinkbi.com/try/
  • 说明:安徽象形信息科技有限公司(ETHINK)是国内大数据产品及方案服务商,专注于大数据,BI,大数据分析,大数据挖掘工具领域,是一家国内大数据分析产品领域的领导企业
  • 关注点:
    1. 地图下钻(缺点:不能按比例缩放) http://120.26.36.169:8088/ethinknew/user?type=item2
    2. K线图:关注下面关联的时间轴

Tableau


    1. 混合数据源
    2. 高效快速
    3. Tableau9.0版本开始支持中国地图
  • 产品分类:
    1. Tableau Desktop:收费,分个人版跟专业版,个人版只能连本地文件,专业版则无限制。Tableau制作端,创建可视化图表的软件
    2. Tableau Server:收费。可以发布做好的可视化图表,在浏览器或者移动设备上即可查看,共享、协作提高数据分析决策效率
    3. Tableau Online:收费,按年收取。基于云的服务,简单来讲就是云计算版server,企业不用自己部署Tableau server服务,通过Tableau自己的云端服务器,处理发布出去的可视化图表,同样能达到server的效果。不过由于服务器不在中国境内,运行效率可能会受到影响
    4. Tableau Public:免费。可在线分享自己的工作表、仪表板以及故事,与更多的人交流交互式数据故事
    5. Tableau Reader:免费。Tableau阅读器可打开并查看Desktop中生成的可视化图表,并且能进行可视化交互、筛选、钻取和查看明细
  • 关注点:
    1. 图表丰富,操作简单
    2. 交叉表

PowerBI


FineReport


Style Intelligence


sisense


可视化mark的更多相关文章

  1. 百度数据可视化图表套件echart实战

    最近我一直在做数据可视化的前端工作,我用的最多的绘图工具是d3.d3有点像photoshop,功能很强大,例子也很多,但是学习成本也不低,做项目是需要较大人力投入的.3月底由在亚马逊工作的同学介绍下使 ...

  2. Caffe学习系列(17):模型各层数据和参数可视化

    cifar10的各层数据和参数可视化 .caret,.dropup>.btn>.caret{border-top-color:#000!important}.label{border:1p ...

  3. Caffe学习系列(16):caffemodel可视化

    通过前面的学习,我们已经能够正常训练各种数据了.设置好solver.prototxt后,我们可以把训练好的模型保存起来,如lenet_iter_10000.caffemodel. 训练多少次就自动保存 ...

  4. 【转】Laravel+Angularjs+D3打造可视化数据,RESTful+Ajax

    http://897371388.iteye.com/blog/1975351 大致思路也就是下面,由于最近在学Laravel也在学Angularjs,加上之前做的项目用到了d3. 原来的方案如下: ...

  5. Echarts数据可视化全解注释

    全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...

  6. NLP︱词向量经验总结(功能作用、高维可视化、R语言实现、大规模语料、延伸拓展)

    R语言由于效率问题,实现自然语言处理的分析会受到一定的影响,如何提高效率以及提升词向量的精度是在当前软件环境下,比较需要解决的问题. 笔者认为还存在的问题有: 1.如何在R语言环境下,大规模语料提高运 ...

  7. R语言︱LDA主题模型——最优主题数选取(topicmodels)+LDAvis可视化(lda+LDAvis)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:在自己学LDA主题模型时候,发现该模 ...

  8. 大数据时代的图表可视化利器——highcharts,D3和百度的echarts

    大数据时代的图表可视化利器——highcharts,D3和百度的echarts https://blog.csdn.net/minidrupal/article/details/42153941   ...

  9. Python:数据可视化pyecharts的使用

    什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生 ...

随机推荐

  1. git HEAD游离状态问题解决

    最近在迭代一个版本的时候,出现 HEAD detached at xxx 提示,应该是我切换分支的时候,哪里没弄对.   那么可以通过如下办法解决 git checkout 05 # 先checkou ...

  2. PHP打开空白的解决办法

    先打开错误提示,再查找原因 找到php.ini # 显示错误:On开启,Off关闭 display_errors = On 也可在php文件中加入以下任意一行代码 # 禁用错误报告 error_rep ...

  3. css 初始包含块

    continuous media ,paged media 关于continuous media[连续媒体]和paged media[分页媒体] 直白的讲,continuous和paged media ...

  4. bzoj1607

    题解: 帅选法 把相同的放在一起 代码: #include<bits/stdc++.h> using namespace std; ; int n,a[N],s[N],M,ss[N]; i ...

  5. HTML(一)基础

    一.HTML简介 文本标记语言,即HTML(Hypertext Markup Language),是用于描述网页文档的一种标记语言. HTML之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接 ...

  6. Beand的高级特征

    Spring程序中,Java Bean一般与Spring是非耦合的,不会依赖于Spring类库.这也是Spring的优点. 实现BeanNameAware接口获取本bean的id属性 BeanName ...

  7. ios平台cocos2d-x播放音频、视频、音效的Demo(支持网络视频)

    最近由ios应用转做游戏,游戏开始时需要播放一个视频,由于本身cocos2d-x播放视频的相关库,在网上搜到的资料都不是很全,我自己试过在cocos2dx直接调用ios的MediaPlayer来播放, ...

  8. anu - controlledComponent

    /** input, select, textarea这几个元素如果指定了value/checked的**状态属性**,就会包装成受控组件或非受控组件 受控组件是指,用户除了为它指定**状态属性**, ...

  9. NodeJS 难点(网络,文件)的 核心 stream 一:Buffer

    stream应用一图片转存服务 stream github教程 文件操作和网络都依赖了一个很重要的对象—— Stream, 而这个 <node深入浅出> 没有分析的, 所以读完这本书, 在 ...

  10. webbench源码学习-->命令行选项解析函数getopt和getopt_long函数

    对于webbench这个网站压力测试工具网上介绍的很多,有深度详解剖析的,对于背景就不在提了, 听说最多可以模拟3万个并发连接去测试网站的负载能力,这里主要是学习了一下它的源码,做点 笔记. 官方介绍 ...