可视化mark
待尝试研究的可视化组件及产品:
- 开源组件
- 商业组件
开源组件
- zeppelin
- Caravel
- D3.js
- Flare
- talend(ETL)
- pentaho
- spagoBI
- NanoCubs
- Dygraphs
- Saiku
- airpal
- Chart.js
- chartist.js
- ECharts
- FnordMetric
- redash
- zingchart
zeppelin
- 主页:
- apache 开源产品
- 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前的工具
- http://www.pointtec.de/zeppelin/
Caravel
- Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析
- 快速创建数据可视化互动仪表盘
- 丰富的可视化图表模板,灵活可扩展
- 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)
- 简洁的语义层,可以控制数据资源在 UI 的展现方式
- 与 Druid 深度集成,可以快速解析大规模数据集
- https://github.com/airbnb/superset
- https://segmentfault.com/a/1190000005083953
D3.js
- 一个强调网页标准的用来创建数据可视化JavaScript库。使用HTML、SVG和CSS,可以让使用者以数据驱动的方式去操作DOM,能够满足现在浏览器的兼容性并且不受专用框架的限制。
- 示例地址:https://github.com/d3/d3/wiki/Gallery
Flare
- 处理复杂、交互式图表、支持数据管理、视觉编码、动画和交互作用,各种可视化表格从时间线到多层图表来说明关系
- 演示地址:http://flare.prefuse.org/demo
- 关注演示部分:
- layout -> intent
talend
- 网址:https://www.talend.com/download/talend-open-studio/
- 即提供免费版本,也提供收费版本
Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。 两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码
易用性:
- Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供
- Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
- 技术支持:
- Talend:主要在美国
- Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员
- 部署:
- Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
- Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署
- 速度
- Talend:需要手工调整,对特定数据源有优化知识
- Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计
- 数据质量:
- Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
- Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
pentaho
- 网址:http://www.pentaho.com/product/big-data-analytics
- pentaho自称为“全面的数据集成和商业智能平台”,该公司主要大力推销它的商业软件,该软件基于开源社区。
- Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案
- 功能和特点
◆ 工作流引擎:Shark and JaWE
◆ 数据库:Firebird RDBMS
◆ 集成管理和开发环境:Eclipse
◆ 报表工具:Eclipse BIRT
◆ ETL工具:Enhydra/Kettle
◆ OLAP Server:Mondrian
◆ OLAP展示:JPivot
◆ 数据挖掘组件:Weka
◆ 应用服务器和Portal服务器:JBoss
◆ 单点登陆服务及LDap认证:JOSSO
◆ 自定义脚本支持:Mozilla Rhino Javascript脚本处理器
spagoBI
- 相比Pentaho,spagoBI完全免费
- 包括用于报表、olap、图表、位置情报、数据挖掘、ETL和更多其它方面的工具,还实现与流行的内存处理引擎整合,能够实现实时处理
- 网址:http://www.spagobi.org/homepage/product/real-time/
- 参照学习笔记 :http://blog.csdn.net/zry3942522/article/category/1122641
NanoCubs
- 在日常电脑上可提供对亿级时空数据的快速展示和多级实时钻取探索分析
- 网址:http://nanocubes.net/
- 关注: http://nanocubes.net/view.html#flights (分时段热力图?)
Dygraphs
- Dygraphs是一个开源的JS库;用于生成可与用户交互的、可缩放的时间图表。主要用于显示密集的数据集合,用户能够很好的浏览和查看数据
- demo地址: http://dygraphs.com/
- 参考学习笔记:http://blog.csdn.net/yangqingqo/article/details/8456325
Saiku
- Saiku是一个模块化的开源分析套件,它提供轻量级的OLAP(联机分析处理),并且可嵌入、可扩展、可配置
- Saiku通过REST API连接OLAP系统,利用其友好的界面为用户提供直观的分析数据的方式,它是基于jQuery做的前端界面
- 网址:http://www.analytical-labs.com/
- 源码:https://github.com/OSBI/saiku
- 学习参考笔记:http://www.cnblogs.com/Jason-Xiang/category/747640.html
airpal
- Airpal 是一个基于 Web 的查询执行工具,利用 Facebook 的 PrestoDB 进行查询和获取结果。提供了查找表、元数据、浏览数据行,编写和执行查询的功能,这些功能全部通过浏览器完成。一旦查询开始执行,用户可跟踪查询进度获取并下载结果。查询的结果可生成新的 Hive 表用于进一步的分析
- 源码地址:https://github.com/airbnb/airpal
- 项目特性:
•可选的用户访问控制
•SQL语法高亮
•查询结果导出到CSV文件,或者存到Hive表中
•可查看SQL查询的历史记录
•可保存查询
•根据表名搜索对应的表
•可查看表结构,并预览前1000行数据
Chart.js
- chart.js 是一个简单、面向对象、为设计者和开发者准备的图表绘制工具库
- ChartJS 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库
- 网址:http://www.bootcss.com/p/chart.js/
chartist.js
- hartist.js 是简单的响应式图表,可以作为前端图表生成器
- 网址:http://gionkunz.github.io/chartist-js/
ECharts
- 百度企业场景图表
- http://echarts.baidu.com/
FnordMetric
- FnordMetric是一个使用SQL语句来实现数据收集和可视化的框架,它使用chartsql扩展了标准的sql,允许你编写查询语句来返回图表而不是返回表,查询结果作为SVG向量图或者images来呈现出来。这些图表可以很容易嵌入一个web站点中,这样你就可以在短短几分钟内绘制漂亮的图表
- 网址: http://fnordmetric.io/
- 参考:http://blog.csdn.net/itas109/article/details/52311390
redash
- re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
- 访问地址: https://redash.io/
zingchart
- https://www.zingchart.com/about-us/
- 网址:https://github.com/zingchart
- 参考:http://bbs.pinggu.org/thread-3666754-1-1.html
商业组件
- Ethink
- Tableau
- PowerBI
- FineReport
- Style Intelligence
- sisense
EThink
- 公司地址: http://www.ethinkbi.com/#
- 演示: http://www.ethinkbi.com/try/
- 说明:安徽象形信息科技有限公司(ETHINK)是国内大数据产品及方案服务商,专注于大数据,BI,大数据分析,大数据挖掘工具领域,是一家国内大数据分析产品领域的领导企业
- 关注点:
- 地图下钻(缺点:不能按比例缩放) http://120.26.36.169:8088/ethinknew/user?type=item2
- K线图:关注下面关联的时间轴
Tableau
- 公司地址:https://www.tableau.com/
- 相关评价:
- 混合数据源
- 高效快速
- Tableau9.0版本开始支持中国地图
- 产品分类:
- Tableau Desktop:收费,分个人版跟专业版,个人版只能连本地文件,专业版则无限制。Tableau制作端,创建可视化图表的软件
- Tableau Server:收费。可以发布做好的可视化图表,在浏览器或者移动设备上即可查看,共享、协作提高数据分析决策效率
- Tableau Online:收费,按年收取。基于云的服务,简单来讲就是云计算版server,企业不用自己部署Tableau server服务,通过Tableau自己的云端服务器,处理发布出去的可视化图表,同样能达到server的效果。不过由于服务器不在中国境内,运行效率可能会受到影响
- Tableau Public:免费。可在线分享自己的工作表、仪表板以及故事,与更多的人交流交互式数据故事
- Tableau Reader:免费。Tableau阅读器可打开并查看Desktop中生成的可视化图表,并且能进行可视化交互、筛选、钻取和查看明细
- 关注点:
- 图表丰富,操作简单
- 交叉表
PowerBI
- 微软产品
- https://powerbi.microsoft.com/en-us/blog/
- https://powerbi.microsoft.com/en-us/guided-learning/powerbi-learning-0-0b-building-blocks-power-bi
- https://powerbi.microsoft.com/en-us/documentation/powerbi-spark-on-hdinsight-with-direct-connect/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-personal-gateway
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-upgrade-as-connector/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-power-bi-pro-content-what-is-it/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-manage-sql/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-gateway-enterprise-indepth/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-service-self-service-signup-for-power-bi/
- https://powerbi.microsoft.com/en-us/documentation/powerbi-admin-data-management-gateway-in-office-365/
FineReport
- 演示地址: http://www.finereporthelp.com:8889/demo/ReportServer?op=fs
- 公司主页: http://www.finereport.com/product
- FineReport报表软件是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具
- 传统报表类工具,没啥新意
Style Intelligence
- Style Intelligence 是由美国英网软件技术公司自主研发意为全球企业级客户提供简单、敏捷、高效的商业智能软件
- 访问: https://www.passionned.com/business-intelligence/tools/style-intelligence/
sisense
- 支持组合多个数据源,可以让用户从丰富的数据可视化数据中发现及分享见解
- 网址:https://www.sisense.com
- 微软 Azure Marketplace : https://azuremarketplace.microsoft.com/en-us/marketplace/apps/sisense.sisense_byol
可视化mark的更多相关文章
- 百度数据可视化图表套件echart实战
最近我一直在做数据可视化的前端工作,我用的最多的绘图工具是d3.d3有点像photoshop,功能很强大,例子也很多,但是学习成本也不低,做项目是需要较大人力投入的.3月底由在亚马逊工作的同学介绍下使 ...
- Caffe学习系列(17):模型各层数据和参数可视化
cifar10的各层数据和参数可视化 .caret,.dropup>.btn>.caret{border-top-color:#000!important}.label{border:1p ...
- Caffe学习系列(16):caffemodel可视化
通过前面的学习,我们已经能够正常训练各种数据了.设置好solver.prototxt后,我们可以把训练好的模型保存起来,如lenet_iter_10000.caffemodel. 训练多少次就自动保存 ...
- 【转】Laravel+Angularjs+D3打造可视化数据,RESTful+Ajax
http://897371388.iteye.com/blog/1975351 大致思路也就是下面,由于最近在学Laravel也在学Angularjs,加上之前做的项目用到了d3. 原来的方案如下: ...
- Echarts数据可视化全解注释
全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...
- NLP︱词向量经验总结(功能作用、高维可视化、R语言实现、大规模语料、延伸拓展)
R语言由于效率问题,实现自然语言处理的分析会受到一定的影响,如何提高效率以及提升词向量的精度是在当前软件环境下,比较需要解决的问题. 笔者认为还存在的问题有: 1.如何在R语言环境下,大规模语料提高运 ...
- R语言︱LDA主题模型——最优主题数选取(topicmodels)+LDAvis可视化(lda+LDAvis)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:在自己学LDA主题模型时候,发现该模 ...
- 大数据时代的图表可视化利器——highcharts,D3和百度的echarts
大数据时代的图表可视化利器——highcharts,D3和百度的echarts https://blog.csdn.net/minidrupal/article/details/42153941 ...
- Python:数据可视化pyecharts的使用
什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生 ...
随机推荐
- git HEAD游离状态问题解决
最近在迭代一个版本的时候,出现 HEAD detached at xxx 提示,应该是我切换分支的时候,哪里没弄对. 那么可以通过如下办法解决 git checkout 05 # 先checkou ...
- PHP打开空白的解决办法
先打开错误提示,再查找原因 找到php.ini # 显示错误:On开启,Off关闭 display_errors = On 也可在php文件中加入以下任意一行代码 # 禁用错误报告 error_rep ...
- css 初始包含块
continuous media ,paged media 关于continuous media[连续媒体]和paged media[分页媒体] 直白的讲,continuous和paged media ...
- bzoj1607
题解: 帅选法 把相同的放在一起 代码: #include<bits/stdc++.h> using namespace std; ; int n,a[N],s[N],M,ss[N]; i ...
- HTML(一)基础
一.HTML简介 文本标记语言,即HTML(Hypertext Markup Language),是用于描述网页文档的一种标记语言. HTML之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接 ...
- Beand的高级特征
Spring程序中,Java Bean一般与Spring是非耦合的,不会依赖于Spring类库.这也是Spring的优点. 实现BeanNameAware接口获取本bean的id属性 BeanName ...
- ios平台cocos2d-x播放音频、视频、音效的Demo(支持网络视频)
最近由ios应用转做游戏,游戏开始时需要播放一个视频,由于本身cocos2d-x播放视频的相关库,在网上搜到的资料都不是很全,我自己试过在cocos2dx直接调用ios的MediaPlayer来播放, ...
- anu - controlledComponent
/** input, select, textarea这几个元素如果指定了value/checked的**状态属性**,就会包装成受控组件或非受控组件 受控组件是指,用户除了为它指定**状态属性**, ...
- NodeJS 难点(网络,文件)的 核心 stream 一:Buffer
stream应用一图片转存服务 stream github教程 文件操作和网络都依赖了一个很重要的对象—— Stream, 而这个 <node深入浅出> 没有分析的, 所以读完这本书, 在 ...
- webbench源码学习-->命令行选项解析函数getopt和getopt_long函数
对于webbench这个网站压力测试工具网上介绍的很多,有深度详解剖析的,对于背景就不在提了, 听说最多可以模拟3万个并发连接去测试网站的负载能力,这里主要是学习了一下它的源码,做点 笔记. 官方介绍 ...