​相信关注过我们的肯定知道BI是什么,但是老话常谈以防新朋友不知道BI的含义,BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确地提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 一.BI系统在企业数据决策中能做什么 1.通过数据分析了解企业业务过去做过什么,BI系统对企业现有数据进行整合,以固定报表.数据图表.仪表盘的方式呈现. 2.从数据中了解为什么会发生,通过即席查询.OLAP分析和数据挖掘技术,对各…
胡亚海 首席技术官  CTO 北京航空航天大学  博士 深耕互联网领域近20年,先后任职于普天信息技术研究院.摩托罗拉.宇龙酷派.百度等知名企业,曾主导宇龙酷派公司全员从WinCE向Android转型,并作为百度移动云技术委员会成员,参与核心架构设计和业务规划.在手机系统研发.云生态技术架构与业务规划等领域拥有丰富经验,擅长技术体系搭建.大数据平台.运维与云服务平台化. 今天非常有幸采访掌众金服的胡总,就掌众金服的业务发展和信贷风控的自动化实施进行了交流. 信数:请胡总简单介绍下掌众金服和主要的…
大数据量文本文件高效解析方案代码实现 测试环境 Python 3.6.2 Win 10 内存 8G,CPU I5 1.6 GHz 背景描述 这个作品来源于一个日志解析工具的开发,这个开发过程中遇到的一个痛点,就是日志文件多,日志数据量大,解析耗时长.在这种情况下,寻思一种高效解析数据解析方案. 解决方案描述 1.采用多线程读取文件 2.采用按块读取文件替代按行读取文件 由于日志文件都是文本文件,需要读取其中每一行进行解析,所以一开始会很自然想到采用按行读取,后面发现合理配置下,按块读取,会比按行…
Druid是一个用于大数据实时查询和分析的高容错.高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析.尤其是当发生代码部署.机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持100%正常运行.创建Druid的最初意图主要是为了解决查询延迟问题,当时试图使用Hadoop来实现交互式查询分析,但是很难满足实时分析的需要.而Druid提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性能而采取了特殊的存储格式. Druid功能介于PowerDrill和Dremel…
转自:http://www.36dsj.com/archives/28590 Druid 是一个用于大数据实时查询和分析的高容错.高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析.尤其是当发生代码部署.机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持100%正常运行.创建Druid的最初意图主要是为了解决查询延迟问题,当时试图使用Hadoop来实现交互式查询分析,但是很难满足实时分析的需要.而Druid提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性…
经过多年信息化建设,我们已经进入一个神奇的“大数据”时代,无论是在通讯社交过程中使用的微信.QQ.电话.短信,还是吃喝玩乐时的用到的团购.电商.移动支付,都不断产生海量信息数据,数据和我们的工作生活密不可分.须臾难离. >>>> 什么是大数据 什么是大数据,多大算大,100G算大么?如果是用来存储1080P的高清电影,也就是几部影片的容量.但是如果100G都是文本数据,比如云智慧透视宝后端kafka里的数据,抽取一条mobileTopic的数据如下:[107,55053230546…
多元化集团企业在发展到一定阶段后,往往会遇到业务与财务分离.管理缺乏系统决策支持等管理问题.财务决策支持系统建设实施BI是管理升级的内在要求. 1996年,加特纳集团提出了商业智能(Businesintelligence.BI)的概念.BI系统一般由数据仓库.数据挖掘.数据转换等技术手段组成.从不同的系统中提取数据,并通过ETL过程合并到企业的数据仓库,从而获得全局视图.一方面解决了企业信息系统无顶层设计的弊端,是大数据支持管理的需要:另一方面,也是集团企业领导业务决策可视化的迫切需要. 一.B…
引言 Druid 是一个快速,近实时的查询海量只读数据的系统.Druid 的目标是可用性要达到100%,即使在部署新代码,或者某些节点 down 机的情况下. Druid 目前支持的单表查询方式和 Dremel,PowerDrill 比较相似.它的主要特性如下: 1.支持嵌套数据的列式存储 2.层级查询 3.二级索引 4.实时数据抽取 5.分布式容错架构 同 PowerDrill 和 Dremel 相比,从功能的角度来说,Druid 几乎实现了 Dremel 提供的所有功能,并且参考了 Powe…
节后上班第一天,新一代大数据任务调度 - Apache DolphinScheduler(incubator) 就迎来了好消息 - 在社区 20 多位小伙伴的贡献与努力下,社区发布了 1.3.5 版本,1.3.5 作为 1.3.x 的 bug 修复版本,本次共修复了 1.3.4 版本发现的 10 多处 bug . BUG FIX 请参考下列内容: [#3237][Docker] the file requirements.yaml in helm mode has error flag [#32…
| 本文编辑:朱桐 新一代大数据任务调度 - Apache DolphinScheduler(incubator) 在经过社区 30 多位小伙伴的贡献与努力下于发布了 1.3.4 版本,1.3.4 作为 1.3.x 的 bug 修复版本,本次共修复了 1.3.3 发现的 10 多处 bug,其中多数 bug 是测试伙伴在极端环境下发现的.1.3.4 重要的修复需要关注下面这个: 1 个重要修复 现象: 任务实例(taskInstance) 状态更改错误:[#4084][server] fix t…