商业智能(BI,Business Intelligence)。它是一套完整的解决方式,用来将企业中现有的数据进行有效的整合,高速准确的提供报表并提出决策根据。帮助企业做出明智的业务经营决策。

    商业智能的概念最早在1996年提出。

当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。

眼下,商业智能通常被理解为将企业中现有的数据转化为知识。帮助企业做出明智的业务经营决策的工具。商务智能系统中的数据来自企业其它业务系统。

比如商贸型企业,其商务智能系统数据包含业务系统的订单、库存、交易账目、客户和供应商信息等。以及企业所处行业和竞争对手的数据、其它外部环境数据。而这些数据可能来自企业的CRM、SCM等业务系统。

商业智能能够辅助的业务经营决策,既能够是操作层的。也能够是战术层和战略层的决策。为了将数据转化为知识。须要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。

因此,从技术层面上讲,商业智能不是什么新技术,它仅仅是数据仓库、OLAP和数据挖掘等技术的综合运用。传统的商业智能系统一般採用下面的系统架构进行构建。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYmx1ZWJlbGZhc3Q=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" height="286" width="363" alt="">

系统主要由三层构成:各自是1)数据抽取层即传统的ETL。2)数据分析层,即传统的数据仓库;3)数据展示层。即传统的OLAP。

BI系统是一类提供给使用者对数据进行分析的工具,自然而然其应该具有强大的数据处理和分析能力。随着大数据时代的来临。对于大量数据的高速分析能力的需求成为BI系统的需求之中的一个。因此也给传统的BI分析架构带来了革命性的变革。依据TDWI对48加BI使用企业和生产企业的一份分析报告指出,例如以下图所看到的

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYmx1ZWJlbGZhc3Q=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" height="273" width="529" alt="">

国外近80%的企业都正在或准备3年内将大数据分析结合进传统的BI系统中。

通过结合大数据分析技术。能够在分析能力和分析类型上对传统的BI系统进行扩展。详细描写叙述例如以下:

1、分析能力的增强:通过将Hadoop等分布式大数据分析平台结合进BI系统能够增强数据的分布式并行处理能力,从而从底层添加计算能力。为传统的数据挖掘分析带来新奇血液。

2、分析能力的扩展:结合大数据分析,能够将以往无法分析的非结构化数据或半结构化数据分析结合进BI系统,极大的扩展Bi系统的分析能力。

3、对专家系统的机器学习补充:传统的BI系统数据仓库和数据集市是由专家知识构建的,这种专家知识可能随着业务的变迁或扩展不再全然准确,因此BI系统假设想真正实现智能化的分析过程,不仅须要专家知识,更须要从与实际业务实时相关的数据中分析出数据的关联性和知识性。因而对于智能化的数据分析与挖掘能力的需求与日俱增。大数据分析能力正好弥补了传统BI系统无法从数据中机器学习和分析的能力的不足。

针对BI技术的大数据扩展趋势,眼下多家公司都制定了自己的融合软件架构方案。

当中Pentaho作为一家开源的BI开发公司也实现了自己的BI融合Hadoop架构。在著名的开源ETL项目Kettel5.0版本号中已经实现了大数据补丁。提供与大数据分析系统的交互。

其架构例如以下。

清晰可见的hadoop小象。通过其PDI(pentaho date integration)层主要是ETL,实现与传统的关系数据库和hadoop间进行交互。同一时候其也提出了结合hadoop的大数据分析虚拟层。

眼下国内基本的BI生产商大多还是採用的传统架构作为实现方案。也有不少国内主要BI开发企业正在向或计划实践大数据分析BI系统的改造。

在分析工具中而论。下一个时代非常定时大数据分析的时代。

(甚至在机器学习,模型学习研究领域也正在採用hadoop或storm此类分布式和实时分析平台构建模型,各类传统的机器模式技术,图像识别、语音识别等也正在向大数据分析转型。看样以后做机器智能和学习的,没个hadoop都不好做实验了)。

大数据时代的新BI系统架构发展趋势的更多相关文章

  1. 大数据时代,银行BI应用的方案探讨

    大数据被誉为21世纪发展创造的新动力,BI(商业智能)成为当下最热门的数据应用方案.据资料显示:当前中国大数据IT投资最高的为五个行业中,互联网最高.其次是电信.金融.政府和医疗.而在金融行业中,银行 ...

  2. 大数据时代的IT架构设计

    大数据时代的IT架构设计(来自互联网.银行等领域的一线架构师先进经验分享) IT架构设计研究组 编著   ISBN 978-7-121-22605-2 2014年4月出版 定价:49.00元 208页 ...

  3. 柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装、配置与监控

    柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装.配置与监控 一.安装 1.安装Erlang 1)系统编译环境(这里采用linux/unix 环境) ① 安装环境 虚拟机:VMw ...

  4. 柯南君:看大数据时代下的IT架构(5)消息队列之RabbitMQ--案例(Work Queues起航)

    二.Work Queues(using the Java Client) 走起   在第上一个教程中我们写程序从一个命名队列发送和接收消息.在这一次我们将创建一个工作队列,将用于分发耗时的任务在多个工 ...

  5. 看大数据时代下的IT架构(1)业界消息队列对比

    一.MQ(Message Queue) 即 消息队列,一般用于应用系统解耦.消息异步分发,能够提高系统吞吐量.MQ的产品有很多,有开源的,也有闭源,比如ZeroMQ.RabbitMQ. ActiveM ...

  6. 新书发布《大数据时代的IT架构设计》

    <大数据时代的IT架构设计>以大数据时代为背景,邀请著名企业中的一线架构师,结合工作中的实际案例展开与架构相关的讨论.<大数据时代的IT架构设计>作者来自互联网.教育.传统行业 ...

  7. 柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航)

    柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航) 二.起航 本章节,柯南君将从几个层面,用官网例子讲解一下RabbitMQ的实操经典程序案例,让大家重 ...

  8. 跟上节奏 大数据时代十大必备IT技能(转)

    新的想法诞生新的技术,从而造出许多新词,云计算.大数据.BYOD.社交媒体……在互联网时代,各种新词层出不穷,让人应接不暇.这些新的技术,这些新兴应用和对应的IT发展趋势,使得IT人必须了解甚至掌握最 ...

  9. 跟上节奏 大数据时代十大必备IT技能

    跟上节奏 大数据时代十大必备IT技能 新的想法诞生新的技术,从而造出许多新词,云计算.大数据.BYOD.社交媒体……在互联网时代,各种新词层出不穷,让人应接不暇.这些新的技术,这些新兴应用和对应的IT ...

随机推荐

  1. 优动漫PAINT-樱花教程

    很雅致清新的樱花教程~在很多地方都可以运用到哟~原文转载自优动漫官网. 想要Get到更多有关优动漫的信息包括软件下载,可关注http://www.dongmansoft.com.

  2. Vrtualbox虚拟机中共享文件夹配置

    虚拟机装的是ubuntu 16.0.4版本的linux,本机是macOs 10.12.1版本 Vrtualbox进行如下配置 在Vrtualbox-->设置-->共享文件夹-->添加 ...

  3. pyftpdlib 搭建ftp环境

    环境搭建: pythonwindows/linuxpip install pyftpdlib (安装失败请到这里下载:https://pypi.python.org/pypi/pyftpdlib/)一 ...

  4. pycharm日常填坑

    pycharm坑很多,今天又遇见了,好吧 ,填坑 场景:从别的地方拷贝过来的项目,导入本地的pycharm 然后选择 然后 还会报错....心累 报错内容: django commands canno ...

  5. 搭建rsync实时同步

    1.本实验基于centos6.5服务器做的 cat cat /etc/redhat-release 2.在配置环境之前需要先将服务器自带的rsync卸除 yum -y remove rsync* 3. ...

  6. numpy基础篇-简单入门教程4

    np.set_printoptions(precision=3),只显示小数点后三位 np.random.seed(100) rand_arr = np.random.random([2, 2]) n ...

  7. python基础6(函数 Ⅰ)

    函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段 定义 def function_name(args...): function_body #例子 def print_somethin ...

  8. Docker_入门?只要这篇就够了!(纯干货适合0基础小白)

    与sgy一起开启你的Docker之路 关键词: Docker; mac; Docker中使用gdb无法进入断点,无法调试; 更新1: 看起来之前那一版博文中参考资料部分引用的外站链接太多,被系统自动屏 ...

  9. Android核心服务解析篇(三)——Android系统的启动

    从大的方面来说.Android系统的启动能够分为两个部分:第一部分是Linux核心的启动,第二部分是Android系统的启动. 第一部分主要包含系统引导,核心和驱动程序等,因为它们不属于本篇要讲的内容 ...

  10. Ubuntu 10.04 右上角网络管理图标消失的解决的方法

           那个显示网络状态的那个图标.叫做:network-manager.假设是有线网络连接的话.是上下两个箭头,假设是无线网络的话.是一个发射信号的形状. sudo gedit /etc/Ne ...