问:什么是BI?

答:BI是商务智能,它包含的应用系统和技术较宽泛,通过收集,存储,分析和提供对数据的访问,来帮助企业用户做出更好的商务决策。

BI应用包括决策支持,查询和报表,联机分析处理OLAP,统计分析,预测和数据挖掘等活动,

问:什么是ETL?(Extraction-Transformation-Loading)

答:是将业务系统的数据抽取,转换和装载的过程。

问:什么是DW?(Date Warehousing)

答:数据仓库是面向主题的,集成的,稳定的,随时间变化的,主要用于决策支持的数据库系统。

问:什么是DM?(Date Mart)

答:是根据部门的需求,可以有不同的数据集市。数据集市保存的是已经汇聚的数据。

问:什么是数据仓库

答:是决策支持系统(dss)和联机分析应用数据源的结构化数据环境

问:ETL的整个过程是什么?

答:抽取、迁移和加载(ETL)过程是将数据从源系统向数据仓库转移。具体的说,ETL 过程

主要完成以下工作:

¾  存储源系统的结构和内容信息。

¾  存储数据仓库的结构和内容信息。

¾  把业务操作系统的结构与内容信息和数据仓库的相关信息进行关联

¾  提供信息给数据抽取工具,将数据从源系统转移到数据仓库之中。

第一个步骤是从源系统提取,或者抓数据。

第二个步骤是转换数据并准备把它加载到数据仓库。转换处理包括转换数据类型和名称,清除有误数据,纠正拼写错误,填充到不完整的数据,等等。

第三个步骤,也是最后一步就是加载数据到数据仓库中

①表达式组件(Expression)

作用:里面有很多函数,可以设置参数,用于计算值。

②筛选组件(filter)

作用:根据条件过滤不符合条件的行(过滤条件就是返回真或假的表达式,真就进入下一个组件,假就过滤)

③汇总器转换组件(aggregator)

作用:汇总计算(求平均值avg,求和sum,最大值max,最小值min,统计count)

④查找转换组件(lookup)是常用的组件

作用:获取一个想关联的值,查找值,(可查找另一张表相同的值,返回指定的值)

点开查找组件会出现下面框框,这是找要关联的表(可比较)

⑤路由器转换组件(router)

作用:根据组条件将数据发送至多个转换。(可以分成多个表)

⑥存储过程转换(expression)

作用:调用数据库中的存储过程(需要先填用户,再调用)

⑦排序转换组件(Sorter)

作用:根据排序键对数据进行排序。

⑧等级转换组件(rank)

作用:将记录限制在顶部或底部范围。(就是截取的功能)

informatica 学习总结的更多相关文章

  1. informatica 学习日记整理

    1. INFORMATICA CLIENT的使用 1.1 Repository Manager 的使用 1.1.1 创建Repository. 前提: a.在ODBC数据源管理器中新建一个数据源连接至 ...

  2. Informatica学习笔记

    Informatica学习笔记1:UPDATE AS INSERT 问:要求实现每天抽取数据,而且是如果有改变才抽取更新,没有就不更新,因为源表中有最后修改时间的字段,我让它 和SESSION上次运行 ...

  3. Informatica学习:1、安装介质的获取与安装

    本文目标: 为方便学习Informatica工具,在个人电脑上部署Informatica Powercenter. 所用系统:win7 64位. Informatica安装包括服务器端.客户端安装两个 ...

  4. Informatica学习:3、用户创建与权限管理

    环境:win7 下安装Informatica 9.6.1 服务器端与客户端作为学习之用,Linux大同小异 一.用户创建(服务器端) 1.登陆admin console (1)打开Admin Cons ...

  5. Informatica学习:2、配置存储库服务和集成服务

    继续上一篇的1.安装介质的获取与安装,本文介绍服务端的存储库服务和集成服务的配置. 安装好Informatica的客户端和服务端后,需要登陆Administration Console,配置存储库服务 ...

  6. informatica9 安装下载,安装教程 介质(文章和视频教程)(csdn讲师:Array)

    Informatica学习:  参考文献:视频参考地址:http://edu.csdn.net/course/detail/5034,ETL之informatica9通关班(第二期) 1.安装介质的获 ...

  7. informatica powercenter学习笔记(三)

    以前在做DBA时在DB里写过行转列,列转行的CODE.这两天做了一下测试用INFORMATICA来实现行列互换的功能. 列转行的SQL 实现 ENV: RMDB TABLE: SALES STOREN ...

  8. informatica powercenter学习笔记(一)

    本文转摘:http://blog.itpub.net/22377317/viewspace-677137/ 1 informatica powercenter的下载: 方法一:去年我是在ORACLE ...

  9. informatica powercenter学习笔记(LookUp 使用)

    LOOKUP TRANSFORMATION的使用点评: LOOKUP基本用法不熟的话请参考下附属信息. 用法感受: 1 LOOKUP的作用跟我们以前在EXCEL的函数功能类似,就是隔表取值.优点就是用 ...

随机推荐

  1. nodeJS之流stream

    前面的话 当内存中无法一次装下需要处理的数据时,或者一边读取一边处理更加高效时,我们就需要用到数据流.NodeJS中通过各种Stream来提供对数据流的操作.本文将详细说明NodeJS中的流strea ...

  2. Azure 基础:Table storage

    Azure Storage 是微软 Azure 云提供的云端存储解决方案,当前支持的存储类型有 Blob.Queue.File 和 Table.其中的 Table 就是本文的主角 Azure Tabl ...

  3. ssh代理上网

    背景: 公司开发机没有外网,但可以通过ssh连接到另一台可以上公网的机器,所以想通过ssh代理的方式上网,简单又方便,而且需要的时候上,不需要的时候也可以不上 配置: 超级简单 在开发机上建立ssh隧 ...

  4. 依赖注入之Autofac使用总结

    依赖倒置?控制反转(IOC)? 依赖注入(DI)? 你是否还在被这些名词所困扰,是否看了大量理论文章后还是一知半解了? 今天我想结合实际项目,和正在迷惑中的新手朋友一起来学习和总结依赖注入Autofa ...

  5. Realm的一对多配置以及版本兼容

    前言:本篇博客将介绍Realm的一些高级用法,基本使用在这里 一.配置一对多关系 // // Teacher.h #import <Realm/Realm.h> #import " ...

  6. Java IO学习笔记二

    Java IO学习笔记二 流的概念 在程序中所有的数据都是以流的方式进行传输或保存的,程序需要数据的时候要使用输入流读取数据,而当程序需要将一些数据保存起来的时候,就要使用输出流完成. 程序中的输入输 ...

  7. python 打印文件里的内容

    >>> import os >>> os.chdir ('e:/')>>> data=open('text.txt')>>> f ...

  8. Ztorg木马分析: 从Android root木马演变到短信吸血鬼

    本月第二次,Google 从官方应用商店 Google Play 中移除了伪装成合法程序的恶意应用.被移除的应用都属于名叫 Ztorg 的 Android 恶意程序家族.目前为止,发现的几十个新的Zt ...

  9. Loadrunner12解决无法录制chrome及脚本为空问题

    首先,得安装LR12,一般用LR12录制,由于未破解,用LR11跑并发. LR12官方文档说明里是支持chrome及火狐的,但是实际录制起来,还是有一定的问题,目前发现的问题主要有两个: (1)LR录 ...

  10. PHP+Redis 不注意这些细节简直就是跳入一个出不来的坑(windows下安装)

    开门见山~~~~~~~ 首先要做的一件事情!确认版本!一定要确认你的php版本! phpinfo  看一下你目前的版本是多少,目前我的版本是 在标红的几处区域可以看到,vc11 TS x86 三处关键 ...