informatica 学习总结
问:什么是BI?
答:BI是商务智能,它包含的应用系统和技术较宽泛,通过收集,存储,分析和提供对数据的访问,来帮助企业用户做出更好的商务决策。
BI应用包括决策支持,查询和报表,联机分析处理OLAP,统计分析,预测和数据挖掘等活动,
问:什么是ETL?(Extraction-Transformation-Loading)
答:是将业务系统的数据抽取,转换和装载的过程。
问:什么是DW?(Date Warehousing)
答:数据仓库是面向主题的,集成的,稳定的,随时间变化的,主要用于决策支持的数据库系统。
问:什么是DM?(Date Mart)
答:是根据部门的需求,可以有不同的数据集市。数据集市保存的是已经汇聚的数据。
问:什么是数据仓库
答:是决策支持系统(dss)和联机分析应用数据源的结构化数据环境
问:ETL的整个过程是什么?
答:抽取、迁移和加载(ETL)过程是将数据从源系统向数据仓库转移。具体的说,ETL 过程
主要完成以下工作:
¾ 存储源系统的结构和内容信息。
¾ 存储数据仓库的结构和内容信息。
¾ 把业务操作系统的结构与内容信息和数据仓库的相关信息进行关联
¾ 提供信息给数据抽取工具,将数据从源系统转移到数据仓库之中。
第一个步骤是从源系统提取,或者抓数据。
第二个步骤是转换数据并准备把它加载到数据仓库。转换处理包括转换数据类型和名称,清除有误数据,纠正拼写错误,填充到不完整的数据,等等。
第三个步骤,也是最后一步就是加载数据到数据仓库中
①表达式组件(Expression)
作用:里面有很多函数,可以设置参数,用于计算值。
②筛选组件(filter)
作用:根据条件过滤不符合条件的行(过滤条件就是返回真或假的表达式,真就进入下一个组件,假就过滤)
③汇总器转换组件(aggregator)
作用:汇总计算(求平均值avg,求和sum,最大值max,最小值min,统计count)
④查找转换组件(lookup)是常用的组件
作用:获取一个想关联的值,查找值,(可查找另一张表相同的值,返回指定的值)
点开查找组件会出现下面框框,这是找要关联的表(可比较)
⑤路由器转换组件(router)
作用:根据组条件将数据发送至多个转换。(可以分成多个表)
⑥存储过程转换(expression)
作用:调用数据库中的存储过程(需要先填用户,再调用)
⑦排序转换组件(Sorter)
作用:根据排序键对数据进行排序。
⑧等级转换组件(rank)
作用:将记录限制在顶部或底部范围。(就是截取的功能)
informatica 学习总结的更多相关文章
- informatica 学习日记整理
1. INFORMATICA CLIENT的使用 1.1 Repository Manager 的使用 1.1.1 创建Repository. 前提: a.在ODBC数据源管理器中新建一个数据源连接至 ...
- Informatica学习笔记
Informatica学习笔记1:UPDATE AS INSERT 问:要求实现每天抽取数据,而且是如果有改变才抽取更新,没有就不更新,因为源表中有最后修改时间的字段,我让它 和SESSION上次运行 ...
- Informatica学习:1、安装介质的获取与安装
本文目标: 为方便学习Informatica工具,在个人电脑上部署Informatica Powercenter. 所用系统:win7 64位. Informatica安装包括服务器端.客户端安装两个 ...
- Informatica学习:3、用户创建与权限管理
环境:win7 下安装Informatica 9.6.1 服务器端与客户端作为学习之用,Linux大同小异 一.用户创建(服务器端) 1.登陆admin console (1)打开Admin Cons ...
- Informatica学习:2、配置存储库服务和集成服务
继续上一篇的1.安装介质的获取与安装,本文介绍服务端的存储库服务和集成服务的配置. 安装好Informatica的客户端和服务端后,需要登陆Administration Console,配置存储库服务 ...
- informatica9 安装下载,安装教程 介质(文章和视频教程)(csdn讲师:Array)
Informatica学习: 参考文献:视频参考地址:http://edu.csdn.net/course/detail/5034,ETL之informatica9通关班(第二期) 1.安装介质的获 ...
- informatica powercenter学习笔记(三)
以前在做DBA时在DB里写过行转列,列转行的CODE.这两天做了一下测试用INFORMATICA来实现行列互换的功能. 列转行的SQL 实现 ENV: RMDB TABLE: SALES STOREN ...
- informatica powercenter学习笔记(一)
本文转摘:http://blog.itpub.net/22377317/viewspace-677137/ 1 informatica powercenter的下载: 方法一:去年我是在ORACLE ...
- informatica powercenter学习笔记(LookUp 使用)
LOOKUP TRANSFORMATION的使用点评: LOOKUP基本用法不熟的话请参考下附属信息. 用法感受: 1 LOOKUP的作用跟我们以前在EXCEL的函数功能类似,就是隔表取值.优点就是用 ...
随机推荐
- Linux命令不熟悉(记录)
1.回到上一次操作的目录 cd - 2.rz打开上传文件 rz 3.下载某个文件 wget httpdownload 4.根据名字查找文件 find / -name mysql 5.通配符删除 rm ...
- C#之out修饰符、ref修饰符、params修饰符的简单介绍
一.out修饰符 1.调用一个带有输出参数的方法也需要使用out 修饰符,但是作为输出变量传递的本地变量在将他们作为输出变量传递前不需要赋值(因为调用后会改变或丢失),编译器允 许 ...
- (转)导出EXCEL时科学计数法问题
//1) 文本:vnd.ms-excel.numberformat:@ //2) 日期:vnd.ms-excel.numberformat:yyyy/mm/dd //3) 数字:vnd.ms-e ...
- angular2/angular4 如何通过$http的post方法请求下载二进制的Excel文件
时间有限,废话就不多说了,直接上干货! 下面给大家介绍一下我遇到的一个坑,如果你也遇到了,那恭喜你,你一定能找到答案:angular2/angular4 如何通过$http的post方法请求下载二进制 ...
- implements ApplicationContextAware 获取spring 容器
1.新建 ApplicationContextUtil 类 ,通过实现 ApplicationContextAware 的 setApplicationContext 方法,得到context上下文: ...
- EntityFramework Core迁移时出现数据库已存在对象问题解决方案
前言 刚开始接触EF Core时本着探索的精神去搞,搞着搞着发现出问题了,后来就一直没解决,觉得很是不爽,借着周末好好看看这块内容. EntityFramework Core迁移出现对象在数据库中已存 ...
- phpcmsV9手机站内容页有时内容不显示
phpcmsV9手机站内容页有时内容不显示,修改的办法是: 在文件phpcms\modules\wap\index.php 中 屏蔽第119行,即如下内容 //$content = $contentp ...
- 原生javascript 制作canvas 验证码
<canvas id="></canvas> <a href="#" id="changeImg">看不清,换一张 ...
- spring注解一次 清除多个缓存
@Caching(evict = { @CacheEvict(value="cacheName",key="#info.id+'_baojia'",before ...
- Tomcat中部署web应用 ---- Dubbo服务消费者Web应用war包的部署
样例视频:http://www.roncoo.com/course/view/f614343765bc4aac8597c6d8b38f06fd IP: 192.168.2.61 部署容器:apache ...