Informatica 简单使用
1. Informatica简介
① Repository manager 主要用来维护资料库的目录,对象,建完对象可以创建demo的folder。
② Administration Console是完全基于web的,管理所有的节点,服务,在里面包括资料库的一些用户,权限等信息。
③ Designer主要用来设计mapping。Mapping是informatica的一个映射,也就是说是ETL的一个规范,包括对源,目标,过程的设计。
④ workflow主要用于将mapping实例化,也就是设计一个session,如果session很多的话需要将它们设计成一个串行或者并行的过程,它们组成的session就叫做workflow,即工作流。
⑤ workflow monitor用来监控、执行workflow。
⑥ 控件:Source Qualified Transformation:ETL经常会用到的组件,对数据源,包括文件,也包括数据表进行抽取。无论数据源是表还是平面文件源,都会用到该组件。
2. 新建带过滤条件的workflow
D:
① 选在source,import source ,odbc data source中选择oracle的odbc设置,如果没有,要在管理工具中自行设置,具体如图。
② 同理,在target中设置目标数据表的连接,然后设置mapping,设置成功之后,转入w中设置工作流,
W:
① 在edit task->mapping中,source和target分别要设置源和目标的连接驱动。
② 在edit task->properties->parameter filename里面写入参数所在文件夹的地址(该参数在服务器的目录下,是事先设定好的文件)。
③ 在左项目条件source 中,edit task->mapping->source filter里面写入过滤的参数条件。
④ 在左项目条件target中,edit task->mapping->pre SQL里面写入执行前的更新数据表语句。
注意事项:
目标表的的数据表如果带有系统目录前缀,在设置mapping的连接条件时将无法识别前缀,因此没有办法传输数据。
3. 在Designer中设置过滤参数问题
① 设置参数之后,参数的默认值是字符如图,M中运行结果错误,无法解析参数,数据没有被导入。
4. 往GP数据库中导入平面文件源。
① 要将所导入的文件放入服务器的目录下,先在informatica控制台设置目录。
② 设置workflow时,在source里设置如下目录,其中source filetype包含两种情况,Direct设置如下图
③ indirect方式是选择表名列表文件,按文件列表运行。
5. 设置同时将两个表导入一个数据表中的workflow
6. 两个并无关联的mapping一起运行
① 在target load plan里面设置mapping运行的先后顺序。
7. 带expression Transformation组件的workflow
① 导入源表
② 手工创建目标表,可以在target菜单中选择great创建,也可以复制目标库中类似的表进行修改。前提是目标库中存在这样的表。
③ 手工创建目标表,target菜单下,generate/execute SQL
④ Filtertransformation组件:过滤组件将传到目标表的数据进行筛选,过滤。过滤不能对原来的表字段进行修改。值改变传递值的行数。
⑤ Expression Transformation组件:不改变抽取数据的行数,是被动的函数组件。不能实现汇总级的函数的操作。执行的先后顺序,先执行input,后执行valuable,valuable相当于一个局部的变量,按照顺序执行,后执行output。
⑥ Reusable Transformation组件:
8. Workflow的调度方式
① 手工执行(现在都是在手工执行)
② Workflow scheduler(调度程序调度)
③ pmcmd startworkflow
④ command task
⑤ worklet
9. informatica语法规则
① 输入的字符用 单引号 扩起来,连接字符用 || ,基本跟oracle保持一致。
② DECODE(IN_GENDER, 'M', 'MALE', 'N', 'FEMALE', 'UNK')
DECODE(TRUE,
IN_AGE < 20, 'LESS THAN 20',
IN_AGE >= 20 AND IN_AGE <= 29, '20 TO 29',
IN_AGE >= 30 AND IN_AGE <= 39, '30 TO 39',
IN_AGE >= 40 AND IN_AGE <= 49, '40 TO 49',
IN_AGE >= 50 AND IN_AGE <= 60, '50 TO 60',
IN_AGE > 60, 'GREATER THAN 60'
)
DECODE(字段名, '条件1', '返回值1', '条件2', '返回值2', '缺省值')
Informatica 简单使用的更多相关文章
- informatica 学习日记整理
1. INFORMATICA CLIENT的使用 1.1 Repository Manager 的使用 1.1.1 创建Repository. 前提: a.在ODBC数据源管理器中新建一个数据源连接至 ...
- Informatica学习:1、安装介质的获取与安装
本文目标: 为方便学习Informatica工具,在个人电脑上部署Informatica Powercenter. 所用系统:win7 64位. Informatica安装包括服务器端.客户端安装两个 ...
- 数据仓库基础(十)Informatica 组件1
本文转载自:http://www.cnblogs.com/evencao/p/informatica.html Informatica主要的组件: Source Qualifier 从数据源读取数据 ...
- 数据仓库基础(八)Informatica 小例子
本文转载自:http://www.cnblogs.com/evencao/p/3147843.html 之前看了一段数据库的基础,感觉自己对数据库的基础挺薄弱的.以后再学习其他东西的时候也需要经常能学 ...
- Informatica增量抽取时间的设置
使用数据库或者系统变量的当前时间 Informatica中的$$SYSDATE是表示当前系统时间的系统变量. 通过这个变量,我们对每天抽取的数据可以使用以下表达式来实现增量抽取: 时间戳字段>= ...
- Informatica学习笔记
Informatica学习笔记1:UPDATE AS INSERT 问:要求实现每天抽取数据,而且是如果有改变才抽取更新,没有就不更新,因为源表中有最后修改时间的字段,我让它 和SESSION上次运行 ...
- Informatica PowerCenter使用介绍-转载
转载自:https://blog.csdn.net/wen_demon/article/details/44155639 1. INFORMATICA CLIENT的使用1.1 Repository ...
- Informatica旗下PowerCenter的元数据库解析
因客户需求,最近重拾Informatica下的PowerCenter产品,主要研究数据血缘关系.从PowerCenter本身来看,它是一个功能非常强大,速率非常高效的一款付费的ETL工具,可以满足各种 ...
- 【造轮子】打造一个简单的万能Excel读写工具
大家工作或者平时是不是经常遇到要读写一些简单格式的Excel? shit!~很蛋疼,因为之前吹牛,就搞了个这东西,还算是挺实用,和大家分享下. 厌烦了每次搞简单类型的Excel读写?不怕~来,喜欢流式 ...
随机推荐
- C# 进一取整
C#: // "/"号现在整形运算是取整,浮点运算时为除法运算 Console.WriteLine("(56/10):{0}", 56 / 10);//5 Co ...
- Spark Streaming简介
离线计算和实时计算对比 1)数据来源 离线:HDFS历史数据 数据量比较大 实时:消息队列(Kafka),实时新增/修改记录过来的某一笔数据 2)处理过程 离线:MapReduce: map+redu ...
- 用信鸽来解释 HTTPS
原文:http://blog.jobbole.com/113883/ ----------------------------------------------------------------- ...
- Ubuntu14.04-PXE搭建
什么是PXE? PXE(Pre-boot Execution Environment,预启动执行环境)是由Intel公司开发的最新技术,工作于Client/Server的网络模式,支持工作站通过网络从 ...
- 第三方缓存软件memcached和redis异同
memcached和redis相同点:都是以键值对的形式来存储数据,通俗讲就是一个大的hashtable缓存数据都是存在内容中 key-value 不同点:memcached:1.一个key所对应的值 ...
- java web api接口调用
Web Services 被W3C进行了标准化定义. Web Services 发布到网上,可以公布到某个全局注册表,自动提供服务URL,服务描述.接口调用要求.参数说明以及返回值说明.比如中国气象局 ...
- cf914D. Bash and a Tough Math Puzzle(线段树)
题意 题目链接 Sol 直接在线段树上二分 当左右儿子中的一个不是\(x\)的倍数就继续递归 由于最多递归到一个叶子节点,所以复杂度是对的 开始时在纠结如果一段区间全是\(x\)的两倍是不是需要特判, ...
- codevs 1213 解的个数
1213 解的个数 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 黄金 Gold 题目描述 Description 已知整数x,y满足如下面的条件: ax+by+c = ...
- hibernate 初印象
将要学习的内容: 1.HelloWorld a) xml b) annotation2.Hibernate 原理模拟 - 什么是 O/R Mapping 以及为什么要有 O/RMapping3.常见 ...
- isee图片专家批量处理图片大小教程
经常用手机.照相机外出拍照片,然后再弄到电脑上面很占硬盘空间了,isee图片专家是一款非常专业的批量压缩图片大小工具,方便储存,给电脑减压,具有一次自动处理N张图片:程序小巧,资源占用低,处理速度快等 ...