kettle的输入输出组件和脚本组件
一、 输入组件
1.1表输入
从指定的数据库中,通过sql语句来查询数据加载到内存。
允许简易转换:勾选后可以避免不必要的字段的数据类型转换,从而提高性能。
替换sql语句里的变量:勾选后可以通过${queryDate}来使用queryDate变量。
从步骤中插入数据:以上次的步骤中的数据作为数据的参数,使用?来获取上步骤的数据,查询多个列就多个?接受。
从步骤中插入数据的例子:
csv文件里面有一些id,我们需要读取这个id的值,然后去数据库里面找对应id的数据
我们从csv中读取数据,所以需要csv文件输入组件,并且需要从数据库中回去数据,所以需要表输入组件,最终会形成下面的转换图:
其中csv读取到的id内容是:
表输入的配置是:
最终表输入的输出是:
1.2一个组件有多个数据通道
一个组件往多个通道发送时:可以选择分发或者是复制。
分发的意思是分流,就是把输出分为多分发送到不同的目的地
复制的意思是每个目的地接收到的数据是一样的
这里举一个复制的例子,读取数据库中的数据复制多分到excel输出、json输出、表输出
表输出需要注意字段的映射关系:
这是转换图:
二、执行sql的组件
执行脚本是很常用的一个组件,主要用于将上一步骤的结果作为参数来执行sql语句。
执行每一行:是否要对偶上个步骤的N行的结果一行一行的执行此脚本。
execute as a statment:当做一条完整的语句执行
变量替换:选中后,就可以${date}方式使用变量
quote string:选中后会识别?来表示上步骤传来的数据。
测试程序:
我们读取csv文件,并把csv文件中的数据插入到mysql的表中
其中执行sql脚本的配置是:
三、公式
在原来字段的基础上,使用新的自定义公式产生新的字段。变量用{}括起来。
例子:
我们读取csv文件,将name字段变为大写
最终的公式的输出是:
四、记录集连接
根据两个输入的连接字段选择连接方式,注意一个问题:关联的数据源要事先排好序。
五、字段选择工具
在关联之后去掉一些不需要的字段,或者修改字段的控制
字段选择的转换图:
csv文件里面包括两列的数据,id和name,现在我们把id字段名改为了new_id,并且将name字段删除
字段选择后的结果:
六、合并记录
将跨数据源的数据合并在一起的操作,相当于在同一数据库中的union操作。
union有数据的相对比较的功能
匹配关键字:是两个数据源数据对比的依据
标志字段是要显示的两个数据源的对比结果:
new:原来数据源没有关键字匹配的值,新数据源有关键字匹配的值。
delete:原来数据源有关键字匹配的值,新数据源没有关键字匹配的值。
changed:原来数据源和新数据源有关键字匹配的值,但是其他项修改了。
identical:两条数据是一致的。
kettle的输入输出组件和脚本组件的更多相关文章
- SSIS 通过添加脚本组件 自定义转换数据
问题:从mysql导入到sql的汉字都是乱码或者干脆导入不成功,报”截断字符串“错误,错在mysql当时建立的都是使用的默认编码latin1;搞不明白,又不是瑞典人,你用这个干毛.导致现在遇到n多问题 ...
- 【Unity3D基础教程】给初学者看的Unity教程(二):所有脚本组件的基类 -- MonoBehaviour的前世今生
作者:王选易,出处:http://www.cnblogs.com/neverdie/ 欢迎转载,也请保留这段声明.如果你喜欢这篇文章,请点[推荐].谢谢! 引子 上一次我们讲了GameObject,C ...
- 如何在SSIS的脚本组件中访问变量
原文:如何在SSIS的脚本组件中访问变量 这是一个小问题,我们在SSIS的设计中很多地方都会用到变量,我习惯性地将"变量"和"表达式"称为SSIS的灵魂,虽然不 ...
- 王者荣耀是怎样炼成的(三)unity组件与脚本
转载请注明出处:http://www.cnblogs.com/yuxiuyan/p/7565345.html 上回书说到了unity的基本操作.这回我们来侃侃unity中的组件与脚本. 目录结构 一. ...
- VueJs(8)---组件(注册组件)
组件(注册组件) 一.介绍 组件系统是Vue.js其中一个重要的概念,它提供了一种抽象,让我们可以使用独立可复用的小组件来构建大型应用,任意类型的应用界面都可以抽象为一个组件树 那么什么是组件呢? 组 ...
- Sprite组件和Button组件的使用
一.Sprint组件的使用 1.游戏中显示一张图片,通常我们称之为"精灵" sprite 2.cocos creator如果需要显示一个图片,那么需要在节点上挂一个精灵组件,为这个 ...
- 关于Unity中UI中的Mask组件、Text组件和布局
一.Mask组件 遮罩,Rect Mask矩形Mask(Rect Mask2D组件),图片Mask(Mask组件)(图片Mask的透明度不为0的部分显示子图片,为0的部分不显示子图片) Rect Ma ...
- GUI的最终选择 Tkinter(三):Checkbutton组件和Radiobutton组件、LabelFrame组件
Checkbutton组件 Checkbutton组件就是常见的多选按钮,而Radiobutton则是单选按钮 from tkinter import * root = Tk() v = IntVar ...
- vue组件化初体验 全局组件和局部组件
vue组件化初体验 全局组件和局部组件 vue组件化 全局组件 局部组件 关于vue入门案例请参阅 https://www.cnblogs.com/singledogpro/p/11938222.h ...
随机推荐
- Confluence 6 为 Active Directory 配置一个 SSL 连接预要求
希望生成证书,你需要安装下面的组件在你希望连接的 Windows Domain Controller 上. Internet Information Services (IIS) 在你安装 Windo ...
- Anton and School - 2 CodeForces - 785D (组合计数,括号匹配)
大意: 给定括号字符串, 求多少个子序列是RSGS. RSGS定义如下: It is not empty (that is n ≠ 0). The length of the sequence is ...
- Linux 下载最新kubectl版本的命令:
ubuntu centos下通用 第一步.下载最新版本的命令: curl -LO https://storage.googleapis.com/kubernetes-release/release/$ ...
- h5 plus/h5+规范使用,模块索引,教你如何去看h5+的手册
最近看了下h5+规范的官网,开始觉得晦涩难懂,确实很乱,不过这也是基于我不理解的情况,终于艰难读完了,现在来分享下心得吧,基本看完文章,按我的方法,应该可以直接上手项目. 我准备的工具 hbuilde ...
- Java容器涉及的类(代码)
Customer: public class Customer implements Comparable{ private Integer customerId; private String cu ...
- IOS-底层数据结构
Objective-C底层数据结构 类的数据结构 Class(指针) typedef struct objc_class *Class; /* 这是由编译器为每个类产生的数据结构,这个结构定义了一 ...
- 快速切题 sgu123. The sum
123. The sum time limit per test: 0.25 sec. memory limit per test: 4096 KB The Fibonacci sequence of ...
- POJ 3685 Matrix 二分 函数单调性 难度:2
Memory Limit: 65536K Total Submissions: 4637 Accepted: 1180 Description Given a N × N matrix A, ...
- 51nod1693
题解: 首先将问题转化,可以发现操作改为两种 一种是s*=k,代价为k,一种是s--,代价为1 转化成图论,spfa跑最短路 然后更据一些证明,代价1的k<=13且为质数,并且不可能操作2连续5 ...
- Oracle 等待事件 db file sequential read
db file sequential read-数据文件顺序读取 等待事件: "db file sequential read" Reference Note (文档 ID 345 ...