大家都知道,每个ETL工具都用不同的名字来区分不同的组成部分.kettle也不例外. 比如,在 Kettle的四大不同环境工具 本博客,是立足于kettle工具的设计模块的概念介绍. 1.转换 转换(transformation)是ETL解决方案中最主要的部分,它处理(抽取.转换.加载各阶段)各种对数据行的操作.转换包括一个或多个步骤(step),如读取文件.过滤输出行.数据清洗或将数据加载到数据库. 转换里的步骤通过跳(hop)来连接,跳定义了一个单向通道,允许数据从一个步骤向另一个步骤流动.…