Pentaho BIServer Community Edtion 6.1 集成了 Kettle 组件,可以运行Kettle 程序脚本.但由于Kettle没有直接发布到 BIServer-ce 服务的程序,所以,在本地(Windows环境)通过图形化界面开发完成的ETL 脚本 (.ktr & .kjb) ,需要上传到BIServer-ce 管理的资源库,才能被BIServer-ce 运行和调度. 重点:Kettle 资源库 与 BIServer-ce 资源库 建立一致的目录管理ETL脚本文件.…
介绍 Pentaho Data Integration (PDI) is an extract, transform, and load (ETL) solution that uses an innovative metadata-driven approach. Pentaho Data Integration (PDI) 是一个革新的,使用元数据驱动方法来输出,转换与读取数据的解决方案. 参考资料 官方主页:http://www.pentaho.com 帮助手册:https://help.…
Pentaho Data Integration (Kettle) 使用此工具 按 索引  做 插入更新操作时,也可能报 索引重复 的错误, 解决方法:  匹配的索引字段可能有null值,会导致此错误,加入 is not null 过滤掉 索引字段为空的数据,插入/更新 即可.…
环境 MacOS Mojave (10.14.1) Pentaho Data Integration 8.2 Java 8 现象 从官方下载下来最新的安装包,解压之后,双击Data Integration,报安全问题,询问是否打开,同意并输入自己的开机密码. 然后,等了几秒之后,发现没有任何反应,再次双击Data Integration,依然没有任何相应. 解决办法 从Terminal启动 从terminal进入到解压之后的目录data-integration中,找到脚本spoon.sh,然后执…
上一篇:Pentaho Data Integration笔记 (一):安装 介绍 Spoon Intoduction site: http://wiki.pentaho.com/display/EAI/.01+Introduction+to+Spoon Spoon 是一个图形化用户界面,用户可以通过Spoon来设计transformations(数据转换文件)和jobs(数据转换任务),transformation与jobs可以在Pan和Kitchen这两个Kettle开发的工具执行并得出结果.…
作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 欢迎转载 最近把之前写的Hadoop MapReduce程序又总结了下,发现很多逻辑基本都是大致相同的,于是想到能不能利用ETL工具来进行配置相关逻辑来实现MapReduce代码自动生成并执行,这样可以简化现有以及之后的一部分工作.于是选取了上手容易并对Hadoop支持的比较成熟的Pentaho Kettle来测试,把一些配置过程和遇到的坑记录下来. Kettle可以在官网下载到,但是官网会让你注册才能下载而…
要做数据分析,领导让研究一下kettle. 先占个坑. 这里有个3.0的文档: http://wenku.baidu.com/link?url=hvw_cOBIXLXSGvftkGhXQic3CLC75-0IILGrtB-AyuxIgaDarhmZjfBLhMRcn9gIUEQPJ1OtxTT9joLgVXyFJxFougqR4ZnTQTCZ8vlIcMW 今天开始搞了一下,下载之后运行了一个sample. 下载安装很简单,到官网,直接download下了一个压缩吧, 解压之后就可以运行了.点s…
官方网站: http://wiki.pentaho.com/display/EAI/Kitchen+User+Documentation Kitchen Kitchen是一个可以执行Spoon编辑的Job的程序 使用Kitchen执行Job 官网主要介绍Linux平台下的命令,我主要介绍Windows平台下的命令 Options 选项 格式  /option:“value” Parameters 参数 格式 “-param:name=value” Repository 仓库 选择一个Reposi…
官网连接: http://wiki.pentaho.com/display/EAI/Pan+User+Documentation Pan Pan 是一个可以执行使用Spoon编辑的transformation的程序. 解压缩PDI Software.zip就得到了Pan.bat 命令行使用Pan执行Transformation 官网主要介绍Linux平台下的命令,我主要介绍Windows平台下的命令 Options 选项 格式  /option:“value” Parameters 参数 格式…
官网连接:http://wiki.pentaho.com/display/EAI/Call+DB+Procedure 描述 调用数据库存储过程步骤允许用户执行一个数据库存储过程,并且得到结果.存储过程或者方法只能通过他们的参数返回数据,并且输出参数必须定义在数据库存储过程Parameters中. F&Q 1. 设置完成DB Procedure Call之后,报错找不到相应的存储过程 在Proc-name中点击"Find it..."按钮之后,在Proc-name文本框当中的字符…