ETL工具kettle基本使用

云平台知识库 2024-11-09 05:24:01 原文

1.下载kettle：https://sourceforge.net/projects/pentaho/files/Data%20Integration/7.0/pdi-ce-7.0.0.0-25.zip/download

说明：kettle 是pentaho收购的一个etl工具,pentaho是一家BI解决方案的商业公司。

2.解压文件：pdi-ce-7.0.0.0-25.zip，执行：spoon.bat

3.在mysql中创建两个数据库：test1和test2，在test1中创建user1表，在test2中创建user2表用来测试

3.测试操作数据库test1中的user1表和数据库test2中的user2表

3.1 新建一个转换（transformation），点击DB连接，选择对应数据库类型，创建两个连接：l1,l2.

若测试连接出现错误：

错误连接数据库 [localhost_3306] : org.pentaho.di.core.exception.KettleDatabaseException:
Error occurred while trying to connect to the database

Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver

将mysql-connector-java-5.1.38-bin.jar拷贝至目录：pdi-ce-7.0.0.0-25\data-integration\lib下，重启程序，新建DB连接：

3.2 在【核心对象】下的【输入】中找到【表输入】，双击鼠标左键将【表输入】添加到“转换的图形视图”中，然后在【输出】找到【插入/更新】添加到“转换的图形视图”中，效果如下：

3.3 在视图中双击【表输入】，选择输入数据库和修改所需SQL查询语句：

3.4 双击【插入/更新】，选好要插入的数据库和表，再点击【获取字段】，【获取和更新字段】：

3.5 此时，可点击【运行】或F9，执行此转换，成功后的user2表如下图：

3.6 设置定时执行转换：新建一个job，将【START】和【转换】添加到视图中，设置关联转换文件和定时时间：

设置好后，点击【运行】，就会根据你设置的时间间隔来执行相应的“转化”了。

ETL工具kettle基本使用的更多相关文章

可用于Hadoop下的ETL工具——Kettle
看大家分享了好多hadoop相关的一些内容,我为大家介绍一款ETL工具——Kettle. Kettle是pentaho公司开源的一款ETL工具,跟hadoop一样,也是java实现,其目的就是做 ...
开源ETL工具kettle系列之常见问题
开源ETL工具kettle系列之常见问题摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 1. J ...
ETL工具--kettle篇（17.10.09更新）
ETL是EXTRACT(抽取).TRANSFORM(转换).LOAD(加载)的简称,实现数据从多个异构数据源加载到数据库或其他目标地址,是数据仓库建设和维护中的重要一环也是工作量较大的一块.当前知道的 ...
大数据之ETL工具Kettle的--1功能介绍
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行. 说白了就是,很有必要去理解一般ETL工具必备的特性和功能,这样才更好的掌握Kettle的使用. ...
ETL工具-KETTLE教程专栏1----术语和定义
1-资源库资源库是用来保存转换任务的,用户通过图形界面创建的的转换任务可以保存在资源库中. 资源库可以使多用户共享转换任务,转换任务在资源库中是以文件夹形式分组管理的,用户可以自定义文 ...
ETL工具Kettle使用以及与Java整合实现数据清洗
本文主要讲述kettle的使用和与Java整合,具体下载与安装请自行百度! kettle有两种脚本方式:转换和工作,工作中可以添加转换.以下以转换为例. 1.新建一个转换, 2.在工作中经常用到的是表 ...
八步学会数据迁移：ETL工具kettle使用方法
一.目的将不同服务器上的表合并到另外一个服务器上.例如:将服务器1上的表A和服务器2上的表B,合并到服务器3上的表C 要求:表A需要被裁剪(去掉不必要的字段).表B需要增加一些字段二.使用方法 ( ...
etl学习系列1——etl工具安装
ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可 ...
ETL利器Kettle
ETL利器Kettle实战应用解析系列一[Kettle使用介绍] 本系列文章主要索引如下: 一.ETL利器Kettle实战应用解析系列一[Kettle使用介绍] 二.ETL利器Kettle实战应用解析 ...

随机推荐

Djang下载虚拟环境设置
下载安装教程地址 https://docs.djangoproject.com/en/1.11/howto/windows/ 有一个步骤是创建虚拟环境创建环境 mkvirtualenv env1 ...
外网IP和内网IP的区别
这两天遇到一个bug,折腾的够呛,已经上线的项目,出现了个人登录不上的情况,瞬间整个人都不好了,首先找问题,在本地和测试服务器上都没问题,打包发布到正式环境就出现问题了,刚开始我看不了日志,日志要找别 ...
Java并发编程原理与实战三十三:同步容器与并发容器
1.什么叫容器? ----->数组,对象,集合等等都是容器. 2.什么叫同步容器? ----->Vector,ArrayList,HashMap等等. 3.在多线程环境下,为什么不 ...
Mycat从入门到放弃
https://blog.csdn.net/u013235478/article/details/53178657
用phpUnit入门TDD
用phpunit实战TDD系列从一个银行账户开始假设你已经安装了phpunit. 我们从一个简单的银行账户的例子开始了解TDD(Test-Driven-Development)的思想. 在工程目 ...
[SDOI2010]外星千足虫题解高斯消元+bitset简介
高斯消元 + bitset 简介: 高斯消元其实就是以加减消元为核心求唯一解.这道题还是比较裸的,可以快速判断出来.我们将每一只虫子看作一个未知数,这样根据它给出的 m 组方程我们可以高斯消元得出每一 ...
Go语言的接口interface、struct和组合、继承
Go语言的interface概念相对于C++中的基类,通过interface来实现多态功能. 在C++中,当需要实现多态功能时,步骤是首先定义一个基类,该基类使用虚函数或者纯虚函数抽象了所有子类会用到 ...
translate 与相对、绝对定位
垂直水平居中是日常前端开发当中一个常见的需求,在支持 CSS3 属性的现代浏览器当中,有一个利用 CSS3 属性的垂直水平居中方法: position absolute; :; :; :transla ...
SolrJ查询条件组合查询实现——（十六）
带查询条件的实现原理: 查询按钮被包在一个大表单,表单还有三个隐藏域,一个商品筛选,一个价格,一个排序,每次点击查询时候清空三个隐藏域,就带着一个大条件去查询;点击下面的筛选条件时,给隐藏域的筛选条 ...
==和equals区别
java中的数据类型,可分为两类: 1.基本数据类型,也称原始数据类型.byte,short,char,int,long,float,double,boolean 他们之间的比较,应用双等号( ...