Kettle学习报告 下载本文

内容发布更新时间 : 2024/5/20 4:25:22星期一 下面是文章的全部内容请认真阅读。

1简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。

Kettle是”Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取、转换、装入和加载数据,中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

特 点 绿色无需安装。

Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。 SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。

PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。

CHEF 允许你创建任务(Job)。任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。

KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

2转换的创建和使用

2.1创建一个新的转换

点击左上角的“+”,选择:转换,新增一个转换;

2.2新增DB连接

可以先添加目标数据库和源数据库信息;

转换界面,点击DB,弹出数据库连接窗口,选择数据库类型,输入数据库信息,点击测试,显示正确连接后,点击确认;

DB数据库下,显示已经连接好的数据库信息;

2.3新建表输入

点击进入核心对象界面,点开输入菜单,找到“表输入”拖曳到右边界面;