KETTLE 使用自己总结的 Kettle 使用方法和成果说明简介Kettle 是一款国外开源的 ETL 工具,纯 java 编写,可以在Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定
Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出
Kettle 这个 ETL 工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做
Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制
Kettle 可以在 http://kettle
pentaho
org/网站下载到
注:ETL,是英文 Extract—Transform—Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程
ETL 一词较常用在数据仓库,但其对象并不限于数据仓库
下载和安装首先,需要下载开源免费的 pdi—ce 软件压缩包,当前最新版本为5
下载网址:http : //sourceforge
net/projects/pentaho/files/Data % 20Integration/ 然后,解压下载的软件压缩包:pdi—ce—5
zip,解压后会在当前目录下上传一个目录,名为 data—integration
由于 Kettle 是使用 Java 开发的,所以系统环境需要安装并且配置好 JDK
Kettle 可以在 http://kettle
pentaho
org/网站下载 下载 kettle 压缩包,因 kettle 为绿色软件,解压缩到任意本地路径即可