电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

kettle培训手册

kettle培训手册_第1页
1/38
kettle培训手册_第2页
2/38
kettle培训手册_第3页
3/38
Kettle 简介: Kettle 是使用Jav a 语言开发的一个开源ETL 工具(Ex tract--Transform--Loading),完成数据的抽取、转换、加载工作。Kettle 的意思是“水壶”,把各种各样的数据倒进水壶中,经过转换、处理,以我们所需的格式输出对我们有价值的信息。 问题:为什么要用kettle? 需求:不同的数据库(同一种类型但实例不同的数据库,或者不同类型的数据库)之间、不同的数据存储形式(数据库、文本文件)之间需要协同工作,计算、处理、转换成我们需要的数据。 实际应用场景:对帐系统需要读取ATM 的交易流水文件到 Oracle 数据库中并进行统计。 不使用kettle 的情况:专门编写程序(Jav a 或 C)导入到数据库中,在 Oracle 中编写存储过程进行批量统计。 使用kettle 的情况:通过“文本文件输入”step,指定分隔符,即可完成导入,无需编写程序;使用kettle 中的各种对象可以完成统计功能,不需要编写存储过程。 两种情况对比: 情况一:需要编写专门的导入程序,不具备通用性。存储过程在不同类型的数据库中语法不同,也不具备通用性。但不需要掌握 kettle。 情况二:不需要编写专门的导入程序,不同的文件格式只需要修改“文本文件输入”step 中的对应参数即可。不需要针对不同的数据库编写不同版本的存储过程,只需要使用标准 SQL就可以具备通用性。需要掌握 kettle。 好处:跨数据库、跨平台,减少我们的工作量。 Kettle 中有两种类型的对象,分别对应两种类型的文件。一种是Transformation(以后简称Trans),即转换;一种是Job,即工作。Trans 完成具体的任务,Job 用于控制转换之间的执行顺序。 第一部分:与数据库打交道 1 创建数据库连接 <1>新建一个Transformation,在“DB 连接”下创建一个“数据库连接”,如下图所示: <2>如果创建kettle 不支持的数据库的连接,ConnectionTy pe 选择Generic database。 2 共享连接可以在不同的Transformation 中共享,可以减少数据库配置工作。 右键单击需要共享的连接,选择“Share”选项,如下图所示: 3 用变量保存参数,在不同的环境下切换时会省心省力。 设置环境变量(编辑-->设置环境变量,Ctrl+Alt+J),如下图所示: 在需要使用变量的地方通过${ 变量名} 读取,参考“创建数据库连接”。 4 从数据库中读取数据。(加工数据需要先读取数据) <1>不带参数读取数据。 表输入(table Inpu t) ,获取SQL查询语句,针对数据表的各种Actions 。...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

kettle培训手册

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部