文本文件输入(text input):读取大量不同的文本文件
大多是通过工具生成的CSV 文件
表输入(table Input):常用来利用连接和SQL,从数据中读取信息,自动生成基本的SQL 语句
获取系统信息(get system info):这个步骤从 Kettle 环境中获取信息
生成行(Generate Rows ):这个步骤输出一定数量的行,缺省为空
可选包括一定数量的静态字段
Cube 输入(文件反序列化)(De-serialize from file):从二进制 Kettle Cube 文件中读取数据行
备注:这个步骤仅仅用来存储短期数据
不同版本之间不保证文件的格式一样
XBase 输入: 使用这一步可以读取大多数被称为 XBase family 派生的 DBF 文件
Excel 输入:利用这个步骤可以从 Kettle 支持的系统的 Excel 文件里面读取数据
XML 输入:这个步骤允许你读取存储在 XML 文件中的数据
它也提供一个接口,你可以定义你想读取的文件名、XML 文件的数据重复部分、获取的字段等
你可以指定元素或属性字段
获取文件名(Get File Names):这个步骤可以获取系统的文件名信息
文本文件输出(Text File Output): 表输出(Table output):这个步骤可以存储信息到数据库表中
插入/更新(Insert/Update):这个步骤利用查询关键字在表中搜索行
如果行没有找到,就插入行
如果能被找 到,并且要被更新的字段没有任何改变,就什么也不做
如果有不同,行就会被更新
更新(Update ):这个步骤类似于插入/更新步骤,除了对数据表不作插入操作之外
它仅仅执行更新操作
删除(Delete):这个步骤类似于上一步,除了不更新操作
所有的行均被删除
Cube output(序列化