kettle8
1转换-转换组件介绍1
值映射组件(ValueMapper)流中某个字段的值根据映射关系映射成新的字段值或替换原有字段的值
表1值映射组件属性说明2
列拆分为多行组件(SplitFieldToRows)从流中一条记录中选择某个字段,根据指定标识符将一个字段的值拆分为多个值,并将每个被拆分的值作为一个新的字段与原记录合并产生多条新的记录
进行拆分的源字段必须是字符串字段
属性项属性说明使用的字段名流中的字段,作为源字段目标字段名若不添加字段名则在原有字段上修改,若添加字段名则将映射的值添加到新字段名中,保留原有字段
空表示为重写
不匹配时的默认值根据映射关系若没有匹配上则赋默认值
字段值映射设置源字段与目标字段之间的映射关系设置列表
源值源字段值
目标值对应源字段值,要映射成的目标值
表2列拆分为多行组件属性说明3
列转行(DeNormaliser)此组件可以完成合并记录的功能,把多条记录合并成一条记录,改变数据表的结构,将某些在源表中不同记录的同一个字段的值(这些值不相同),将它们变成目的表中不同的字段
【注释】:列转行组件中,记录要首先用指定关键字排序
表3列转行组件属性说明属性项属性说明要拆分的字段流中的某个字段
分隔符默认值“;”
分隔符是一个正则表达正则表达式作为分隔符
新字段名拆分后的字段名称
附加字段在新生成的记录中加入行号字段信息
输出中包括行号设置输出流中输出的记录行号,同时需要设置新行号字段名称,用来记录行号
对接收到的每一行重置行号将组件接收到的每一行都重置行号,值赋给新行号字段名称
属性项属性说明关键字段根据此字段不同的值,设置输出流的新字段,输出流的各个新字段通过目标字段列表来设置
分组字段设置用于合并成一条记录的分组字段
分组字段通常用输入流中已经过排序的主键作为分组字段
【获取字段】点击【获取字段】按钮,可以获取输入流中的全部字段