kettle中文文档之output

资源描述

《kettle中文文档之output》由会员分享，可在线阅读，更多相关《kettle中文文档之output（4页珍藏版）》请在金锄头文库上搜索。

1、Kettle之output中文文档说明：使用kettle 3.0.0版本。Cube输出：说明：输出串行化数据，将数据存储于二进制数据形式，当向后分析文本内容，它将比平面文件更有优势。个人认为：kettle开始支持文本搜索，尤其是对文本文件的搜索，这是对文本搜索的基础支持。但是还是提供的功能比较简单，目前的功能只是提供串行化的文本存储。文本文件输出：将抽取到的数据输出到平面文件。以下是文本文件输出的设定界面，大部分选项相信大家都应用过了，我所说明的就是“文件名中包含日期/时间”选项，可以区分不同时间抽取的数据，以便以后区分存档。“封闭符”是将数据字段用指定的字符封闭起来，XML输出：将数据输出到

2、XML文件中。参数设定：l “文件”选项卡：“文件名称”指定文件路径和名称，“扩展”指定为XML，“在文件名中包含步骤号码？”是否插入当前步骤号；l “内容”选项卡：确定XML文件的格式和编码形式，“已压缩”确定当前输出文件是否生成压缩包。“正在编码”选择编码格式，一般选择UTF-8格式，“父XML元素”指定XML根tag，“记录XML元素”指定行记录的tag，“分割各一个记录”将抽取的数据分割存储到不同且连续编号的文件中，目的是使得文件大小合适，在读取文件时占去空间较小。l “字段”选项卡：点取“获取字段”将上一个步骤输出的字段元数据获得。更新：根据关键字段将数据更新到目标表，选择数据库连接和选择表及Commit Size等的操作不必多讲，“用来查询值的关键字”列表就是将上一个步骤流入的数据和目标表中的字段比较，我们可以选择比较的字段和比较的条件，以达到比较增量更新的目的，其实就是实现了一个程序级的look up的功能。个人观点：本功能和插入/更新有相仿的地方，只是插入/更新的部分功能，不执行插入操作，所以插入/更新就不介绍了。删除：将上一步骤的抽取的数据与目标表的数据进行比较，将目标表的数据与上一步骤抽取的数据相同的数据删除。未完待续。欢迎大家修改

展开阅读全文