kettle中文文档之output

上传人:xiao****1972 文档编号:84978791 上传时间:2019-03-06 格式:DOC 页数:4 大小:189.50KB
返回 下载 相关 举报
kettle中文文档之output_第1页
第1页 / 共4页
kettle中文文档之output_第2页
第2页 / 共4页
kettle中文文档之output_第3页
第3页 / 共4页
kettle中文文档之output_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《kettle中文文档之output》由会员分享,可在线阅读,更多相关《kettle中文文档之output(4页珍藏版)》请在金锄头文库上搜索。

1、Kettle之output中文文档说明:使用kettle 3.0.0版本。Cube输出:说明:输出串行化数据,将数据存储于二进制数据形式,当向后分析文本内容,它将比平面文件更有优势。个人认为:kettle开始支持文本搜索,尤其是对文本文件的搜索,这是对文本搜索的基础支持。但是还是提供的功能比较简单,目前的功能只是提供串行化的文本存储。文本文件输出:将抽取到的数据输出到平面文件。以下是文本文件输出的设定界面,大部分选项相信大家都应用过了,我所说明的就是“文件名中包含日期/时间”选项,可以区分不同时间抽取的数据,以便以后区分存档。“封闭符”是将数据字段用指定的字符封闭起来,XML输出:将数据输出到

2、XML文件中。参数设定:l “文件”选项卡:“文件名称”指定文件路径和名称,“扩展”指定为XML,“在文件名中包含步骤号码?”是否插入当前步骤号;l “内容”选项卡:确定XML文件的格式和编码形式,“已压缩”确定当前输出文件是否生成压缩包。“正在编码”选择编码格式,一般选择UTF-8格式,“父XML元素”指定XML根tag,“记录XML元素”指定行记录的tag,“分割各一个记录”将抽取的数据分割存储到不同且连续编号的文件中,目的是使得文件大小合适,在读取文件时占去空间较小。l “字段”选项卡:点取“获取字段”将上一个步骤输出的字段元数据获得。更新:根据关键字段将数据更新到目标表,选择数据库连接和选择表及Commit Size等的操作不必多讲,“用来查询值的关键字”列表就是将上一个步骤流入的数据和目标表中的字段比较,我们可以选择比较的字段和比较的条件,以达到比较增量更新的目的,其实就是实现了一个程序级的look up的功能。个人观点:本功能和插入/更新有相仿的地方,只是插入/更新的部分功能,不执行插入操作,所以插入/更新就不介绍了。删除:将上一步骤的抽取的数据与目标表的数据进行比较,将目标表的数据与上一步骤抽取的数据相同的数据删除。未完待续。 欢迎大家修改

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号