Kettle使用培训文档

上传人:ji****72 文档编号:56531953 上传时间:2018-10-13 格式:PPT 页数:17 大小:888KB
返回 下载 相关 举报
Kettle使用培训文档_第1页
第1页 / 共17页
Kettle使用培训文档_第2页
第2页 / 共17页
Kettle使用培训文档_第3页
第3页 / 共17页
Kettle使用培训文档_第4页
第4页 / 共17页
Kettle使用培训文档_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《Kettle使用培训文档》由会员分享,可在线阅读,更多相关《Kettle使用培训文档(17页珍藏版)》请在金锄头文库上搜索。

1、Kettle使用培训文档,shenxiangl,Kettle使用-ETL&Kettle,ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于金融IT来说,经常会遇到大数据量的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少。 Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。,Kettle使用-下载&部署,Kettle可以在http:/kettle.p

2、entaho.org/网站下载 下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可,Kettle使用-运行,进入到Kettle目录,如果Kettle部署在windows环境下,双击运行spoon.bat文件,出现如下界面,Kettle使用-运行,Kettle提供了资源库方式的方式来整合所有的工作,但是因为资源库移植不方便,所以选择没有资源库,Kettle使用-ktr&kjb,点击页面左上角的 创建一个新的transformation,点击 保存到本地路径,例如保存到D:/etltest下,保存文件名为EtltestTrans,kettle默认transformation

3、文件保存后后缀名为ktr 点击页面左上角的 创建一个新的job,点击 保存到本地路径,例如保存到D:/etltest下,保存文件名为EtltestJob,kettle默认job文件保存后后缀名为kjb,Kettle使用-transformation,菜单介绍,Main Tree菜单列出的是一个transformation中基本的属性,可以通过各个节点来查看。 DB连接:显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置。 Steps:一个transformation中应用到的环节列表 Hops:一个transformation中应用

4、到的节点连接列表,Kettle使用-transformation,菜单介绍,Core Objects菜单列出的是transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。 Input:输入环节 Output:输出环节 Lookup:查询环节 Transform:转化环节 Joins:连接环节 Scripting:脚本环节,Kettle使用-Transformation,每一个环节可以通过鼠标拖动来将环节添加到主窗口中。 并可通过shift+鼠标拖动,实现环节之间的连接。,Kettle使用-Transformation,常用环节介绍,Kettle使用-Job,菜单介

5、绍,Main Tree菜单列出的是一个Job中基本的属性,可以通过各个节点来查看。 DB连接:显示当前Job中的数据库连接,每一个Job的数据库连接都需要单独配置。 Job entries:一个Job中引用的环节列表,Kettle使用-Job,菜单介绍,Job entries菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。 每一个环节可以通过鼠标拖动来将环节添加到主窗口中。 并可通过shift+鼠标拖动,实现环节之间的连接。,Kettle使用-Job,常用环节介绍,Kettle使用-作业,作业: 根据客户,帐户,交易表中的数据,生成对应的数据文件,将数据文件可以导入到对应表中,并且可以用job来调用整个流程。 成果: 1,提交对应的Kettle文件 2,Kettle流程可以正确执行,不报错 3,对应的数据文件生成并格式无误,对应表中有数据并格式无误,Kettle使用-作业,说明: 数据库中存在四张表:,Kettle使用-作业,说明:,Kettle使用-作业,说明: CUST表存放客户信息,ACCOUNT表存放帐户信息,TRADE表存放交易信息 一个客户对应多个帐户,一个帐户对应多个交易 TRADE_ALL表存放结果数据,需要从相关的表中获取到字段中的信息,获取不到的信息可以通过相关处理或添加默认值的方式写入。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号