《owercenter培训教材》由会员分享,可在线阅读,更多相关《owercenter培训教材(87页珍藏版)》请在金锄头文库上搜索。
1、Informatica PowerCenter 培训,夏 凯 2009-01,电话:13439473732 MSN:,第一天,产品体系介绍 产品安装配置 系统管理介绍 开发六大步骤 数据转换调试,INFA产品线,INFA支持情况,PowerCenter选件,丰富的ETL功能,Real-Time 实时功能 Partitioning 分区功能 High Availability 高可靠性功能 Pushdown 功能 Enterprise Grid网格功能 Team-based Development 团队开发功能 Metadata Exchange 元数据交换功能 Unstructured Dat
2、a 非结构化数据功能 Visio 模板Mapping生成器功能 Data Federation 数据联邦功能 Data Profiling 数据质量探查功能,异构数据源,异构目标 实现多种缓慢变化维 全局变量及参数,参数文件 局部变量,前后记录比较 条件汇总 异构数据源关联 行/列转换 静态、动态Lookup支持 ETL事务处理 自定义SQL Pre SQL和Post SQL 复用组件 复用Mapping 调用存储过程 调用外部用户自定义过程 可视化Debug 强大函数支持、丰富转换语言,数据源为文件列表 Session Recovery 基于多目标表约束装载 错误数量控制 FTP 源和FTP
3、目标 ETL任务分区 增量汇总 测试装载 Bulk Loading External Loader (Oracle、DB2.) 复用Workflow 功能丰富的Workflow控制 任务串行、并行控制 基于时间、事件和指示文件触发 任务 Workflow中调用OS外部命令 Workflow中调用Email 多ETL Server协同工作 ,Informatica PowerCenter应用架构,PowerCenter Server和数据移动,PowerCenter Server、资料库、源和目标之间的处理路径,PowerCenter产品组件,服务端组件 客户端组件,第一天,产品体系介绍 产品安
4、装配置 系统管理介绍 开发六大步骤 数据转换调试,产品安装与样例安装,产品安装 服务器安装 客户端安装 详见安装手册 样例安装 数据库准备 RDBU (资料库数据库) SDBU (样例源数据库) TDBU (样例目标数据库) BDBU (样例参考数据库) 样例数据准备 样例参考导入,第一天,产品体系介绍 产品安装配置 系统管理介绍 开发六大步骤 数据转换调试,系统管理,Informatica Server管理 http:/localhost:6001 Domain Manager Node Manager Repository Service Manager Integration Servi
5、ce Manager License Manager 资料库内容管理 Repository Manager Folder Manager Privilege Manager ,第一天,产品体系介绍 产品安装配置 系统管理介绍 开发六大步骤 数据转换调试,开发六大步骤示意图,定义源 定义目标 创建映射 定义任务 创建工作流 工作流调度监控,Designer: Workflow Manager: Workflow Monitor: ,第一步:定义源,引入源的类型 Relational database Flat file COBOL file XML object Application,源分析器
6、,Informatica Service,ODBC Mapped Drive NFS Mounting Local Directory,Save Meta Data of Sources: OPB_SRC OPB_SRC_ OPB_SRC_FLD OPB_SRC_FLD_ ,第二步:定义目标,引入目标的类型 Relational database Flat file COBOL file XML object Application,目标分析器,Save Meta Data of Targets: OPB_TARG OPB_TARG_ OPB_TARG_FLD OPB_TARG_FLD_ ,第
7、三步:创建映射,第四步:定义任务,第五步:定义工作流,第六步:工作流调度监控,第一天,产品体系介绍 产品安装配置 系统管理介绍 开发六大步骤 数据转换调试,数据转换调试,组件介绍 Expression组件 Filter与Router Joiner与Lookup Aggregator组件 Update Strategy组件,第二天,组件列表,Source Qualifier: 从数据源读取数据 Expression: 行级转换 Filter: 数据过滤 Sorter: 数据排序 Aggregator: 聚合 Joiner: 异构数据关接连接 Lookup: 查询连接 Update Strateg
8、y: 对目标编辑 insert, update, delete, reject Router: 条件分发 Sequence Generator: 序列号生成器,组件列表,Normalizer: 记录规范化 Rank: 对记录进行TOPx Union: 数据合并 Transaction Control: 对装载数据按条件进行事务控制 Stored Procedure: 存储过程组件 Custom: 用户自定义组件 HTTP: WWW组件 Java: Java自编程组件,其它应用组件,组件类型,Passive组件 流入流出组件的行数不发生变化 例如:Expression、Lookup、HTTP组件
9、 Active组件 流入流出组件的行数会发生变化 例如:Aggregator、Router、Filter组件,P,A,函数分类,聚合函数 字符串函数 转换函数 数据清洗函数 日期函数 编码函数 财务函数 数值函数 数学函数 特有函数 判断函数 用户自定义函数,函数列表,组件介绍 Expression组件 Source Qualifier、 Filter与Router Joiner与Lookup Aggregator组件 Update Strategy组件,第二天,Expression组件,组件功能 基于行级的数据项赋值、修改、计算 在同行记录中可新增、减少数据项 组件类型 Passive组件
10、应用范围 数据类型转换,例如Expression:to_date(Port1,yyyymmdd) 数据项计算,例如Expression:(Port1+Port2)/Port3 新增变量,例如Expression: i=i+1,Expression组件,练习一:Expression组件,描述 将原始客户信息记录转换成合格标准的数据导入到暂存区。 源表: customer_east.txt customer_west.txt customer_central.txt 目标: TDBU.STG_CUSTOMERS 要点 姓与名合并为姓名; 电话号码转换成易读格式的电话号码,如:(466)766-28
11、3; 性别转换,将F 转换成FEMALE、M 转换成MALE、其它转换成UNK; 年龄分段,20 岁以下、2029、3039、4049、5060、60 岁以上; 解决方案 详见m_LAB_01,组件介绍 Expression组件 Source Qualifier、Filter与Router Joiner与Lookup Aggregator组件 Update Strategy组件,第二天,Source Qualifier、Filter组件,组件功能 对流入组件中的记录数据进行过滤 类似于关系型数据库Where应用 与Source Qualifier的过滤功能区别在执行位置上 组件类型 Activ
12、e组件 应用范围 数据过滤,Source Qualifier、Filter组件,注意: 在Source Qualifier中的 User Defined Join、 Source Filter、 Number of Sorted Ports中定义了SQL条件,那么,在Sql Query中就不要在重写相关的SQL条件,否则,将不会生效。,Router组件,组件功能 对流入组件中的记录数据按照条件进行分发 类似于Java语言中的Switch语句 组件类型 Active组件 应用范围 数据分发,Router组件,练习二,描述 将暂存区的客户信息按照性别分别导入到男、女、性别不明三张表内。 源表: T
13、DBU.STG_CUSTOMERS 目标: TDBU.STG_CUSTOMERS_FEMALE TDBU.STG_CUSTOMERS_MALE TDBU.STG_CUSTOMERS_UNK 要点 偿试用Filter组件多种方法对目标进行装载 解决方案 详见m_LAB_02,练习三,描述 将暂存区的客户信息按照性别分别导入到男、女、性别不明三张表内。 源表: TDBU.STG_CUSTOMERS 目标: TDBU.STG_CUSTOMERS_FEMALE TDBU.STG_CUSTOMERS_MALE TDBU.STG_CUSTOMERS_UNK 要点 使用Router组件对数据进行分发 比较F
14、ilter与Router各种方法的应用特点、性能 解决方案 详见m_LAB_03,组件介绍 Expression组件 Source Qualifier、 Filter与Router Joiner与Lookup Aggregator组件 Update Strategy组件,第二天,Joiner组件,组件功能 对异构数据进行关联(同构关联用Source Qualify组件) 类似于SQL 中的Join语句 组件类型 Active组件 应用范围 2个异构数据类型的表关联,同构Joins与异构Joins,同构Joins,同种结构数据 Source Qualify组件 从源直接Joins n个源可用1个
15、SQ组件 在源中先定义连接关系,异构Joins,不同DB或Flat与Flat之间 Joiner组件 在PowerCenter中Joins n-1个Joiner组件 在Joiner中定义连接条件,Joiner组件,Join类型,练习四,描述 将员工信息与员工工资2个异构表关联后,将关联结果数据倒入到暂存区。 源表: Employees_layout结构 Employees_list.txt文件目录 Employees_east.txt Employees_west.txt Employees_central.txt Salary.txt 目标: TDBU.STG_EMPLOYEES 要点 用Jo
16、iner组件进行Mapping设计 注意Master与Detail的设置选择(关联时建议将数据量少的设置为Master.) 解决方案 详见m_LAB_04,练习五,描述 将员工信息与员工工资2个同构表关联后,将关联结果数据倒入到暂存区。 源表: SDBU.EMPLOYEES SDBU.SALARY 目标: TDBU.STG_ EMPLOYEES 要点 用Source Qualify组件进行Mapping设计 注意关联关系设置 建议 N个同构数据源只需用1个Source Qualifier组件关联,关联时建议将在Source设计区将需要关联的源表手工用连线关联起来,在Mapping设计区删除各个源所带的Source Qualifier组件,用一个新的Source Qualifier组件包含所有源的字段内容。 解决方案 详见m_LAB_05,Lookup组件,组件功能 对Flat File或数据库根据关联的条件进行查询 返回符合条件的值,否则为空