商务智能考点汇总精编版

上传人:ahu****ng1 文档编号:141730218 上传时间:2020-08-11 格式:PPTX 页数:73 大小:2.30MB
返回 下载 相关 举报
商务智能考点汇总精编版_第1页
第1页 / 共73页
商务智能考点汇总精编版_第2页
第2页 / 共73页
商务智能考点汇总精编版_第3页
第3页 / 共73页
商务智能考点汇总精编版_第4页
第4页 / 共73页
商务智能考点汇总精编版_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《商务智能考点汇总精编版》由会员分享,可在线阅读,更多相关《商务智能考点汇总精编版(73页珍藏版)》请在金锄头文库上搜索。

1、考,考填空选择,教学纲要,商务智能概述(三个技术填空选择) 在线分析处理OLAP技术(1) 数据挖掘技术和方法* 数据挖掘过程 数据仓库(大题考的多,6选1实验指导书有18分) 商务智能应用*,知识,知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。 事实性知识和经验知识(考什么是隐性和显性知识)。 洞察力(insight),IBM商务智能定义 知识就是力量。BI 系统收集您客户的相关信息并加以分析,以帮助您确定商机和创建可以满足客户需求的战略。数据仓库、数据挖掘和决策支持中的先进技术创建大量的 BI 工具。,微软商务智能定义 Watch this interactive vide

2、o and learn how Microsoft business intelligence solutions can help your IT, Finance, Operations and Sales departments access the right information, faster:,SAP商务智能定义 SAP BusinessObjects BI 解决方案提供全面的商务智能功能,用户可根据可靠的数据和分析,作出有效而明智的决策。 借助这些强大的解决方案,企业中的所有用户均可访问、分析和共享组织中的各种信息,并可以设置信息格式及在信息中进行导航。,7,事务型处理数据和

3、分析型处理数据的区别3-4条一条2分,8,数据仓库(Data Warehouse)定义,数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为上层应用提供统一 用户接口,完成数据查询和分析。支持整个企业范围的主要业务来建立的,主要特点是,包含大量面向整个企业的综合信息及导出信息。 数据仓库是作为DSS服务基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需要的信息。 数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。 以1992年W H Inmon出版Building the Data Warehouse为标志,数据仓库发展速度

4、很快。 W H Inmon被誉为数据仓库之父。 W H Inmon对数据仓库所下的定义:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。,9,面向主题(特点、什么意思),数据仓库中的数据是按照各种主题来组织的。主题在数据仓库中的物理实现是一系列的相关表,这不同于面向应用环境。如保险公司按照应用组织可能是汽车保险、生命保险、伤亡保险,而数据仓库是按照客户、政策、保险金和索赔来组织数据。 面向主题的数据组织方式可在较高层次上对分析对象的数据给出完整、一致的描述,能完整、统一的刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系,从而适应企业各个部门的业务活动

5、特点和企业数据的动态特征,从根本上实现数据与应用的分离。,10,1集成性,数据仓库中的数据是从原有分散的源数据库中提取出来的,其每一个主题所对应的源数据在原有的数据库中有许多冗余和不一致,且与不同的应用逻辑相关。为了创建一个有效的主题域,必须将这些来自不同数据源的数据集成起来,使之遵循统一的编码规则。,11,2稳定性,数据仓库内的数据有很长的时间跨度,通常是5-10年。 数据仓库中的数据反映的是一段时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于撰写快照进行统计、综合和重组的导出数据。主要供企业高层决策分析之用,所涉及的数据操作主要是查询,一般情况下并不进行修改操作. 数据仓库中的

6、数据是不可实时更新的,仅当超过规定的存储期限,才将其从数据仓库中删除,提取新的数据经集成后输入数据仓库。,12,3时变性,时变性:许多商业分析要求对发展趋势做出预测,对发展趋势的分析需要访问历史数据。因此数据仓库必须不断捕捉OLTP数据库中变化的数据,生成数据库的快照,经集成后增加到数据仓库中去;另外数据仓库还需要随时间的变化删去过期的、对分析没有帮助的数据,并且还需要按规定的时间段增加综合数据。,13,4支持管理决策,数据仓库支持OLAP(联机分析处理)、数据挖掘和决策分析。OLAP从数据仓库中的综合数据出发,提供面向分析的多维模型,并使用多维分析的方法从多个角度、多个层次对多维数据进行分析

7、,使决策者能够以更加自然的方式来分析数据。数据挖掘则以数据仓库和多维数据库中的数据为基础,发现数据中的潜在模式和进行预测。因此,数据仓库的功能是支持管理层进行科学决策,而不是事务处理。,14,数据仓库系统的结构(四步曲 画图),15,元数据,数据仓库的所有数据都要通过元数据来管理和控制。元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。 源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web页、哪个外部系统抽取而来。源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。,16,元数据(2),元数据:

8、是用来描述数据的数据。它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述(输入、计算和输出)。元数据可用文件存在元数据库中。元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。 要有效的管理数据仓库,必须设计一个描述能力强、内容完善的元数据。,17,数据仓库的数据模型最后大题要有模型(重点前两个模型),18,概念模型,由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。概念模型简化了这个过程并且允许用户与开发者和其他用户建立联系: 确定系统边界:决策类型、需要的信息、原始信息 确定主题域及其内容:主题域的公共

9、键码、联系、属性组 确定维度:如时间维、销售位置维、产品维、组别维等 确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信息,19,实例,例试画出销售分析的概念模型。 解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实: (1)维度:包括日期维、销售地点维、销售产品维、年龄组别维、性别维等。 (2)类别:确定各维的详细类别,如:日期维包括年(10)、季度(40)、月(120)等类别,括号中的数字分别指出各类别的数量;销售地点维包括国家(15)、区域(45)、城市(280)、区(880)、商店(2000)等类别,括号中的数字同样分别指出各类别的数量;类似地,可以确定

10、销售产品、年龄组别维、性别维等的详细类别。 (3)度量和事实:确定用于进行分析的数值化信息,包括预测销售量、实际销售量和预测偏差等。,20,销售分析的概念模型,信息包: 销售分析 维度,类别,21,概念模型图实例 组合ID 写清楚,22,逻辑模型,星型图:数据仓库的数据模型的第二层是向最终的数据结构添加某些细节的星型图模型。与传统的关系模型相比,星型图模型简化了用户分析所需的关系,从支持决策的角度去定义数据实体,更适合大量复杂查询。 星形图包括了三种逻辑实体:指标、维度和详细类别 维表的本质是多维分析空间在某个角度上的投影,多个维表共同建立一个多维分析空间。,23,sales数据仓库的雪花模式

11、,24,Information Modelling of Sales Information Demand,Unique Identifier,Attribute,Strong Entity Type,1-n Relationship,0-n Relationship,Derived Attribute,Weak Entity Type,25,DW Layer and the Mapping to Information Model,Data Warehouse Layer (logical layer),Information Model (conceptual layer),Map Inf

12、ormation Objects To Database fields,- Rename Objects to User friendly names - Calculate fields - Define object display attributes - Convert currencies etc.,26,星型模型例子,27,粒度(选择填空),粒度:对数据仓库中的数据综合程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问的种类。 粒度越小,综合程度越低,回答查询的种类越多; 粒度越高,综合程度越高,查询的效率也越高。 在数据仓库中可将小粒度的数据存储在低

13、速存储器上;大粒度的数据存储在高速存储器上。,2.1 数据仓库的开发模型 填空题,张三,客户,客户与产品,特性,个体,整体,整体间联系,属性,实体,同质实体,异质实体,列(字段、数据项),记录,表文件,数据库,信用,现实世界是存在于现实之中的各种客观事物。 概念世界是现实情况在人们头脑中的反应。 逻辑世界是人们为为将存在于自己头脑中的概念模型转换到计算机中的实际的物理存储过程中的一个计算机逻辑表示模式。 计算机世界则是指现实世界中的事物在计算机系统中的实际存储模式。,图2.1 现实与不同模型的变化联系,元数据模型,数据粒度模型和聚集模型,图2.2 数据模型关系图,数据仓库的设计是在概念模型、逻

14、辑模型和物理模型的依次转换过程中实现的。 元数据模型作为数据仓库的灵魂自始自终伴随着数据仓库的开发、实施与使用。 数据粒度模型和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。,大 题 可 用,由于传统的实体关系图无法表述数据仓库中所需要的用户所感兴趣的分析数据、描述数据和细节数据的关系,因此将ERD中的实体分成指标实体(事实实体)、维实体和详细类别实体(引用实体)。,指标实体处于概念模型的中心,是数据仓库活动的中心。往往最后形成数据仓库中的实体-事实表。在现实世界中则是业务处理或者某一事件(例如,销售、服务等)。,指标实体,维度表,维实体在数据仓库中主要用于对实体指标

15、的过滤和重新组织提供指导。,详细类别表,详细类别实体在数据仓库中也用物理数据库表示,通常与现实世界中的某一个实体相对应。,实例:P95、P96,2.2.2 规范的数据模型,表2-1 数据仓库的数据与普通的数据库系统的数据之间的对比写三点与前面一样任选,2.2.4 雪花模型,维度表,维度表,维度表,维度表,维度表,事实表,详细类别表,详细类别表,图2.7 雪花模型的结构示意图,1. 单元测试,当数据仓库的每个单独组件完成后,就需要对它们进行单元测试,单元测试的目的是寻找存于单个程序、存储过程和其他位于一些独立环境中的模块的错误。在测试过程中不仅要求单元能对各种正常情况进行正确处理,也要求对各种错

16、误情况具有防御能力,不至由于某个用户的误操作导致系统的崩溃。,3.6.4 数据仓库的测试,2. 系统集成测试,在完成数据仓库单元测试以后,还需要进行数据仓库的集成测试,测试是验证每个单元与数据仓库系统和子系统之间的接口完好,能够正常传递数据,执行系统的整体功能。 在测试之前必须依据数据仓库的所有组件功能、数据仓库应用方法和数据仓库开发计划,制定详细的测试计划。 在完成数据仓库的系统集成测试以后,就可以进行数据仓库数据的首次加载。 在数据仓库交付用户使用之前,需要对数据仓库进行交付测试。,什么是OLAP?,定义1 :OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。 定义2 :OLAP(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OLAP委员会的定义) OL

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号