第6章 数据库与数据仓库【稻谷书店)

上传人:枫** 文档编号:568012327 上传时间:2024-07-23 格式:PPT 页数:42 大小:426.50KB
返回 下载 相关 举报
第6章 数据库与数据仓库【稻谷书店)_第1页
第1页 / 共42页
第6章 数据库与数据仓库【稻谷书店)_第2页
第2页 / 共42页
第6章 数据库与数据仓库【稻谷书店)_第3页
第3页 / 共42页
第6章 数据库与数据仓库【稻谷书店)_第4页
第4页 / 共42页
第6章 数据库与数据仓库【稻谷书店)_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《第6章 数据库与数据仓库【稻谷书店)》由会员分享,可在线阅读,更多相关《第6章 数据库与数据仓库【稻谷书店)(42页珍藏版)》请在金锄头文库上搜索。

1、管管 理理 信信 息息 系系 统统(Management Information System) 同济大学同济大学 经济与管理学院经济与管理学院管理信息系统管理信息系统精品课程课程组精品课程课程组网站:网站:http:/http:/管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2 2 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2 2 页页第6章 数据库与数据仓库 管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3 3 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3 3 页页学习目的学习目的理解信息系统与

2、数据管理;理解信息系统与数据管理;掌握文件环境和数据库环境下的数据组织;掌握文件环境和数据库环境下的数据组织;掌握数据模型、关系模式规范化、数据视图概掌握数据模型、关系模式规范化、数据视图概 念念和数据库设计;和数据库设计;了解面向对象及其他高级数据库系统;了解面向对象及其他高级数据库系统;了解数据仓库与数据挖掘。了解数据仓库与数据挖掘。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 4 4 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 4 4 页页本讲内容本讲内容6.1 信息系统的数据管理信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环

3、境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 5 5 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 5 5 页页6.1 信息系统的数据管理信息系统的数据管理6.1.1 数据管理概念数据管理概念美国学者詹姆斯马丁提出数据环境的概念,认为只要企业的性质和目标不变,尽管企业的数据加工处理过程是多变,但数据是稳定的,企业任何业务活动都离不开对数据的存取。MIS是有目的地对企业生产经营活动产生的原始数据进行收集、组织、加工

4、处理,直至生成信息的系统。管理人员则利用信息控制企业各项经营活动并作出决策。组织数据的逻辑存储结构,将逻辑存储结构转换成计算机物理存储结构,以及根据需要准确、迅速地存取数据等,这些问题都是数据管理技术的主要研究内容。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 6 6 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 6 6 页页6.1 信息系统的数据管理信息系统的数据管理6.1.1 数据管理概念数据管理概念随着计算机技术的产生和发展,企业的数据管理技术经随着计算机技术的产生和发展,企业的数据管理技术经历了人工管理,文件管理技术和数据库管理技术三个阶历了

5、人工管理,文件管理技术和数据库管理技术三个阶段。段。目前数据库是企业信息系统组织、管理数据的最常用技目前数据库是企业信息系统组织、管理数据的最常用技术。术。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 7 7 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 7 7 页页6.1 信息系统的数据管理信息系统的数据管理6.1.2 MIS的数据管理要求的数据管理要求需要有效的数据库技术需要有效的数据库技术需要稳定的数据基础需要稳定的数据基础需要良好的数据环境需要良好的数据环境管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 8 8 页页20082

6、008年年6 6月月1 1日日3 3时时3737分分第第 8 8 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 9 9 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 9 9 页页6.2 文件环境下的数据组织文件环境下的数据组织6.2.1 文件的基本概念文件的基本概念数据项数据项q数据项是组成数据处理对象的

7、最小单位,如表中的订单代码、订单日期等记录记录q它是由一个或多个数据项所组成。记录是描述一个客观事物或对象的属性值的总和,也是计算机一次处理的数据逻辑单元。文件文件q具有相同性质的记录的集合称为文件。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1010 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1010 页页6.2 文件环境下的数据组织文件环境下的数据组织6.2.2 文件组织方式文件组织方式顺序组织顺序组织q顺序组织方式是指文件中的记录的物理顺序和逻辑顺序相一致的形式。索引文件索引文件q索引文件是按照记录关键字排序的文件。索引文件通常由两部分组

8、成:数据区和索引区。其数据区存放主文件的数据记录,索引区存放索引。(1)索引非顺序文件:数据文件中记录不按顺序存放,而索引是按顺序存放的。(2)索引顺序文件:数据区的记录按关键字值的大小排序,并带有索引的文件。直接存取组织直接存取组织q直接存取文件组织中的记录都是随机存放的,故又称随机文件。 倒排文件倒排文件 q如果按某非关键字项值的大小排列,并将该值对应的记录地址一并列入索引表中,这种表称为倒排表,这样组成的文件称为倒排文件。 管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1111 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1111 页页本讲内

9、容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1212 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1212 页页6.3 数据库环境下的数据组织数据库环境下的数据组织6.3.1数据库定义数据库定义数据库的定义数据库的定义q长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述

10、和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库的特点数据库的特点q数据结构化、数据共享性、数据独立性管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1313 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1313 页页6.3 数据库环境下的数据组织数据库环境下的数据组织6.3.2数据库管理系统数据库管理系统数据库管理系统数据库管理系统q数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。DBMS的分类的分类q按数据模型、按所支持的用户数、按允许数据库可以分布的站点数、按用途。数据库管理系统的组成数据库

11、管理系统的组成q数据定义语言及其翻译程序;数据操纵(或查询)语言及其编译(或解释)程序;数据库管理例行程序。 管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1414 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1414 页页6.3 数据库环境下的数据组织数据库环境下的数据组织6.3.3数据库系统结构数据库系统结构硬件硬件qCPU、内存、磁盘、磁带以及其它外部设备。软件软件q操作系统(OS)、数据库管理系统(DBMS)、应用于开发应用程序的具有数据库接口的高级语言及其编译系统、以DBMS为核心的应用开发工具、为某应用环境开发的数据库应用系统。人员人员

12、q数据库管理员(Data Base Administrator,DBA)、系统分析员和数据库设计人员、应用程序员和最终用户。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1515 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1515 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1616 页页20

13、082008年年6 6月月1 1日日3 3时时3737分分第第 1616 页页6.4 数据模型数据模型6.4.1信息描述信息描述管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1717 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1717 页页6.4 数据模型数据模型6.4.1 信息描述信息描述现实世界现实世界q是指存在于人们头脑之外的客观世界,事物及其相互间联系就处在这个世界之中。 信息世界信息世界q信息是现实世界中的客观事物在人们头脑中的反映。人的头脑对于这些事物经过认识、选择、描述之后进入信息世界。它包括:实体、属性、域、实体型、实体集、码、联

14、系等概念。数据世界数据世界q数据世界中研究的对象是数据,数据是对信息的符号化表示。 计算机世界计算机世界q数据世界中的数据经过编码、加工后就进入计算机世界。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1818 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1818 页页6.4 数据模型数据模型6.4.2实体实体-联系模型(联系模型(E-R)基本基本E-R图形图形qE-R模型有三个基本元素,即实体、实体之间的联系和属性,它们分别用矩形框、棱型框和椭园形框表示,并且将对应的名字填入框内以作标识,用无向边把实体与其属性连接起来,将参与联系的实体用线段连接

15、,并标上联系的数量,见图6.5所示的学生选修课程的E-R图。构造构造E-R模型模型q构造E-R模型实质上就是根据现实世界客观存在的“事物”及其关系所给出的语义要求,组合基本E-R图形为E-R模型。它包括如下步骤:标识实体集;标识联系集;标识属性值集;标识关键字。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 1919 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 1919 页页6.4 数据模型数据模型6.4.3 数据模型数据模型层次模型层次模型q用树结构表示实体之间联系的模型叫层次模型。树由节点和连线组成,节点代表实体型,连线表示两实体型间的一对多联系

16、,见图6.6(a)网状模型网状模型q网状模型是一个满足条件的有向图,条件是:可以有一个以上的节点无父节点;至少有一个节点有多于一个的父节点(排除树结构);节点代表实体型,有向边(从箭尾到箭头)表示两实体型间的一对多联系,见图6.6(b)层次模型关系模型关系模型q用二维表来表示实体,用外码表示实体间的联系。见表6.9、6.10、6.11面向对象面向对象q面向对象的数据模型中对象(Object)是现实世界中实体的模型化,与记录(元组)对应。每个对象有一个唯一的标识符,把属性和行为封装在一起。类(Class)是具有相同属性和行为的对象的集合。系统中所有类构成一个有向无环图。类之间有继承关系,见图6.

17、7管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2020 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2020 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2121 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2121 页页6.5关系模式规范化关系模式规范化6.

18、5.1 问题的提出问题的提出 一个企业销售记录的关系模式PEQ(订单代码、订购日期、客户、发货日期、产品、单价、数量、雇员),如表6.12所示。如果关系模式设计得不好会带来以下问题 :管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2222 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2222 页页6.5关系模式规范化关系模式规范化6.5.1 问题的提出问题的提出冗余度高冗余度高q如果“雇员”与客户的联系是固定的,而当该客户每购买一种产品时,“雇员”就重复存放一次。修改问题修改问题q如果在PEQ中,某客户的联系雇员变动时,就需要对所涉及的雇员进行修改

19、,这不仅增加了更新代价,而且有可能造成数据的不一致性。删除问题删除问题q如果某客户暂时不需要任何产品,则删除时就丢失了其所联系雇员的一些信息,而该雇员可能在以后可能再次用到。插入问题插入问题q在这个关系中,关键字由“订单代码、客户、产品”组成。如果新增一个客户的有关数据,而所购买产品未定,那么这个客户的数据无法插入,因为缺少关键字其他数据。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2323 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2323 页页6.5关系模式规范化关系模式规范化6.5.2 函数依赖函数依赖函数依赖的概念函数依赖的概念q定义:

20、设有关系模式R(A1,A2,Ak),X和Y都是A1,A2,Ak的子集,如果是R的任一具体关系(元组)。如果R的所有关系r都存在着:对于x的每一个具体值,都有Y的唯一的具体值与之对应,则称X函数地决定Y,或Y函数依赖于X。记为:XY函数依赖与属性关系函数依赖与属性关系q在前面所介绍的属性间三种联系中,并不是所有的联系都存在函数依赖。设有关系模式R,属性集为A,X和Y是A的子集,X和Y之间有如下情况: 如果X与Y之间是“l:l”的联系,则存在函数依赖:XY,YX这种依赖称为互为函数依赖。 如果X与Y之间是“N:1”的联系,则存在函数依赖:XY如果反过来就不一定存在函数依赖,因为同样的“工资”可以对

21、应多个职工。 如果X与Y之间是“M:N”的联系,那就不存在函数依赖关系。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2424 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2424 页页6.5.3 规范关系规范关系第一范式(第一范式(1NF)q定义:如果一个关系模式R的每个具体关系r的每个属性值都是不可分的最小数据单位,则称R为第一范式,简称1NF(First Normal Form),r为1NF关系。第二范式(第二范式(2NF)q定义:如果满足第一范式的关系模式R,它的所有属性都完全函数依赖于主关键字,则称R为第二范式,记为2NF。第三范式(第三

22、范式(3NF)q定义:如果关系模式R满足2NF,并且它的任何一个属性都不传递依赖于任一主关键字,则称R是第三范式,记为3NF。6.5关系模式规范化关系模式规范化管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2525 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2525 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程

23、(MISMIS)第第 2626 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2626 页页6.6数据视图概念数据视图概念6.4.3 数据模型数据模型用户看到的数据到计算机内的物理数据之间经过了两次转换。第一用户看到的数据到计算机内的物理数据之间经过了两次转换。第一次是系统为了实现数据共享、减少冗余,把所有用户视图的数据进次是系统为了实现数据共享、减少冗余,把所有用户视图的数据进行综合,抽象成一个统一视图行综合,抽象成一个统一视图全局数据。第二次是系统为了提全局数据。第二次是系统为了提高存取效率,把全局视图的数据按照物理组织的最优方式来存放。高存取效率,把全局视图的数

24、据按照物理组织的最优方式来存放。图图6.8给出了数据库的分层结构。一般来说,数据库系统的基本结构给出了数据库的分层结构。一般来说,数据库系统的基本结构大体上是一致的,可以用三级模式和两级映像来概括描述。大体上是一致的,可以用三级模式和两级映像来概括描述。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2727 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2727 页页6.6数据视图概念数据视图概念管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2828 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2828

25、页页6.6数据视图概念数据视图概念6.6.1 三级模式三级模式外模式(外模式(External Schema)q外模式对应于用户级数据库,又称子模式。它用子模式定义语言来定义,而且是用户与数据库的接口,因此,一个子模式中包含了相应用户的记录类型的描述以及与概念模式中相应记录的映像定义。这里,每个用户都必须使用一个子模式,但多个用户也可以使用同一个子模式。概念模式(概念模式(Conceptual Schema)q概念模式对应于概念级数据库,又称模式。它用模式定义语言定义。模式的主体是数据库的数据模型,它是所有用户视图数据库的一个最小并集。内模式(内模式(Internal Schema)q内模式对

26、应于物理级数据库,又称存储模式,用物理模式描述语言描述。物理级数据库包括数据库的全部存储数据,是用户操作的对象。从系统程序员的角度看,这些数据是按一定的文件方式组织起来的。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 2929 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 2929 页页6.6数据视图概念数据视图概念6.6.2 两级映象两级映象在每两级模式之间存在着从一种模式结构到另一种模式结构的映像,这种功能是由DBMS支持的。从外模式到概念模式的映像的作用在于:当整个系统要求改变模式时,只需改变映像关系而保持外模式不变。这种用户级数据独立于全局的

27、逻辑数据的特性称为逻辑数据独立性。从概念模式到内模式的映像作用在于:当物理数据库改变时,只需修改这种映像关系而保持概念模式和外模式不变。这种全局的逻辑数据独立于物理数据的特性叫物理数据独立性。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3030 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3030 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统

28、管理信息系统精品课程(精品课程(MISMIS)第第 3131 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3131 页页6.7数据库设计数据库设计6.7.1 数据库设计概述数据库设计概述数据库设计的含义数据库设计的含义q数据库设计在管理信息系统的开发中占有非常重要的位置,它涉及多学科的综合性技术。数据库设计的好坏将直接影响整个系统的效率。同时数据库设计者的知识和经验还是非常重要的。 q规范设计法中主要有新奥尔良(New Orleans)的四个阶段方法,它将数据库设计分为:需求分析(分析用户要求)、概念设计(信息分析和定义)、逻辑设计(设计实现)和物理设计(物理数据库

29、设计)。后来S.B.Yao等人又将数据库设计分为五个步骤,以及L.R.Palmer等人认为数据库设计应该为一步接一步的过程,并采用一些辅助手段实现每一过程。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3232 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3232 页页6.7数据库设计数据库设计6.7.2 数据库设计步骤数据库设计步骤数据库设计主要包括如下步骤:需求分析;概念结构设计;逻辑结构设计;物理结构设计。数据库实施阶段的设计步骤为:应用程序设计与调试;系统性能测试与试运行。数据库使用阶段的设计步骤包括:数据库系统运行;数据库系统维护;数据库

30、系统重构。本节主要讨论数据库设计阶段的四个步骤管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3333 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3333 页页6.7数据库设计数据库设计6.7.2 数据库设计步骤数据库设计步骤需求分析需求分析q需求分析的任务是详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,以确定新系统的功能。概念结构设计概念结构设计q概念结构设计的任务是对用户的需求进行综合、归纳和抽象,产生一个独立于DBMS的概念数据模型。逻辑结构设计逻辑结构设计q逻辑结构设计的任务是将概念模型(如E-R模型)转换为某个

31、DBMS支持的数据模型,然后再对转换后的模型进行定义描述,并对其进行优化,最终产生一个优化的数据库模式。物理结构设计物理结构设计q物理结构设计是为逻辑结构选取最适合应用环境的物理结构,包括存储结构和存取方法。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3434 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3434 页页6.7数据库设计数据库设计6.7.3应用实例应用实例管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3535 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3535 页页本讲内容本讲内容6.

32、1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统面向对象及其他高级数据库系统6.9数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3636 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3636 页页6.8 面向对象及其他高级数据库系统面向对象及其他高级数据库系统6.8.1 面向对象数据库系统(面向对象数据库系统(OODBS)OODBS的概念的概念q对象标识,面向对象的数据库基于面向对象的程序设计范例,

33、其每个实体被看作一个对象。q封装,涉及个对象的数据和代码封装在一个单元中。每一对象是其状态和行为的封装。数据库里除了存放数据还有行为。q类和类层次,共享公共特性集的对象可以归入一个对象类。我们从所有具有相同属性和方法的对象抽象出类。q继承,一个类可以继承类层次中其直接或间接祖先的所有属性和方法。OODBS的实现方式的实现方式q纯种OODBS技术、传统数据库的改进 。OODBS存在的问题存在的问题q标准化问题、数据库语言缺乏形式化基础管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3737 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3737 页页6.

34、8.2 其他一些高级数据库技术其他一些高级数据库技术对象对象-关系数据库关系数据库q是以对象-关系数据模型为基础,通过提供处理复杂对象的丰富数据类型和对象定位,扩充关系模型。空间数据库空间数据库q是涉及空间信息的数据库,它主要包括地理数据库、医疗和卫星图像数据库。时间数据库和时间序列数据库时间数据库和时间序列数据库q时间数据库和时间序列数据库都存放与时间有关的数据。时间数据库通常存放包含时间相关属性的数据。文本数据库和多媒体数据库文本数据库和多媒体数据库q文本数据库包含对象文字描述的数据库。6.8 面向对象及其他高级数据库系统面向对象及其他高级数据库系统管理信息系统管理信息系统精品课程(精品课

35、程(MISMIS)第第 3838 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3838 页页本讲内容本讲内容6.1 信息系统的数据管理6.2 文件环境下的数据组织6.3 数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘数据仓库与数据挖掘管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 3939 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 3939 页页6.9数据仓库与数据挖掘数据仓库与数据挖掘6.9.1 数据仓库数据仓库定义定

36、义q数据仓库是一个面向主题的、集成的、随时间变化的、相对稳定的数据集合,用于支持管理决策。体系结构体系结构q包含四个层次的体系结构:数据源、数据存储与管理、OLAP服务器、前端工具管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 4040 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 4040 页页6.9数据仓库与数据挖掘数据仓库与数据挖掘6.9.2 OLAP和数据挖掘和数据挖掘OLAP技术基本概念技术基本概念qCodd认为用户决策分析需要对关系数据库进行大量计算才能得到结果,而简单查询不能满足决策者需求。也就是说,传统的OLTP和SQL对大数据库的简单

37、查询不能满足用户分析的要求。因此提出多维数据库和多维分析概念,即OLAP。它有两个特点:一是在线性(On-Line),二是采用多维数据库进行多维分析(Multi-Analysis)。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 4141 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 4141 页页6.9数据仓库与数据挖掘数据仓库与数据挖掘6.9.2 OLAP和数据挖掘和数据挖掘数据挖掘概念数据挖掘概念q数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的

38、信息和知识的过程。数据挖掘和数据仓库数据挖掘和数据仓库q大部分情况下,数据挖掘都要先把数据从数据仓库或数据集市中拿到数据挖掘库。由于数据仓库中的数据已被清理过,而且所有数据不一致的问题都已被解决,因此数据挖掘从数据仓库中的数据进行挖掘较好。管理信息系统管理信息系统精品课程(精品课程(MISMIS)第第 4242 页页20082008年年6 6月月1 1日日3 3时时3737分分第第 4242 页页6.9数据仓库与数据挖掘数据仓库与数据挖掘6.9.2 OLAP和数据挖掘和数据挖掘数据挖掘过程数据挖掘过程q 确定业务对象; 数据的选择; 数据的预处理; 数据的转换; 数据挖掘; 结果分析; 知识的同化。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 化学工业

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号