信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1

上传人:E**** 文档编号:89498151 上传时间:2019-05-25 格式:PPT 页数:41 大小:446.50KB
返回 下载 相关 举报
信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1_第1页
第1页 / 共41页
信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1_第2页
第2页 / 共41页
信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1_第3页
第3页 / 共41页
信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1_第4页
第4页 / 共41页
信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1》由会员分享,可在线阅读,更多相关《信息资源管理与实践 教学课件 ppt 作者 周苏 信息资源管理-第4章 数据库基础-1(41页珍藏版)》请在金锄头文库上搜索。

1、浙江大学城市学院 周苏 教授,数据库是进行信息组织与管理的基础,而数据库管理系统提供了处理数据库的工具。与之相关的新技术数据仓库能帮助人们组织和管理信息资源;同时,数据挖掘工具能帮助人们吸取极其重要的商务智能。 本章将论述如何运用数据库和数据仓库作为IT工具来管理和存储信息资源,以及如何运用数据库管理系统和数据挖掘工具来分析存储在数据库和数据仓库中的信息。,4.1 数据库技术基础 4.2 数据仓库与数据挖掘 4.3 数据存储解决方案,4.1 数据库技术基础 20世纪80年代以来,关系模型数据库理论日益成熟并得到广泛的应用,国际数据库市场的一些知名产品有Oracle,SQL Server,Syb

2、ase,Informix,DB2以及xBASE的代表产品Visual FoxPro等。,4.1.1 传统数据库的局限 数据库系统是数据库和数据库管理系统 (DBMS) 的总称,是适合于大量数据的存储和管理的有效方法。作为数据处理的核心,DBMS是与应用密切相关的支撑软件。由于集成平台的出现,人们已经习惯于把DBMS纳入平台范畴,称之为数据平台。近年来,数据库理论和技术主要在两个方面得到进一步发展:,1) 采用新数据模型 (如面向对象数据模型、对象-关系数据模型等) 构造数据库,将数据库系统从传统事务处理领域扩展到更广泛的领域,如应用在计算机辅助设计/制造 (CAD/CAM) 、计算机辅助软件工

3、程 (CASE) 和地理信息系统 (GIS) 等领域中,满足对复杂对象的存储和处理要求。,2) 数据库技术与其他学科的发展高度结合,例如数据库技术与分布处理技术结合导出的分布式数据库,数据库技术与人工智能技术结合导出的演绎数据库、智能数据库和主动数据库,数据库技术与多媒体技术结合导出的多媒体数据库等。,但是,在数据库应用方面普遍存在着以下问题: 1) 数据太多而信息不足。随着数据库技术的发展,各企业积累并存放了大量业务数据,但能够为企业提供辅助决策的信息太少。 2) 异构环境数据源。由于市场竞争激烈,新产品周期缩短,如何综合利用分散的异构环境数据源,及时得到准确的信息是取得成功的关键。,3)

4、事务处理环境不适宜决策支持系统 (DSS) 应用。其主要表现在: 事务处理和分析处理的性能特性不同:在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短;而在分析处理环境中,某个DSS应用程序可能需要连续使用几个小时,从而消耗大量的系统资源。, 数据集成问题:DSS需要集成的数据,全面而正确的数据是有效地分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。但是,大多数企业内的数据是分散的,主要是因为事务处理应用分散,数据不一致问题,外部数据和非结构化数据问题等。 数据动态集成问题:静态集成的最大缺点在于,如果在数据集成后数据源中数据发生了变化,这些变化将不能

5、及时反映给决策者,导致决策者使用的是过时的数据。当集成数据必须以一定的周期 (例如24小时) 进行刷新时,我们称其为动态集成。显然,事务处理系统不具备动态集成的能力。, 历史数据问题:事务处理通常只需要当前数据,在数据库中一般也是存储短期数据,而且不同数据的保存期限也不一样,即使有一些历史数据得到保存,也被束之高阁,不能得到充分利用。但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托,没有对历史数据的详细分析,就难以把握企业的发展趋势。DSS对数据在空间和时间的广度上都有了更高的要求,而事务处理环境难以满足这些要求。, 数据的综合问题:在事务处理系统中积累了大量的

6、细节数据,一般而言,DSS并不对这些细节数据进行分析,往往需要事先对细节数据进行不同程度的综合,但事务处理系统不具备这种综合能力。根据规范化理论,这种综合还往往因为是一种数据冗余而被加以限制。,4.1.2 网络数据库 因特网最大的优点就是丰富、方便和廉价的资源共享,而数据信息是资源的主体,因此,网络数据库技术自然成为因特网的核心技术。,客户机/服务器 (Client/Server,C/S) 是因特网的主要网络架构形式之一,因此,数据流动方式就以客户机和服务器间的数据交换为主,即客户机向服务器提交信息和服务器向客户机反馈查询结果。由于因特网是一个松散的网络,所以网络数据库实现的难点就在于平台、数

7、据库以及各种标准不统一,造成了实现手段的复杂化。,随着技术的不断发展,Microsoft提出了实现网络数据库的组合技术ASP + ODBC + ADO + SQL。其中ASP和SQL具有广泛的应用基础和自身独到的特点:ASP采用网页内嵌式代码,并且可以内嵌SQL查询语句,从而降低了编程的复杂性;而SQL语言已经成为数据库领域的一个标准,有助于简化网络数据库的实现手段。,ODBC即开放数据库互联,通过它可以将不同的数据库如SQL Server、Access、Visual FoxPro和Sybase等统一起来共享使用数据。最后,ADO技术将ASP与ODBC和SQL完美地结合在一起,轻松实现网络数据

8、库技术。 随着大量中小网站的涌现以及因特网对动态交互和数据驱动的要求,一种运行在Linux环境并与它紧密结合且功能强大数据库MySQL也在快速扩张,并在中小网站数据库市场上占据了较大的份额。,4.1.3 关系数据库模型 如今,企业为了更好地组织、存储基本的面向事务的信息 (直至最终用于构建商务智能) ,都在运用数据库技术。实际中,有四种用于建立数据库的主流模型,即层次、网状、关系和面向对象。我们主要讨论其中应用最为广泛的数据库模型关系模型。,一般而言,我们说数据库是信息的集合,它能按照信息的逻辑结构对其进行组织与存取。关系数据库利用一系列存在着逻辑关系的二维表或文件来存储信息。术语“关系”用来

9、描述关系模型中的每张二维表或文件 (因此这种模型被命名为关系数据库模型) 。,一个关系模型的数据库实际上由两个独立部分组成: l) 信息的具体内容,它们被存储在一系列的二维表、文件或关系中 (人们可以交替使用这三种存储方式) ; 2) 信息的逻辑结构。,1. 信息的收集 在图4.1中,我们建立了Sololmon数据库的一个局部视图。注意,该数据库包含有五个文件 (也可以称为表或关系) :订单文件、客户文件、混凝土类型文件、雇员文件和卡车文件 (实际上,数据库还可能包含更多的文件) 。这些文件因各种原因关联在一起客户下订单,雇员开卡车送货,每笔订单都包含一种混凝土类型,等等。公司需要所有这些文件

10、来管理它的客户关系和订单。,订单文件,图4.1 Solomon公司有关客户关系管理及订单处理 的数据库的部分内容,混凝土类型文件,图4.1 Solomon公司有关客户关系管理及订单处理 的数据库的部分内容,客户文件,图4.1 Solomon公司有关客户关系管理及订单处理 的数据库的部分内容,雇员文件,图4.1 Solomon公司有关客户关系管理及订单处理 的数据库的部分内容,卡车文件,图4.1 Solomon公司有关客户关系管理及订单处理 的数据库的部分内容,在每个文件中,我们都可以看到一些特定的数据项 (通常被称为属性) ,例如,订单文件中包含有:订单编号 (Order Number) 、订

11、单日期 (Order Date) 、客户编码 (Customer Number) 、发货地址 (Delivery Address) 、混凝土类型 (Concrete Type) 、数量 (Amount,以立方码尺度量) 、卡车编码 (Truck Number) 、司机号 (Driver ID) 。,在客户文件中,也可以看到一些特定信息,包括:客户编码、客户姓名 (Customer Name) 、客户联系电话 (Customer Phone) 和客户主要联系人 (Customer Primary Contact) 。这些都是Solomon 数据库中需要包含的重要信息。此外,Solomon公司还需

12、要利用这些 (也可能更多的) 信息有效地管理订单和客户关系等。,2. 创建逻辑结构 在运用关系数据库模型时,对信息的组织与存取是根据信息的逻辑结构而非物理结构进行的。因此,我们根本没必要关心“顾三喜”应该在雇员文件的哪一行出现,只要知道它的雇员号 (Employee ID) 是“984568756”,或者她的姓名是“顾三喜”就可以了。在关系模型中,数据字典包含了信息的逻辑结构。,在建立数据库时,首先要建立数据字典。数据字典中包含有数据的重要信息或逻辑特征。例如数据字典要求客户文件中的客户联系电话为8位数字,而要求雇员文件中的雇用日期包括年月日。,这是一种完全有别于其他方式的信息组织方法。例如,

13、在大多数电子表格中,如果想存取其中某一单元格中的信息,就必须知道该信息的物理存放位置,即行与列的标号。然而,在关系数据模型中,只要知道信息所在列的字段名称 (如:数量) 及其逻辑行的位置,不必关心信息所在的物理行即可。正是基于这一原理,在上面的Solomon数据库中,很容易修改某个订单的订货数量,而无须知道这一信息的实际存放位置 (通常存放位置是通过行、列标号确定的) 。,在使用电子表格软件时,可以直接输入信息、建立列标题,也能处理信息,但这不是的数据库工作方式。若运用数据库,首先必须在建立的数据字典中清晰地定义每个字段的特征。因此,在向数据库中添加信息之前,必须认真设计数据库的结构。,3.

14、信息内部的逻辑联系 在关系数据库模型中,为了表达相互关联的文件之间是怎样建立联系的,必须建立信息的关联规则。在建立这些相关文件之间的联系之前,首先要确定每个文件的主关键字。主关键字是文件中的一个字段 (有时也可能是字段组) ,它能唯一地表示一条记录。,在上面的Solomon数据库中,订单编号就是订单文件的主关键字,客户编码是客户文件的主关键字。这就意味着,订单文件中的每笔订单都必须拥有唯一的订单编号,客户文件中的每位客户也必须拥有唯一的客户编码。,另外,在指定某个字段为文件的主关键字时,还需强调该字段不能取空值。也就是说,向雇员文件中输入一个新的雇员信息时,不允许雇员号字段为空。否则,将会有多

15、个雇员同时拥有同一个主关键字 (空值) ,即意味着允许一个特定的主关键字 (空值) 对应多个雇员,在数据库环境中这种情况是不允许的。,这一点有别于一般的电子表格工作模式。运用电子表格,几乎不可能确保在给定的列中每个字段值都是唯一的。这一概念强调的是,利用电子表格处理信息时,要根据信息的物理位置来处理,而数据库则是根据信息的逻辑位置进行处理。,观察图4.2就可以看出,客户编码字段同时出现在客户文件和订单文件中,这样,通过该共有的字段就能够建立了两个文件之间的逻辑关联,这是外部关键字的一个实例。外部关键字是取自另一个文件的主关键字。,图4.2在五个文件之间建立了逻辑关系。例如,注意卡车文件中的卡车

16、编码是该文件的主关键字,它同时还出现在了订单文件中,使Solomon公司能够追踪到订单都是由哪些卡车运送的。因此,卡车编码字段在卡车文件中是主关键字,同时它还作为外部关键字出现在订单文件中。在图4.3中还有很多类似的例子。,图4.2 利用主关键字与外部关键字 建立文件间的逻辑关联,4. 内在的完整性约束 在定义关系数据库信息逻辑结构的同时,还要定义完整性约束,这些约束有利于保证信息的合理性。例如,前面已经说明客户编码字段是客户文件的主关键字,在订单文件中它是外部关键字,由此得出这样的结论: l) 不可能有两个客户具有相同的客户编码; 2) 订单文件中的客户编码必然存在于客户文件中。,因此,当Solomon创建一个新订单并向订单文件中输入客户编码时,数据库管理系统必然会在客户文件中找到一个与之对应的唯一的客户编码。这就是内在的完整性约束,它保证“新建一笔订单记录,而该订单所对应的客户却在客户文件中找不到”这样的事情不会发生。,练习与实验:熟悉Windows文件管理 1) 熟悉Windows XP的文件系统,明确应用NTFS文件系统的积极意义。 2) 掌握优化

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号