《数据库与数据仓库》PPT课件

上传人:xian****812 文档编号:304937376 上传时间:2022-06-06 格式:PPT 页数:63 大小:306.50KB
返回 下载 相关 举报
《数据库与数据仓库》PPT课件_第1页
第1页 / 共63页
《数据库与数据仓库》PPT课件_第2页
第2页 / 共63页
《数据库与数据仓库》PPT课件_第3页
第3页 / 共63页
《数据库与数据仓库》PPT课件_第4页
第4页 / 共63页
《数据库与数据仓库》PPT课件_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《《数据库与数据仓库》PPT课件》由会员分享,可在线阅读,更多相关《《数据库与数据仓库》PPT课件(63页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据库与数据仓库 信信息息管管理理系系统统开开发发结结构构第四章第四章 数据库和数据仓库数据库和数据仓库n n 第一节 数据管理n n 第二节 数据库与数据库管理系统环境n n 第三节 关系数据库模型n n 第四节 数据库的建立n n 第五节 数据仓库与数据挖掘n n 第六节 高级数据库技术和高级数据库应用 第一节第一节 数据管理数据管理n n什么是数据管理什么是数据管理n n数据组织的层次数据组织的层次n n实体、属性和关键字实体、属性和关键字n n数据管理的传统方法数据管理的传统方法n n数据管理的数据库方法数据管理的数据库方法为什么要进行数据管理为什么要进行数据管理 名名称称,时

2、时代代,作作者者,规规格格,幅幅面面,内内容容,卷卷前前引引首首,前前隔隔水水,后后隔隔水水,题跋,历代收藏人,印章,真迹图,细部放大图题跋,历代收藏人,印章,真迹图,细部放大图为什么要进行数据管理为什么要进行数据管理n n第一,“信息孤岛”问题日益严重,数据采集、整理、分析的繁重任务,多源异构的海量数据存储,信息资源有效利用的需求,旧有的数据管理与企业发展的冲突等等;n n第二就是系统的自动化程度不高,各个系统不能平滑地集成起来;n n第三就是信息系统的成本,我们曾谈到,信息系统集成成本比信息系统建设的成本高甚至几倍。什么是数据管理什么是数据管理n n根据赛迪顾问的界定,中国数据管理技术应用

3、软件主要包括:企业信根据赛迪顾问的界定,中国数据管理技术应用软件主要包括:企业信息门户(息门户(EIPEIP)、商业智能()、商业智能(BIBI)、内容管理()、内容管理(CMCM)、知识管理系统)、知识管理系统(KMSKMS)和竞争情报系统()和竞争情报系统(CISCIS)五大应用软件领域。)五大应用软件领域。数据管理的定义数据管理的定义n n对大量数据的有规则地组织、存储、检索、呈现、统计、分类、分析,以实现除基本的保存功能外的最大效率地利用。n n相关资料:数据组织的层次n n数据按照层次方式进行组织n n由位、字节、字段、记录、文件和数据库组成由位、字节、字段、记录、文件和数据库组成n

4、 n位(位(BitBit)n n位位是是计计算算机机中中最最小小的的数数据据单单位位,其其值值为为0 0或或1 1,是是一一个二进位,表示一个导通或未通的电路。个二进位,表示一个导通或未通的电路。n n字节(字节(ByteByte)n n字字节节是是由由若若干干位位组组成成的的,代代表表一一个个字字符符。字字符符是是信信息的最基本构架。(见息的最基本构架。(见ASCIIASCII码表)码表)ASCII编码表编码表数据组织的层次n n字段(字段(FieldField)。)。n n多个字符组成一个词或者一个完整的数字(如人名多个字符组成一个词或者一个完整的数字(如人名或年龄),或年龄),n n字段

5、是数据的最小单位,它不能再分成有意义的单字段是数据的最小单位,它不能再分成有意义的单位位n n记录(记录(RecordRecord)n n由与某个特殊对象或活动有关的所有字段组成。由与某个特殊对象或活动有关的所有字段组成。n n文件(文件(FileFile)n n同一类型的所有记录组成一个文件同一类型的所有记录组成一个文件n n文件就是与某个特定主题相关的数据记录的集合。文件就是与某个特定主题相关的数据记录的集合。(字母J的ASCII码)数据的层次数据的层次举例举例文件字节字段纪录01001010900811刘汉云 2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期学

6、分及成绩的记录职员文件(名字字段)职员文件部门文件财务文件900811刘汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 2001-8-2模型的概念:模型的概念:模型的概念:模型的概念: 对现实世界事物特征的模拟和抽象就是这个事物的模型。对现实世界事物特征的模拟和抽象就是这个事物的模型。 计算机不能直接处理现实世界中的具体事物,所以必须计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换为抽象的模型,然后再将其转换为计算机先把具体事物转换为抽象的模型,然后再将其转换为计算机可以处理的数据,从而以模拟的方式实现对现实世界事物的可以处理的数据,从而以模拟的方

7、式实现对现实世界事物的处理。处理。模型应满足以下要求:模型应满足以下要求:n n真实地反映现实世界;真实地反映现实世界;n n易被人理解;易被人理解;n n便于在计算机上实现;便于在计算机上实现;基本术语基本术语n n实体:客观存在、并且可以互相区别的事物称为实体。实体:客观存在、并且可以互相区别的事物称为实体。n n属性:实体所具有的每一个特性都称为一个属性。选属性:实体所具有的每一个特性都称为一个属性。选择的实体属性越多,所描述的实体就越清晰。属性有择的实体属性越多,所描述的实体就越清晰。属性有“ “型型” ”和和“ “值值” ”的概念,属性的名称就是属性的的概念,属性的名称就是属性的“

8、“型型” ”;对型的具体赋值就是属性的;对型的具体赋值就是属性的“ “值值” ”。n n主键值(码)主键值(码) :在众多属性中能够唯一标识实体的属:在众多属性中能够唯一标识实体的属性或属性组。性或属性组。n n实体集:某个实体型下的全部实体,称为实体集。实体集:某个实体型下的全部实体,称为实体集。n n联系:一个实体集内部各实体之间的相互联系,叫做联系:一个实体集内部各实体之间的相互联系,叫做实体内部联系。在实体集之间的联系,称为实体的外实体内部联系。在实体集之间的联系,称为实体的外部联系。部联系。实体、属性和关键字实体、属性和关键字n n实体entityn n实体是所收集的数据相关的一类事

9、物,可以是实体是所收集的数据相关的一类事物,可以是物,人,实际的东西,或者具体的东西物,人,实际的东西,或者具体的东西n n员工员工n n库存库存n n客户客户n n订单订单n n教室教室实体、属性和关键字实体、属性和关键字n n属性Attributen n属性是实体的某一方面的特征属性是实体的某一方面的特征n n学生的姓名、学号、年龄、性别成绩是学生的学生的姓名、学号、年龄、性别成绩是学生的属性属性n n库存号、说明、现有数量、在仓库中的位置等库存号、说明、现有数量、在仓库中的位置等是库存的属性是库存的属性实体、属性和关键字实体、属性和关键字n n关键字 Primary Keyn n关键字是

10、用来识别记录的一个或一组数据项,关键字是用来识别记录的一个或一组数据项,是识别记录和文件中查找记录的标志是识别记录和文件中查找记录的标志n n学生文件中的学号,产品文件中的产品号,订学生文件中的学号,产品文件中的产品号,订单文件中的订单号单文件中的订单号n n辅助关键字 Secondary Keyn n不能唯一表示一个记录的字段不能唯一表示一个记录的字段数据管理的传统方法数据管理的传统方法n n利用文件管理数据利用文件管理数据n n为每个应用程序分别创建和存储数据文件的数据为每个应用程序分别创建和存储数据文件的数据管理方法都称为传统方法管理方法都称为传统方法应用程序 A文件A应用程序 B文件B

11、应用程序 C文件C数据管理传统方法的不足数据管理传统方法的不足n n数据冗余大n n冗余是指在多个数据文件中重复出现相同的数冗余是指在多个数据文件中重复出现相同的数据。据。n n数据与程序独立性不高n n数据文件和维护它的相关程序之间过分依赖。数据文件和维护它的相关程序之间过分依赖。数据管理的数据库方法数据管理的数据库方法n n数据库是逻辑相关的记录和文件的集合。n n把把先先前前提提及及的的所所有有存存储储在在独独立立文文件件中中的的记记录录归归并并在在一一个个数数据据库库内内,以以便便让让不不同同的的应应用用程程序序存存取。取。n n储储存存在在数数据据库库中中的的数数据据既既独独立立于于

12、使使用用它它的的计计算算机程序,也独立于存储它的外部存储器的类型。机程序,也独立于存储它的外部存储器的类型。数据库管理系统中的模式数据库管理系统中的模式数据库管理系统中的模式数据库管理系统中的模式n n物物理理模模式式:描描述述数数据据的的物物理理存存储储形形式式,也也称称内内模模式式,直接与操作系统或硬件相联系。直接与操作系统或硬件相联系。n n概概念念模模式式(逻逻辑辑模模式式):数数据据库库数数据据的的完完整整表表示示,是是所所有有用用户户的的公公共共数数据据视视图图。模模式式仅仅仅仅涉涉及及数数据据类类型型的的描述,不涉及具体的数据值。描述,不涉及具体的数据值。n n子子模模式式:针针

13、对对每每一一个个用用户户或或应应用用,又又由由模模式式导导出出若若干干个个子子模模式式(或或叫叫外外模模式式、用用户户模模式式)。子子模模式式是是直直接接面面向向用用户户的的,用用户户能能够够看看见见并并使使用用的的是是逻逻辑辑结结构构的的局局部部数数据据描描述述。每每一一个个子子模模式式都都是是模模式式的的一一个个子子集集;也也可可以以看看作作是是模模式式的的一一个个窗窗口口。一一个个数数据据库库系系统统可可以以有有多个子模式。多个子模式。两级映射可保证三种模式之间的相互独立性。两级映射可保证三种模式之间的相互独立性。数据库管理系统n nDatabase Management SystemD

14、atabase Management System,DBMSDBMSn n在数据库管理系统中,应用程序不能直接从存储介质获得在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据。它必须先将请求提交给所需的数据。它必须先将请求提交给DBMSDBMS,由,由DBMSDBMS负负责从存储介质检索数据并提供给应用程序使用责从存储介质检索数据并提供给应用程序使用基于数据库方法的优点基于数据库方法的优点n n减减少少数数据据冗冗余余,更更有有效效利利用用存存储储空空间间并并增增强强数数据据的的完完整整性性。也也为为组组织织提提供供了了更更大大地地利利用用数数据据的灵活性。的灵活性。n n两两个个文

15、文件件中中的的数数据据放放在在了了同同一一个个数数据据库库,可可以以多种方法定位数据并获得要处理的数据多种方法定位数据并获得要处理的数据n n共享数据和信息资源共享数据和信息资源第二节第二节 数据库与数据库管理数据库与数据库管理系统环境系统环境n n数据库及其特征n n数据库管理系统n n数据库查询语言n n数据的逻辑视图和物理视图数据库及其特征数据库及其特征n n数据库的定义n n数数据据库库(DatabaseDatabase)是是一一个个信信息息的的集集合合,在在这这个个集集合合中中可可以以按按照照信信息息的的逻逻辑辑结结构构对对其其进进行行组组织与存取。织与存取。n n数据库由两部分组成

16、n n信息本身信息本身n n信息的逻辑结构信息的逻辑结构数据库特征数据库特征n n信息的集合数据库特征数据库特征n n逻辑结构n n数据字典包含信息的逻辑结构数据字典包含信息的逻辑结构数据库的特征数据库的特征n n信息中的逻辑联系n n建立信息间的联系或关系意味着找出文件之间建立信息间的联系或关系意味着找出文件之间的相互关系的相互关系. .n n主关键字主关键字n n数据库文件中的一个字段数据库文件中的一个字段, ,唯一描述一个记录唯一描述一个记录n n产品文件中的产品产品文件中的产品ID,ID,供应商文件中的供应商编号供应商文件中的供应商编号n n外部关键字外部关键字n n一个文件中的主关键字出现在另一个文件中就是外一个文件中的主关键字出现在另一个文件中就是外部关键字部关键字, ,比如产品文件中的供应商文件比如产品文件中的供应商文件. .数据库的特征数据库的特征n n内在的完整性约束n n完整性约束是保证信息质量的一种规则完整性约束是保证信息质量的一种规则n n比如比如n n产品产品IDID不能重复不能重复n n产品文件中的产品文件中的供应商供应商IDID不应该是供应商文件中没有不应

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号