第四章 数据库与数据仓库

上传人:种**** 文档编号:260545941 上传时间:2022-02-28 格式:PPTX 页数:65 大小:555KB
返回 下载 相关 举报
第四章 数据库与数据仓库_第1页
第1页 / 共65页
第四章 数据库与数据仓库_第2页
第2页 / 共65页
第四章 数据库与数据仓库_第3页
第3页 / 共65页
第四章 数据库与数据仓库_第4页
第4页 / 共65页
第四章 数据库与数据仓库_第5页
第5页 / 共65页
亲,该文档总共65页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第四章 数据库与数据仓库》由会员分享,可在线阅读,更多相关《第四章 数据库与数据仓库(65页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据库与数据仓库 信息管理系统开发结构第四章 数据库和数据仓库n 第一节 数据管理n 第二节 数据库与数据库管理系统环境n 第三节 关系数据库模型n 第四节 数据库的建立n 第五节 数据仓库与数据挖掘n 第六节 高级数据库技术和高级数据库应用 第一节 数据管理n什么是数据管理n数据组织的层次n实体、属性和关键字n数据管理的传统方法n数据管理的数据库方法为什么要进行数据管理 名称,时代,作者,规格,幅面,内容,卷前引首,前隔水,后隔水名称,时代,作者,规格,幅面,内容,卷前引首,前隔水,后隔水,题跋,历代收藏人,印章,真迹图,细部放大图,题跋,历代收藏人,印章,真迹图,细部放大图为什么要

2、进行数据管理n第一,“信息孤岛”问题日益严重,数据采集、整理、分析的繁重任务,多源异构的海量数据存储,信息资源有效利用的需求,旧有的数据管理与企业发展的冲突等等;n第二就是系统的自动化程度不高,各个系统不能平滑地集成起来;n第三就是信息系统的成本,我们曾谈到,信息系统集成成本比信息系统建设的成本高甚至几倍。什么是数据管理n根据赛迪顾问的界定,中国数据管理技术应用软件主要包括:企业信息门户(EIP)、商业智能(BI)、内容管理(CM)、知识管理系统(KMS)和竞争情报系统(CIS)五大应用软件领域。数据管理的定义数据组织的层次n数据按照层次方式进行组织n由位、字节、字段、记录、文件和数据库组成n

3、位(Bit)n位是计算机中最小的数据单位,其值为0或1,是一个二进位,表示一个导通或未通的电路。n字节(Byte)n字节是由若干位组成的,代表一个字符。字符是信息的最基本构架。(见ASCII码表)ASCII编码表数据组织的层次n字段(Field)。n多个字符组成一个词或者一个完整的数字(如人名或年龄),n字段是数据的最小单位,它不能再分成有意义的单位n记录(Record)n由与某个特殊对象或活动有关的所有字段组成。n文件(File)n同一类型的所有记录组成一个文件n文件就是与某个特定主题相关的数据记录的集合。(字母J的ASCII码)数据的层次举例文件字节字段纪录01001010900811刘汉

4、云 2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期学分及成绩的记录职员文件(名字字段)职员文件部门文件财务文件900811刘汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 2001-8-2模型的概念: 对现实世界事物特征的模拟和抽象就是这个事物的模型。 计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换为抽象的模型,然后再将其转换为计算机可以处理的数据,从而以模拟的方式实现对现实世界事物的处理。模型应满足以下要求:n n真实地反映现实世界;真实地反映现实世界;n n易被人理解;易被人理解;n n便于在计算机上实现;便于在

5、计算机上实现;基本术语n实体:客观存在、并且可以互相区别的事物称为实体。n属性:实体所具有的每一个特性都称为一个属性。选择的实体属性越多,所描述的实体就越清晰。属性有“型”和“值”的概念,属性的名称就是属性的“型”;对型的具体赋值就是属性的“值”。n主键值(码) :在众多属性中能够唯一标识实体的属性或属性组。n实体集:某个实体型下的全部实体,称为实体集。n联系:一个实体集内部各实体之间的相互联系,叫做实体内部联系。在实体集之间的联系,称为实体的外部联系。实体、属性和关键字n实体entityn实体是所收集的数据相关的一类事物,可以是物,人,实际的东西,或者具体的东西n员工n库存n客户n订单n教室

6、实体、属性和关键字n属性Attributen属性是实体的某一方面的特征n学生的姓名、学号、年龄、性别成绩是学生的属性n库存号、说明、现有数量、在仓库中的位置等是库存的属性实体、属性和关键字n关键字 Primary Keyn关键字是用来识别记录的一个或一组数据项,是识别记录和文件中查找记录的标志n学生文件中的学号,产品文件中的产品号,订单文件中的订单号n辅助关键字 Secondary Keyn不能唯一表示一个记录的字段数据管理的传统方法n利用文件管理数据n为每个应用程序分别创建和存储数据文件的数据管理方法都称为传统方法应用程序 A文件A应用程序 B文件B应用程序 C文件C数据管理传统方法的不足n

7、数据冗余大n冗余是指在多个数据文件中重复出现相同的数据。n数据与程序独立性不高n数据文件和维护它的相关程序之间过分依赖。数据管理的数据库方法n数据库是逻辑相关的记录和文件的集合。n把先前提及的所有存储在独立文件中的记录归并在一个数据库内,以便让不同的应用程序存取。n储存在数据库中的数据既独立于使用它的计算机程序,也独立于存储它的外部存储器的类型。数据库管理系统中的模式数据库管理系统中的模式n n物理模式:描述数据的物理存储形式,也称内模式,物理模式:描述数据的物理存储形式,也称内模式,直接与操作系统或硬件相联系。直接与操作系统或硬件相联系。n n概念模式(逻辑模式):数据库数据的完整表示,是概

8、念模式(逻辑模式):数据库数据的完整表示,是所有用户的公共数据视图。模式仅仅涉及数据类型的所有用户的公共数据视图。模式仅仅涉及数据类型的描述,不涉及具体的数据值。描述,不涉及具体的数据值。n n子模式:针对每一个用户或应用,又由模式导出若干子模式:针对每一个用户或应用,又由模式导出若干个子模式(或叫外模式、用户模式)。子模式是直接个子模式(或叫外模式、用户模式)。子模式是直接面向用户的,用户能够看见并使用的是逻辑结构的局面向用户的,用户能够看见并使用的是逻辑结构的局部数据描述。每一个子模式都是模式的一个子集;也部数据描述。每一个子模式都是模式的一个子集;也可以看作是模式的一个窗口。一个数据库系

9、统可以有可以看作是模式的一个窗口。一个数据库系统可以有多个子模式。多个子模式。两级映射可保证三种模式之间的相互独立性。两级映射可保证三种模式之间的相互独立性。数据库管理系统nDatabase Management System,DBMSn在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据。它必须先将请求提交给DBMS,由DBMS负责从存储介质检索数据并提供给应用程序使用基于数据库方法的优点n减少数据冗余,更有效利用存储空间并增强数据的完整性。也为组织提供了更大地利用数据的灵活性。n两个文件中的数据放在了同一个数据库,可以多种方法定位数据并获得要处理的数据n共享数据和信息资源第二节 数

10、据库与数据库管理系统环境n数据库及其特征n数据库管理系统n数据库查询语言n数据的逻辑视图和物理视图数据库及其特征n数据库的定义n数据库(Database)是一个信息的集合,在这个集合中可以按照信息的逻辑结构对其进行组织与存取。n数据库由两部分组成n信息本身n信息的逻辑结构数据库特征n信息的集合数据库特征n逻辑结构n数据字典包含信息的逻辑结构数据库的特征n信息中的逻辑联系n建立信息间的联系或关系意味着找出文件之间的相互关系.n主关键字n数据库文件中的一个字段,唯一描述一个记录n产品文件中的产品ID,供应商文件中的供应商编号n外部关键字n一个文件中的主关键字出现在另一个文件中就是外部关键字,比如产

11、品文件中的供应商文件.数据库的特征n内在的完整性约束n完整性约束是保证信息质量的一种规则n比如n产品ID不能重复n产品文件中的供应商ID不应该是供应商文件中没有的供应商ID数据库管理系统nDatabase Management Systemn是一组软件,允许组织集中并有效地管理数据以供应用程序访问n相当与应用程序和物理数据文件之间的接口数据库管理系统的组成n数据定义语言n数据操作语言n数据字典数据库管理系统组成n数据定义语言n描述数据库内容和结构的正式语言n数据操作语言n操作数据库中的数据,提供了一组提取数据的命令n数据字典n自动生成或者手工生成的文件,用来存储数据元素的定义和特性。如用途,物

12、理表现,所属关系,授权和安全.被动的,主动的.数据字典n给数据流程图中每个成分以定义和说明的工具。在数据流程图中仅对系统逻辑功能的总体框架作了描述,缺乏详细具体的说明。数据字典的作用是对数据流程图中的各种成分,包括数据项、数据结构、数据流、数据存储、处理功能、外部项等的逻辑内容与特征予以详细说明。数据字典中有关系统的详细信息是以后系统设计、系统实施与维护的重要依据。n数据字典编写的基本要求如下:n对数据流程图中各种成分的定义必须明确、易理解、唯一;n命名、编号与数据流程图一致;n符合一致性与完整性的要求,对数据流程图上的成分定义与说明无遗漏项,无同名异义或异名同义;n格式规范、文字精炼与符号正

13、确。 财务管理第三层工资管理数据流程图数据字典中的条目 n数据项:是数据处理中不可分割的基本逻辑单位。包括数据项编号、名称、取值范围、数据项类型、长度等。n数据结构:描述数据流/数据存储的逻辑组成。数据结构条目内容包括:数据结构名称、编号、包含该结构的数据流/数据存储的编号、该数据结构中包含的数据项名称等。 数据字典中的条目 n数据流:定义数据流程图中的数据流,内容为数据流的编号、名称来源、去向、包含数据结构的名称以及单位时间(如年月日)传输次数等。 n数据存储:存储条目的内容有数据存储的名称、编号、组成(即数据存储包含的数据结构)、最大记录数等。n处理功能:条目内容有处理功能的名称、编号、输

14、入数据流、输出数据流、处理逻辑概括等。n外部实体:条目内容有外部实体名称、编号、输入数据流、输出数据流等。 数据库查询语言n属于数据操作语言n自然语言n自然语言查询命令nLIST THE NAMES AND ADDRESSES OF ALL SUPPLIERS WHO LIVE IN SHANGHAInQBEnQuery By Examplen通过拖曳数据项等方法来查询数据数据库查询语言nSQLnStructured Query Languagen结构化查询语言标准n利用SQL可以查询不同数据库管理系统下的数据.n基本形式nSELECTFROMWHERE数据视图和逻辑视图nDBMS把数据的逻辑

15、视图和物理视图分开n逻辑视图以最终用户所使用的直观的方式来显示数据n物理视图则显示了数据的实际组织形式以及它在物理存储介质上的结构n一个物理视图可支持多个逻辑视图nDBMS使用专门的数据库管理软件,使得物理数据库可用于不同应用程序所需的不同的逻辑视图。第三节 关系数据库模型n四种数据库模型n层次型n网状型n关系型n目前使用最为广泛n面向对象层次型数据库n层次模型:实体之间按层次关系来定义。实体用记录表示,实体的属性对应记录的数据项。层次模型以每个实体为结点,上层结点叫“父结点”,下层结点叫“子结点”。如下图所示n仅有一个无双亲的根结点;根结点叶子结点n根结点以外的子结点,向上仅有一个父结点,向

16、下有若干子结点。 网状模型数据库n网状模型:可表达比较复杂的实体间关系(多对多),但当需要对系统扩展时,对原有数据结构及应用程序的修改,需要花费更多的代价,甚至带来严重的后果。主要特征如下:n有一个以上的结点无双亲;n至少有一个结点有多个双亲; 关系数据库模型n利用一系列的二维表或文件存储信息.n在关系模型中,每个二维表都描述一种关系.n关系是表的数学术语n每一个表或关系所保存的信息都与一个特定的实体有关.n二维表使描述信息间的关系十分便利,容易处理二维表所包含的信息.n可以灵活地查询数据库和建立报表关系数据库模型n可以灵活地查询数据库和建立报表n查询单个表和多个表n不必建立数据项之间的所有连接,随时可以建立.关系数据库模型n关系模型:以表格形式作为基本的存储结构,通过相同关键字段来实现表格间的数据联系。结构简单、易学易用是其主要特点,很受用户欢迎,是目前的主流。n由于系统中实体包括许多属性,而这些属性又会被不同用户的用户使用,所以将这些属性一起放在一个数据表中显然是不合理的,需要进行分类与汇总,以编制不同的、且相关联的表,这就是所谓的关系。n表具有以下四个性质:n在表中的任意一列上,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号