北京大学数据库系统资料讲解

上传人:今*** 文档编号:106869085 上传时间:2019-10-16 格式:PPT 页数:763 大小:36.95MB
返回 下载 相关 举报
北京大学数据库系统资料讲解_第1页
第1页 / 共763页
北京大学数据库系统资料讲解_第2页
第2页 / 共763页
北京大学数据库系统资料讲解_第3页
第3页 / 共763页
北京大学数据库系统资料讲解_第4页
第4页 / 共763页
北京大学数据库系统资料讲解_第5页
第5页 / 共763页
点击查看更多>>
资源描述

《北京大学数据库系统资料讲解》由会员分享,可在线阅读,更多相关《北京大学数据库系统资料讲解(763页珍藏版)》请在金锄头文库上搜索。

1、第一章 数据库系统简介,2,Why? What? How?,Why? 数据管理艺术的必然 What? 数据模型 How? 数据库模式,3,琐言碎语,信息与数据 信息与知识 数据的认识层面 数据库在信息系统中的地位,4,信息与数据,信息定义 哲学上 人们所认知与感知对象的抽象 数学上 是确定性的度量,两次不定性之差,与随机对立 物理上 是一种能量,与熵对立,Maxiwell精灵,5,信息与数据,信息特性 无限性 共享性 创造性 数据 对现实世界中客观事物的符号表示 可以是数值数据,也可以是非数值数据,如声音、图像等 计算机中数据 能输入计算机,并能为其处理的符号序列,6,信息与数据,信息与数据的

2、联系 数据是信息的符号表示,或称载体 信息是数据的内涵,是数据的语义解释 数据是符号化的信息 信息是语义化的数据 例,一幅黑白图象 数据黑白点阵 信息脸谱,7,信息与知识,知识 “行动的能力” “可以辅助我们作出决策或采取行动的有很高价值的一种信息形态” 可以很快地将信息从一个地方转移到另一个地方,但将知识从一个人转移给另一个人经常是很困难和很慢的,感知信息,学习知识,8,信息与知识,信息管理 信息管理通过收集、处理、浓缩信息以达到有效的管理 知识管理 知识管理的焦点是通过信息的收集、存储、发布、重用等获得人的交流与知识共享达到知识的创新目的 知识管理是一个过程,个人通过这一过程学习新知识和获

3、得新经验,并将这些新知识和新经验反应出来,进行共享,以用来促进培养、增强个人的知识和机构组织的价值 知识管理是组织有意识采取的一种战略,它保证能够在最需要的时间将最需要的知识传送给最需要的人。这样可以帮助人们共享信息,并进而将之通过不同的方式付诸实践,最终达到提高组织业绩的目的,9,数据的认识层面,数据结构 按照逻辑关系组织起来的一批数据, 按一定的存储方法把它存储在计算机中, 并在这些数据上定义了一个运算的集合 逻辑结构 数据之间存在的逻辑关系 表、树、图、数组 物理结构 数据在计算机内的存储方式 顺序方式、链接方式,10,数据的认识层面,数据独立性 当数据的结构发生变化时,通过系统提供的映

4、象(转换)功能,使应用程序不必改变 数据的物理独立性 当数据的存储结构改变时,应用程序不必改变 数据的逻辑独立性 当数据的逻辑结构改变时,应用程序不必改变,11,数据的认识层面,数据语义 语言:形式 语义:内涵 11010819800101001?,庄子与惠子游于濠梁之上,庄子曰:“鲦鱼出游从容,是鱼之乐也。”惠子曰:“子非鱼,安知鱼之乐?”,庄子曰:“子非我,安知我不知鱼之乐?”惠子曰:“我非子,固不知子矣;子固非鱼也,子之不知鱼之乐,全矣。”庄子曰:“请循其本。子曰女安知鱼乐云者,既已知吾知之而问我,我知之濠上也。”,12,信息系统,信息系统:存储、处理、交换信息,13,数据库在信息系统中

5、的地位,数据管理 对数据的分类、组织、编码、存储、检索和维护,14,数据库在信息系统中的地位,新趋向 应用由计算转向信息处理 数据量激增,并呈多样性 数字图书馆 交互视频 人类基因组 电子商务 Web .,15,数据库在信息系统中的地位,市场前景 四大支柱 操作系统、网络、计算机语言、数据库 两大热门 网络、数据库 无所不在的数据管理 Everything Over DB?,16,提纲,回溯数据管理的发展阶段 数据模型 数据库模式 数据库系统的构成 数据库新方向,17,数据管理的发展阶段,考察要点 各阶段的技术及应用背景 计算机应用范围 外存储设备 数据管理软件 各个阶段的差别体现 谁管理数据

6、 数据面向谁 数据与应用的独立性,18,数据管理的发展阶段,人工管理阶段(50年代中期以前) 文件系统阶段(50年代后期-60年代中期) 数据库系统阶段(60年代后期开始) 数据库系统 VS 文件系统 软件发展趋势 数据库系统的特点,19,人工管理阶段,背景 计算机主要用于科学计算 数据量小、结构简单,如高阶方程、曲线拟和等 外存为顺序存取设备 磁带、卡片、纸带,没有磁盘等直接存取设备 没有操作系统,没有数据管理软件 用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户上机操作,20,人工管理阶段,特点 用户完全负责数据管理工作 数据的组织、存储

7、结构、存取方法、输入输出等 数据完全面向特定的应用程序 每个用户使用自己的数据,数据不保存,用完就撤走 数据与程序没有独立性 程序中存取数据的子程序随着存储结构的改变而改变 磁带的特点 优点:廉价地存放大容量数据 缺点:顺序访问;1%所需,100%访问,21,人工管理阶段,22,文件系统阶段,背景 计算机不但用于科学计算,还用于管理 外存有了磁盘、磁鼓等直接存取设备 直接存取设备(DASD) 无须顺序存取 由地址直接访问所需记录 有了专门管理数据的软件,一般称为文件系统 文件存储空间的管理 目录管理 文件读写管理 文件保护 向用户提供操作接口,23,文件系统阶段,特点 系统提供一定的数据管理功

8、能 存取方法(索引文件、链接文件、直接存取文件、倒排文件等) 支持对文件的基本操作(增、删、改、查等),用户程序不必考虑物理细节 数据的存取基本上以记录为单位 数据仍是面向应用的 一个数据文件对应一个或几个用户程序 数据与程序有一定的独立性 文件的逻辑结构与存储结构由系统进行转换,数据在存储上的改变不一定反映在程序上,24,文件系统阶段,数据1,数据2,数据n,存取方式,程序1,程序2,程序n,25,文件系统阶段,数据与程序的独立性差 文件系统的出现并没有从根本上改变数据与程序紧密结合的状况,数据的逻辑结构改变则必须修改应用程序 文件系统只是解脱了程序员对物理设备存取的负担,它并不理解数据的语

9、义,只负责存储 数据的语义信息只能由程序来解释,也就是说,数据收集以后怎么组织,以及数据取出来之后按什么含义应用,只有全权管理它的程序知道。 一个应用若想共享另一个应用生成的数据,必须同另一个应用沟通,了解数据的语义与组织方式,26,文件系统阶段,数据的共享性差,冗余度大 数据面向应用 即使不同应用程序所需要的数据有部分相同时,也必须建立各自的文件,而不能共享相同的数据 数据孤立 数据分散管理,许多文件,许多数据格式 数据的不一致性 由于数据存在很多副本,给数据的修改与维护带来了困难,容易造成数据的不一致性,27,文件系统阶段,28,文件系统阶段,数据查询困难 记录之间无联系 应用自己编程实现

10、 对每个查询都重新编码 数据完整性难于保证,29,数据库系统阶段,背景 计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据) 外存有了大容量磁盘,光盘 软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低,30,数据库系统阶段,特点 有了数据库管理系统 面向全组织,面向现实世界 独立性较强 由DBMS统一存取,维护数据语义及结构,31,数据库系统阶段,数据库观点 数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象,32,数据库系统阶段,33,示例,S(SNO, SNAME, STATUS, CITY) P(PNO, PN

11、AME, COLOR, WEIGHT, CITY) J(JNO, JNAME,CITY) SPJ(SNO, PNO, JNO, QTY) S表示供应商,它的各属性依次为供应商号,供应商名,供应商状态值,供应商所在城市; P表示零件,它的各属性依次为零件号,零件名,零件颜色,零件重量,零件存放的城市; J表示工程,它的各属性依次为工程号,工程名,工程所在城市; SPJ表示供货关系,它的各属性依次为供应商号,零件号,工程号,供货数量。,34,示例,查询 “供应红色零件给北京的工程的供应商姓名” 维护 “不允许供应不存在的零件”,35,示例基于文件系统,分别组织几个文件,存储各类对象的记录,36,示

12、例基于文件系统,如果InsertFile(SPJ),ScanFile(P) 判断欲插入的零件号是否在P中,如果DeleteFile(P),ScanFile(SPJ) 判断欲删除的零件号是否在SPJ中,37,示例基于数据库系统,数据统一按表结构存放,设为S,P,J,SPJ 查询:只需提查询要求,由系统完成查询过程 SELECT SNAME FROM S, P, J, SPJ WHERE SPJ.SNO = S.SNO AND SPJ.PNO = P.PNO AND SPJ.PNO = P.PNO AND J.CITY = “BEIJING” AND P.COLOR = “RED” 维护:应用提出

13、完整性约束,系统自动检查 CREATE TABLE SPJ(, FOREIGN KEY (PNO) REFERENCES P(PNO), ),38,数据库系统 vs 文件系统,文件系统的弱点 记录之间无联系 难于维护数据的完整性 数据库系统的用武之地 有查询 整体数据结构化 效率两面观 运行效率 开发效率,39,数据库系统 vs 文件系统,40,软件发展趋势,软件开发正由编码向集成转变,编码,集成,1970 1990 2010,41,软件发展趋势,机器与汇编语言 1950 编译语言 1960 子程序 数据库服务 1985 特定域对象库 1990 预定义的结构及解决方案 商用对象库 2000 域

14、标准,组件,子程序,服务,42,数据库系统的特点,面向全组织的复杂的数据结构 支持全企业的应用而不是某一个应用 数据反映了客观事物间的本质联系,而不是着眼于面向某个应用,是有结构的数据。这是数据库系统的主要特征之一,与文件系统的根本差别。文件系统只是记录的内部有结构,一个文件的记录之间是个线性序列,记录之间无联系,43,数据库系统的特点,数据的冗余度小,易扩充 数据面向整个系统,而不是面向某一应用,数据集中管理,数据共享,因此冗余度小 节省存储空间,减少存取时间,且可避免数据之间的不相容性和不一致性 每个应用选用数据库的一个子集,只要重新选取不同子集或者加上一小部分数据,就可以满足新的应用要求

15、,这就是易扩充性,44,数据库系统的特点,具有较高的数据和程序的独立性 把数据库的定义和描述从应用程序中分离出去 数据描述是分级的(全局逻辑、局部逻辑、存储) 数据的存取由系统管理,用户不必考虑存取路径等细节,从而简化了应用程序,45,数据库系统的特点,统一的数据控制功能,数据共享程度高 数据的安全性控制(Security) 保护数据以防止不合法的使用所造成的数据泄露和破坏 措施:用户标识与鉴定,存取控制 数据的完整性控制(Integrity) 数据的正确性、有效性、相容性 措施:完整性约束条件定义和检查 并发控制(Concurrency) 对多用户的并发操作加以控制、协调,防止其互相干扰而得

16、到错误的结果并使数据库完整性遭到破坏 措施:封锁,46,数据模型,数据抽象 数据模型定义 概念数据模型 结构数据模型的三要素 结构数据模型示例,47,数据抽象,信息世界 数据库系统是面向计算机的,而应用是面向现实世界的,两个世界存在着很大差异,要直接将现实世界中的语义映射到计算机世界是十分困难的,因此引入一个信息世界作为现实世界通向计算机实现的桥梁 一方面,信息世界是对现实世界的抽象,从纷繁的现实世界中抽取出能反映现实本质的概念和基本关系;另一方面,信息世界中的概念和关系,要以一定的方式映射到计算机世界中去,在计算机系统上最终实现。信息世界起到了承上启下的作用,48,数据抽象,“computing”,49,数据模型定义,数据模型 是数据库系统中用于提供信息表示和操作手段的形式构架,50,数据模型定义,概念数据模型 按用户的观点来对数据和信息建模 用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系 这类模型强调其语义表达

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号