高级数据库系统技术课程总结

资源描述

《高级数据库系统技术课程总结》由会员分享，可在线阅读，更多相关《高级数据库系统技术课程总结（6页珍藏版）》请在金锄头文库上搜索。

1、课程总结一、基本概念1. 数据库系统的特点：数据结构化，数据的共享性高、冗余度低、易扩充，数据独立性高，数据由）BMS统一管理和控制2. DBMS的基本功能、模块构成和各模块的任务基本功能：数据库定义，数据存取，数据库运行管理，数据组织、存储和管理，数据库的建立和维护，网络通信、数据转换、异构数据库互访等模块构成：事务管理器，查询处理器，存储管理器，缓冲区管理器，恢复管理器，日志管理器，磁盘存储器各模块任务：查询处理器有四个主要成分：DDL编译器，DML编译器，嵌人式DML的预编译器及查询运行核心程序；存储管理器有四个主要成分：权限和完整性管理器，事务管理器，文件管理器及缓冲区管

2、理器3. DBMS与操作系统的关系：操作系统是 DBMS 的基础。操作系统提供的存取原语和基本的存取方法通常是作为 DBMS 存储层的接口。两者都是系统软件，不过OS更在底层，DBMS介于OS和应用软件之间二、数据模型1. 数据库建模的过程（概念模型、数据模型）：概念模型逻辑模型物理模型数据模型：是对现实世界数据特征的抽象，是用来描述数据、组织数据和对数据进行操作的。数据模型由数据结构、数据操作和完整性约束条件3 个方面的内容完整地描述。数据模型有两类：一类是概念模型，一类是逻辑模型和物理模型逻辑数据模型有：层次模型、网状模型、关系模型、面向对象模型、对象关系模型2. 关系模型的组成

3、要素及其优缺点：组成要素：数据结构，操纵和完整性约束（实体完整性、参照完整性、用户自定义完整性），存储结构优点： 1.建立在严格的数学概念的基础上2. 数据结构简单、清晰，用户易懂易用，实体及实体之间的联系都用关系来表示3. 关系模型的存取路径对用户透明，从而具有更高的数据独立性、更好的安全保密性，也简化了程序员的工作和数据库建立和开发的工作缺点：由于存取路径对用户透明，查询效率往往不如非关系模型，因此，为了提高性能，必须对用户的查询表示进行优化，增加了开发数据库管理系统的负担三、数据库系统结构1、数据库的三级模式结构及其意义：三级模式结构：外模式（用户模式、视图层），模式（逻辑模式、

4、逻辑层），内模式（存储模式、物理层）外模式：也称子模式或用户模式，它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述，是数据库用户的数据视图，是与某一应用有关的数据的逻辑表示。模式：是数据库中全体数据的逻辑结构和特征的描述，它仅仅涉及到型的描述，不涉及到具体的值，是所有用户的公共数据视图。（模式的一个具体值称为模式的一个实例，同一个模式可以有很多实例。模式是相对稳定的，而实例是相对变动的，因为数据库中的数据是在不断更新的。模式反映的是数据的结构及其联系，而实例反映的是数据库某一时刻的状态。）内模式：也称存储模式，一个数据库只有一个内模式。它是数据物理结构和存储方式的

5、描述，是数据在数据库内部的表示方式。三级数据抽象：隐藏数据存储和维护细节二级映像：外模式/模式映像，模式/内模式映像正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。三级模式结构的意义：数据库系统的三级模式是对数据的3 个抽象级别，它把数据的具体组织留给DBMS管理，使用户能逻辑地抽象地处理数据，而不必关心数据在计算机中的具体表示方式与存储方式。为了能够在系统内部实现这3 个抽象层次的联系和转换，数据库管理系统在这三级模式之间提供了两层映像：外模式/模式映像、模式/内模式映像，正是这两层映像保证了数据库系统中多的数据能够具有较高的逻辑独立性和物理独立性

6、。三级模式结构和二级映像实现了数据库系统的数据独立性。2、数据库应用系统体系结构（两层/三层,C/S与B/S,集中式/分布式等）两层：客户机/服务器三层：表示层/功能层/数据层（客户机/应用服务器/DB服务器）四、DBMS的模块组成及各模块的功能任务1、事务管理器将关于事务动作的消息传给日志管理器，将关于何时可以或必须将缓冲区拷回磁盘的消息传给缓冲区管理器，将数据库查询等操作消息传给查询处理器2、存储管理器有效存储数据、元数据、索引和日志索引的分类与维护（稠密、稀疏顺序文件索引，树形， Hash）提高二级存储器访问速度的策略3、缓冲区管理器分配、管理和回收缓冲区，决定何时将缓冲

7、区的数据写回磁盘4、查询处理器对查询进行分析，通过选定一个查询计划来对查询进行优化，并且在存储的数据上执行查询计划5、恢复管理器当系统崩溃时，恢复管理器被激活；检查日志并在必要时利用日志恢复数据6、日志管理器维护日志，必须与缓冲区管理器打交道，因为对磁盘的访问是通过缓冲区管理器来进行的五、关系语言1、用关系代数描述查询：会写关系代数式2、SQL 语句及应用（查询、增删改、视图、授权）：会写 SQL 查询语句3、关系代数与 SQL 之间的转换：六、关系数据理论1、函数依赖、部分函数依赖、传递函数依赖的概念:函数依赖：设R（U）是属性集U上的关系模式，X、Y是U的子集，若对于R（U）的任意

8、一个可能的关系r, r中不可能存在两个元组在X上的属性值相等，而在Y上的属性值不等，则称X 函数确定Y或Y函数依赖于X,记作XY。部分函数依赖：若XY，但Y不完全函数依赖于X,则称Y对X部分函数依赖。传递函数依赖：R（U）中，XY（Y不是X的子集），Y/X，YZ（Z不属于Y），则X 传递一X。2、1NF、2NF、3NF、BCNF （定义及判断）：关系模式规范化：一个低一级范式的关系模式，通过模式分解可以转换为若干个高一级范式的关系模式的集合，这种过程就叫规范化。1NF：关系模式满足每一个分量必须是不可分的数据项。2NF：关系模式属于第一范式，且每一个非主属性完全函数依赖于码。3NF：关系

9、模式属于第二范式，且每一个非主属性既不部分依赖于码也不传递依赖于码。 BCNF：关系模式中每一个决定因素都包含码。所有非主属性对每一个码都是完全函数依赖；所有的主属性对每一个不包含它的码，也是完全函数依赖；没有任何属性完全函数依赖于非码的任何一组属性。3NF和BCNF是在函数依赖的条件下对模式分解所能达到的分离程度的测度。3、模式分解方法:BCNF分解，3NF分解模式分解3条不同准则： 1.无损连接性2.保持函数依赖性3.既要保持函数依赖又要具有无损连接性。按照不同的分解准侧，模式所能达到的分离程度各不相同，各种范式就是对分离程度的测度。4、算法：求闭包，找候选码，求最小函数依赖集，判

10、断分解的无损连接性闭包：在关系模式R中为F所逻辑蕴含的函数依赖的全体叫作F的闭包，记为F+ 函数依赖集的闭包：用于发现所有蕴含的函数依赖属性集的闭包：用于判断某属性集能够函数确定的其他因素最小函数依赖集：是指没有任何冗余的函数依赖集。用于寻找等价（闭包相同）的最小集，便于降低检测开销。如果函数依赖集F满足下列条件，则称F为一个极小函数依赖集，或称最小依赖集F：（1）F 中任一函数依赖的右部仅含有一个熟悉。（2）F中不存在这样的函数依赖XA，是的F与F-XA等价。（3）F中不存在这样的函数依赖XA，X有真子集Z使得F-XA U ZA与 F 等价。性质：函数依赖集F的最小函数依赖集不一定唯一

11、，它与求解的次序有关定理：每一个函数依赖集F均等价于一个最小依赖集F 无损分解：能够通过自然连接恢复原关系的分解策略保持依赖：分解后的各子关系函数依赖集并集的闭包与分解前某关系函数依赖集的闭包相同七、数据库设计1、数据库设计的步骤及各阶段完成的任务：1. 需求分析阶段（准确了解与分析用户需求，包括数据与处理）2概念结构设计阶段（对用户需求进行综合、归纳与抽象，形成一个独立于DBMS的概念模型） 3逻辑结构设计阶段（将概念结构转换为某个DBMS所支持的数据模型，并对其进行优化） 4物理设计阶段（为逻辑数据模型选取一个最适合应用环境的物理结构，包括存储结构和存取方法）5数据库实施阶段（设计人

12、员运用数据库语言，根据设计结果建立数据库，编制与调试应用程序，组织数据入库，并进行试运行）6.数据库运行和维护阶段（对其进行评价、调整和修改） 2、E-R 图设计及其到关系模式的转换数据字典：通常包括数据项、数据结构、数据流、数据存储和处理过程5 个部分。其中数据项是数据的最小组成单元，若干个数据项可以组成一个数据结构，数据字典通过对数据项和数据结构的定义来描述数据流、数据存储等逻辑内容。E-R 图的设计：由实体型、实体的属性和实体型之间的联系3 个要素组成的。E-R 图到关系模型的转换：解决的问题是如何将实体型和实体间的联系转换为关系模式，如何确定这些关系模式的属性和码。关系模型的

13、逻辑结构是一组关系模式的集合。一般遵循如下原则：实体：一个实体型转换为一个关系模式。实体的属性就是关系的属性，实体的码就是关系的码。实体间的联系：一个1:1 联系可以转换为一个独立的关系模式，也可以与任意对应的关系模式合并一个1:n联系可以转换为一个独立的关系模式，也可以与n端对应的关系模式合并一个 m:n 联系转换为一个关系模式三个或三个以上实体间的一个多元联系可以转换为一个关系模式具有相同码的关系模式可以合并八、存储与索引1、计算机系统的存储体系结构：高速缓冲存储器、主存储器、二级存储器、三级存储器（Cache-RAM-Disk）2、磁盘I/O原理及缓冲区数据写回时机：磁盘I/

14、O原理：1. 控制机械传动装置，将磁头定位到一个特定的半径2. 选择一个准备读写的盘面，并从位于该盘面的磁头下的磁道上选择一个扇区3. 从扇区读取二进制位并传送至内存，或将主存中的二进制位传送至扇区缓冲区数据写回时机：3、定长和变长记录存储方法：定长记录存储：指针法，保留空间法，错块-溢出块表示法在文件的开头，分配一定数量的字节作为文件头，在文件头中存储的只有内容被删除的第一个记录的地址，用这第一个记录来存储第二个可用记录的地址，依此类推。在插入一条新纪录时，我们使用头文件指向的记录，并改变文件头的指针以指向下一个可用记录。如果没有可用空间，就把这条新纪录加载文件末尾。变长记录存储：字

15、节流表示法，分槽的页结构，定长表示法变长记录在文件中的存储方法之一就是采用字节流表示法：即在每个记录的末尾都附加一个特殊的记录终止符号（丄），或者是在每个记录的开头存储该记录的长度，这样就可以把每个记录作为一个连续的字节流来存储4、索引的顺序文件（稠密、稀疏）、 B 树和散列表：稠密索引：数据文件中的每个key都在索引中对应一个索引项，通过记录指针指向真正的记录数据。稀疏索引：某些key对应一个索引项，如一个块对应一个索引项多值码情况：稠密索引（方法一：每条记录含重复key，对应一个索引项；方法二：每个不同的key对应一个索引；）稀疏索引（每个块对应一个索引项，指向块内第一个记录；）B树索引：动态的、能够保持动态“平衡”每个节点最多有n+1个指针、n个键散列索引：将搜索码及其相应的指针组织成散列文件结构。将散列函数作用于搜索码以确定对应的桶，然后将此搜索码及相应指针存入此桶（或溢出桶）中。好的散列函数：hash值尽量均匀分布在设定的桶范围内；空间利用率尽量保持在50% 80% 内，否则会浪费空间或冲突明显5、索引的创建和使用，数据与索引间的同步更新，聚簇索引创建索引： Creat （unique） index 索引名 on 关系名（属性列表）撤销索引： Drop

展开阅读全文