数据库原理databaseprincipl

上传人:xiao****1972 文档编号:74030318 上传时间:2019-01-26 格式:PPT 页数:74 大小:836.81KB
返回 下载 相关 举报
数据库原理databaseprincipl_第1页
第1页 / 共74页
数据库原理databaseprincipl_第2页
第2页 / 共74页
数据库原理databaseprincipl_第3页
第3页 / 共74页
数据库原理databaseprincipl_第4页
第4页 / 共74页
数据库原理databaseprincipl_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《数据库原理databaseprincipl》由会员分享,可在线阅读,更多相关《数据库原理databaseprincipl(74页珍藏版)》请在金锄头文库上搜索。

1、An Introduction to Database System,数据库原理 Database Principle,仲恺农业技术学院计算机科学与工程学院,An Introduction to Database System,第九章 关系查询处理和查询优化,9.1 概述 9.2 代数优化 9.3 物理优化 9.4 MSSQL优化之执行计划 9.5 小 结,An Introduction to Database System,9.1 概述,本章目的: RDBMS的查询处理步骤 查询优化的概念 基本方法和技术 查询优化分类 : 代数优化 物理优化,An Introduction to Datab

2、ase System,9.1 概述(续),9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例,An Introduction to Database System,9.1.1 查询处理步骤,RDBMS查询处理阶段 : 1. 查询分析 2. 查询检查 3. 查询优化 4. 查询执行,An Introduction to Database System,查询处理步骤(续),查询处理步骤,An Introduction to Database System,1. 查询分析,对查询语句进行扫描、词法分析和语法分析 从查询语句中识别出语言符号 进行语法检查和语法分析,An Introducti

3、on to Database System,2. 查询检查,根据数据字典对合法的查询语句进行语义检查 根据数据字典中的用户权限和完整性约束定义对用户的存取权限进行检查 检查通过后把SQL查询语句转换成等价的关系代数表达式 RDBMS一般都用查询树(语法分析树)来表示扩展的关系代数表达式 把数据库对象的外部名称转换为内部表示,An Introduction to Database System,3. 查询优化,查询优化:选择一个高效执行的查询处理策略 查询优化分类 : 代数优化:指关系代数表达式的优化,改变操作的 次序和组合 物理优化:指存取路径和底层操作算法的选择 查询优化方法选择的依据: 基

4、于规则(rule based) 基于代价(cost based) 基于语义(semantic based),An Introduction to Database System,4. 查询执行,依据优化器得到的执行策略生成查询计划 代码生成器(code generator)生成执行查询计划的代码,An Introduction to Database System,9.1 关系数据库系统的查询处理,9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例,An Introduction to Database System,9.1.2 实现查询操作的算法示例,一、 选择操作的实现 二、 连

5、接操作的实现,An Introduction to Database System,一、 选择操作的实现,例1Select * from student where ; 考虑的几种情况: C1:无条件; C2:Sno200215121; C3:Sage20; C4:SdeptCS AND Sage20;,An Introduction to Database System,选择操作的实现(续),选择操作典型实现方法: 1. 简单的全表扫描方法 对查询的基本表顺序扫描,逐一检查每个元组是否满足选择条件,把满足条件的元组作为结果输出 适合小表,不适合大表 2. 索引(或散列)扫描方法 适合选择条件

6、中的属性上有索引(例如B+树索引或Hash索引) 通过索引先找到满足条件的元组主码或元组指针,再通过元组指针直接在查询的基本表中找到元组,An Introduction to Database System,选择操作的实现(续),例1-C2 以C2为例,Sno200215121,并且Sno上有索引(或Sno是散列码) 使用索引(或散列)得到Sno为200215121 元组的指针 通过元组指针在student表中检索到该学生 例1-C3 以C3为例,Sage20,并且Sage 上有B+树索引 使用B+树索引找到Sage20的索引项,以此为入口点在B+树的顺序集上得到Sage20的所有元组指针 通

7、过这些元组指针到student表中检索到所有年龄大于20的学生。,An Introduction to Database System,选择操作的实现(续),例1-C4 以C4为例,SdeptCS AND Sage20,如果Sdept和Sage上都有索引: 算法一:分别用上面两种方法分别找到SdeptCS的一组元组指针和Sage20的另一组元组指针 求这2组指针的交集 到student表中检索 得到计算机系年龄大于20的学生 算法二:找到SdeptCS的一组元组指针, 通过这些元组指针到student表中检索 对得到的元组检查另一些选择条件(如Sage20)是否满足 把满足条件的元组作为结果输

8、出。,An Introduction to Database System,二、 连接操作的实现,连接操作是查询处理中最耗时的操作之一 本节只讨论等值连接(或自然连接)最常用的实现算法 例2 SELECT * FROM Student,SC WHERE Student.Sno=SC.Sno;,An Introduction to Database System,连接操作的实现(续),1. 嵌套循环方法(nested loop) 2. 排序-合并方法(sort-merge join 或merge join) 3. 索引连接(index join)方法 4. Hash Join方法,An Intr

9、oduction to Database System,连接操作的实现(续),嵌套循环方法(nested loop) 对外层循环(Student)的每一个元组(s),检索内层循环(SC)中的每一个元组(sc) 检查这两个元组在连接属性(sno)上是否相等 如果满足连接条件,则串接后作为结果输出,直到外层循环表中的元组处理完为止,An Introduction to Database System,连接操作的实现(续),2. 排序-合并方法(sort-merge join 或merge join) 适合连接的诸表已经排好序的情况 排序合并连接方法的步骤: 如果连接的表没有排好序,先对Studen

10、t表和SC表按连接属性Sno排序 取Student表中第一个Sno,依次扫描SC表中具有相同Sno的元组,An Introduction to Database System,连接操作的实现(续),An Introduction to Database System,连接操作的实现(续),排序合并连接方法的步骤(续): 当扫描到Sno不相同的第一个SC元组时,返回Student表扫描它的下一个元组,再扫描SC表中具有相同Sno的元组,把它们连接起来 重复上述步骤直到Student 表扫描完,An Introduction to Database System,连接操作的实现(续),Studen

11、t表和SC表都只要扫描一遍 如果2个表原来无序,执行时间要加上对两个表的排序时间 对于2个大表,先排序后使用sort-merge join方法执行连接,总的时间一般仍会大大减少,An Introduction to Database System,连接操作的实现(续),3. 索引连接(index join)方法 步骤: 在SC表上建立属性Sno的索引,如果原来没有该索引 对Student中每一个元组,由Sno值通过SC的索引查找相应的SC元组 把这些SC元组和Student元组连接起来 循环执行,直到Student表中的元组处理完为止,An Introduction to Database S

12、ystem,连接操作的实现(续),4. Hash Join方法 把连接属性作为hash码,用同一个hash函数把R和S中的元组散列到同一个hash文件中 步骤: 划分阶段(partitioning phase): 对包含较少元组的表(比如R)进行一遍处理 把它的元组按hash函数分散到hash表的桶中 试探阶段(probing phase):也称为连接阶段(join phase) 对另一个表(S)进行一遍处理 把S的元组散列到适当的hash桶中 把元组与桶中所有来自R并与之相匹配的元组连接起来,An Introduction to Database System,连接操作的实现(续),上面ha

13、sh join算法前提:假设两个表中较小的表在第一阶段后可以完全放入内存的hash桶中 以上的算法思想可以推广到更加一般的多个表的连接算法上,An Introduction to Database System,优化的一般步骤,1把查询转换成某种内部表示 2代数优化:把语法树转换成标准(优化)形式 3物理优化:选择低层的存取路径 4生成执行计划,选择代价最小的,An Introduction to Database System,第九章 关系查询处理和查询优化,9.1 概述 9.2 代数优化 9.3 物理优化 9.4 MSSQL优化之执行计划 9.5 小 结,An Introduction t

14、o Database System,9.2 代 数 优 化,9.2.1 关系代数表达式等价变换规则 9.2.2 查询树的启发式优化,An Introduction to Database System,9.2.1 关系代数表达式等价变换规则,代数优化策略:通过对关系代数表达式的等价变换来提高查询效率 关系代数表达式的等价:指用相同的关系代替两个表达式中相应的关系所得到的结果是相同的 两个关系表达式E1和E2是等价的,可记为E1E2,An Introduction to Database System,9.2.1 关系代数表达式等价变换规则(续),1) 2) 3) 4) 5),An Introd

15、uction to Database System,常用的等价变换规则:,1. 连接、笛卡尔积交换律 设E1和E2是关系代数表达式,F是连接运算的条件,则有 E1 E2E2 E1 E1 E2E2 E1 E1 E2E2 E1 2. 连接、笛卡尔积的结合律 设E1,E2,E3是关系代数表达式,F1和F2是连接运算的条件,则有 (E1 E2) E3E1 (E2 E3) (E1 E2) E3E1 (E2 E3) (E1 E2) E3E1 (E2 E3),An Introduction to Database System,关系代数表达式等价变换规则(续),3. 投影的串接定律 ( (E) (E) 这里

16、,E是关系代数表达式,Ai(i=1,2,n),Bj(j=1,2,m)是属性名且A1,A2,An构成B1,B2,Bm的子集。 4. 选择的串接定律 ( (E) (E) 这里,E是关系代数表达式,F1、F2是选择条件。 选择的串接律说明选择条件可以合并。这样一次就可检查全部条件。,An Introduction to Database System,关系代数表达式等价变换规则(续),5. 选择与投影操作的交换律 F( (E) (F(E) 选择条件F只涉及属性A1,An。 若F中有不属于A1,An的属性B1,Bm则有更一般的规则: (F(E) (F( (E),An Introduction to Database System,关系代数表达式

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号