关系查询处理及其查询优化

上传人:飞*** 文档编号:40460662 上传时间:2018-05-26 格式:DOC 页数:8 大小:64KB
返回 下载 相关 举报
关系查询处理及其查询优化_第1页
第1页 / 共8页
关系查询处理及其查询优化_第2页
第2页 / 共8页
关系查询处理及其查询优化_第3页
第3页 / 共8页
关系查询处理及其查询优化_第4页
第4页 / 共8页
关系查询处理及其查询优化_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《关系查询处理及其查询优化》由会员分享,可在线阅读,更多相关《关系查询处理及其查询优化(8页珍藏版)》请在金锄头文库上搜索。

1、第九章 关系查询处理及其查询优化章 节9.1 关系数据库系统的查询处理 9.2 关系数据库系统的查询优化 9.3 代数优化 9.4 物理优化课型新授课课时2 节课班级2002 级 1、2 班教 学 目 标重点掌握关系系统的查询优化。教 学 重 点 难 点1. 重点掌握关系系统的查询优化。 2. 画出查询的语法树和优化后的语法树。 3. 优化算法,包括代数优化算法和物理优化算法。教学 关键理解查询处理的过程 了解查询优化的方法教学 方法讲解和课件演示教 具计算机大屏幕投影复 习 内 容引 入 内 容讲 解 内 容9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤 1查询分析 2查询检查

2、3查询优化 4查询执行 9.1.2 实现查询操作的算法示例 一、选择操作的实现 1简单的全表扫描方法 2索引(或散列)扫描方法 二、连接操作的实现1循环嵌套方法 2排序-合并方法 3索引连接方法 4Hash 连接方法9.2 关系数据库系统的查询优化 9.2.1 查询优化概述系统选择不同的策略对查询时间影响很大。因此有必要对查询优化查询优化:为查询选择最有效的查询计划。查询优化极大地影响RDBMS的性能。查询优化的可能性 关系数据语言的级别很高,使DBMS 可以从关系表达式 中分析查询语义。 1.由DBMS进行查询优化的好处用户不必考虑如何最好地表达查询以获得较好的效率系统可以比用户程序的优化做

3、得更好 (1) 优化器可以从数据字典中获取许多统计信息,而用户程序则难以获得这些信息 (2)如果数据库的物理统计信息改变了,系统可以自动对查询重新优化以选择相适应的执 行计划。 在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的。(3)优化器可以考虑数百种不同的执行计划,而程序员一般只能考虑有限的几种可能性。 (4)优化器中包括了很多复杂的优化技术 2.查询优化目标查询优化的总目标选择有效策略,求得给定关系表达式的值 3.实际系统的查询优化步骤 (1) 将查询转换成某种内部表示,通常是语法树 (2)根据一定的等价变换规则把语法树转换成标准(优化)形式 (3)选择低层的操作算法对

4、于语法树中的每一个操作计算各种执行算法的执行代价选择代价小的执行算法 (4)生成查询计划(查询执行方案)查询计划是由一系列内部操作组成的。 9.代价模型一般DBMS采用基于代价的优化算法:集中式数据库单用户系统 总代价 = I/O代价 + CPU代价多用户系统 总代价 = I/O代价 + CPU代价 + 内存代价分布式数据库总代价 = I/O代价 + CPU代价+ 内存代价 + 通信代价 9.2.2 一个实例 例:求选修了2号课程的学生姓名SELECT Student.Sname FROM Student, SC WHERE Student.Sno=SC.SnoAND SC.Cno=2; 1

5、name(Student.Sno=SC.Sno SC.Cno=2 (StudentSC) 2 name(SC.Cno= 2 (Student SC) 3 Sname(Student SC.Cno= 2 (SC) 三种不同的执行策略,查询时间差别很大。 假设1:外存: Student:1000条,SC:10000条, 选修2号课程:50条 假设2:一个内存块装元组:10个Student, 或100个SC, 内存中一次可 以存放: 5块Student元组,1块SC元组和若干块连接结果元组 假设3:读写速度:20块/秒 假设4:连接方法:基于数据块的嵌套循环法 。 执行策略1 Q1 name (St

6、udent.Sno=SC.SnoSC.Cno=2 (StudentSC) 计算笛卡尔积StudentSC读取总块数= 读Student表块数 + 读SC表遍数*每遍块数=1000/10+(1000/(105) (10000/100)=100+20100=2100读数据时间=2100/20=105秒 中间结果大小 = 1000*10000 = 107 (1千万条元组) 写中间结果时间 = 10000000/10/20 = 50000秒 做选择运算 读数据时间 = 50000秒 做投影运算总时间 =1055000050000秒 = 100105秒= 27.8小时 执行策略2 2. 2 name(S

7、C.Cno= 2 (Student SC) 计算自然连接 读取总块数= 2100块 读数据时间=2100/20=105秒 中间结果大小=10000 (减少1000倍) 写中间结果时间=10000/10/20=50秒 执行选择运算 读数据时间=50秒 执行投影 总时间1055050秒205秒=3.4分 执行策略3 3. 2 Sname(StudentSC.Cno= 2 (SC) 读SC表总块数= 10000/100=100块读数据时间=100/20=5秒 中间结果大小=50条 不必写入外存 连接运算 读Student表总块数= 1000/10=100块 读数据时间=100/20=5秒 投影 总时

8、间55秒10秒 执行策略4 9. 2 name(Student SC.Cno=2 (SC) 假设SC表在Cno上有索引,Student表在Sno上有索引读SC表索引Cno=2的元组。 读SC表总块数= 50/1001块 读数据时间更小。 中间结果大小=50条 不必写入外存读Student表索引 读Student表总块数= 50/10=5块 读数据时间大大减少。 总时间10秒 9.3 代数优化代数优化 9.3.1 关系代数等价变换规则 关系代数表达式等价指用相同的关系代替两个表达式中相应的关系所得到的结果是相同的 两个关系表达式E1 和E2 是等价的,记为: E1E2常用的等价变化规则有: 1.

9、 连接、笛卡尔积交换律E1 E2 E2E1 E1 E2E2 E1 E1 F E2E2 F E1F为连接条件。 2. 连接、笛卡尔积的结合律(E1E2) E3 E1 (E2E3)(E1 E2) E3 E1 (E2 E3)(E1 E2) E3 E1 (E2 E3) F F F F 3. 投影的串接定律 A1,A2, ,An( B1,B2, ,Bm(E) A1,A2, ,An (E) 假设: 1) E是关系代数表达式 2) Ai(i=1,2,n), Bj(j=l,2,m)是属性名 3)A1, A2, , An构成Bl,B2,Bm的子集 9. 选择的串接定律F1 ( F2(E) F1 F2(E) 选择

10、的串接律说明 选择条件可以合并 这样一次就可检查全部条件。 5. 选择与投影的交换律 (1)假设: 选择条件F只涉及属性A1,AnF (A1,A2, ,An(E) A1,A2, ,An(F(E) (2)假设: F中有不属于A1, ,An的属性B1,Bm A1,A2, ,An ( F (E) A1,A2, ,An(F (A1,A2, ,An,B1,B2, ,Bm(E) 6. 选择与笛卡尔积的交换律 (1) 假设:F中涉及的属性都是E1中的属性F (E1E2)F (E1)E2 (2) 假设:F=F1F2,并且F1只涉及E1中的属性, F2只涉及E2中的属性则由上面的等价变换规则1,4,6可推出:F

11、(E1E2) F1(E1)F2 (E2) (3) 假设: F=F1F2,F1只涉及E1中的属性, F2涉及E1和E2两者的属性F(E1E2) F2(F1(E1)E2)它使部分选择在笛卡尔积前先做 7. 选择与并的交换 假设:E=E1E2,E1,E2有相同的属性名F(E1E2) F(E1) F(E2) 8. 选择与差运算的交换 假设:E1与E2有相同的属性名F(E1-E2) F(E1) - F(E2) 9. 投影与笛卡尔积的交换 假设:E1和E2是两个关系表达式,A1,An是E1的属性,B1,Bm是E2的属性 A1,A2, ,An,B1,B2, ,Bm (E1E2) A1,A2, ,An(E1)

12、 B1,B2, ,Bm(E2) l0. 投影与并的交换 假设:E1和E2 有相同的属性名 A1,A2, ,An(E1E2) A1,A2, ,An(E1) A1,A2, ,An(E2) 9.3.2 查询数的启发式优化 典型的启发式规则有: 1. 选择运算应尽可能先做 目的:减小中间关系 2. 在执行连接操作前对关系适当进行预处理(1)在连接属性上建立索引 (2)按连接属性排序Student SC 索引连接方法的步骤: (1)在SC上建Sno索引;(2)对Student中的每一元组,由Sno的值通过SC的索引查找SC的元组; (3)把这些SC的元组与Student的元组连接起来。 对Student

13、和SC表只扫描一遍。用排序合并方法的步骤: (1)先对Student表和SC表在Sno上排序; (2)取Student中的第1个Sno,依次扫描SC表中具有相同Sno的元组;把它们连接起来。 (3)当扫描到Sno不相同的第1个SC的元组时,返回Student表扫描它的下一个元组,再扫 描SC表中具有相同Sno的元组,把它们连接起来。直到Student表扫描完。 这样,Student表和SC表也只扫描一遍。 2.把投影运算和选择运算同时进行。可以避免重复扫描关系。 3. 把投影同其前或其后的双目运算结合起来,没有必为去掉某些字段而扫描一遍关系。4. 把某些选择同它前面要执行的笛卡尔积结合起来成为

14、一个连接运算。 例:Student.Sno=SC.Sno (StudentSC)Student SC连接特别是等值连接比笛卡尔积节省时间。 5. 找出公共子表达式重复出现的表达式,结果写到中间文件。 关系代数表达式的优化算法 算法:关系表达式的优化 输入:一个关系表达式的语法树。 输出:计算该表达式的程序。 方法: (1)分解选择运算利用规则4把形如F1 F2 Fn (E)变换为F1 (F2( (Fn(E) ) (2)通过交换选择运算,将其尽可能移到叶端对每一个选择,利用规则48尽可能把它移到树的叶端。 (3)通过交换投影运算,将其尽可能移到叶端 对每一个投影利用规则3,9,l0,5中的一般形式尽可能把它移向树的叶端。 (4)合并串接的选择和投影,以便能同时执行或在一次扫描中完成 利用规则3 5 把选择和投影的串接合并成单个选择、单个投影或一个选择后跟 一个投影。 使多个选择或投影能同时执行,或在一次扫描中全部完成 尽管这种变换似乎违背“ 投影尽可能早做” 的原则,但这样做效率更高。 (5)对内结点分组 把上述得到的语法树的内节点分组。 每一双目运算( , , ,-) 和它所有的直接祖先为一组

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号