高级数据库基础概念1

上传人:夏** 文档编号:530897137 上传时间:2023-11-23 格式:DOCX 页数:12 大小:81.97KB
返回 下载 相关 举报
高级数据库基础概念1_第1页
第1页 / 共12页
高级数据库基础概念1_第2页
第2页 / 共12页
高级数据库基础概念1_第3页
第3页 / 共12页
高级数据库基础概念1_第4页
第4页 / 共12页
高级数据库基础概念1_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《高级数据库基础概念1》由会员分享,可在线阅读,更多相关《高级数据库基础概念1(12页珍藏版)》请在金锄头文库上搜索。

1、Clustered index(聚集索引):搜索码的指定顺序与文件记录 的物理顺序一致的索引2. Prefetch(预取):用来存放系统已访问过的文件预读信息以 加快访问速度3. Matching Index Scan (匹配索引扫描):把许多谓词匹配到 单个索引的列分支以后检索来自于一个表的行4. Heterogeneous distributed database (异构分布式数据库): 不同的节点可以用不同的图表和不同的软件;a. 对于查询优化过程,不同的图表是主要问题;b. 对于事务过程,不同的软件是主要问题 在事务进程中节点彼此不知道只能提供有限的工具 处理目的:集成现有的已存在的数

2、据库,提供更强大的功能5. Data transparency (数据透明性):分布式数据库系统的用 户不必知晓有关数据库如何存储以及存储在哪里的细节程 度;它可分为:分片透明;复制透明;位置透明6.Speedup (速度比):通过增加并行度来在更短的时间里运 行一个给定的任务;speedup=小系统上执行一个任务的时间/ 大系统执行一个任务的时间7.Scaleup (扩展比):通过增加并行度来处理更大的任务; scaleup=小任务在小系统上执行的时间/大任务在大系统上执 行的时间8. Matching Predicates (匹配谓词): 必须是可索引的 当前索引中必须有若干个连续列可匹配

3、 索引扫描中非匹配谓词可以作为筛选谓词 Between,=,=,like这些基于范围的谓词, 他们是匹配的,但他们之后出现的就不是了 In-list它是,但它后面出现的就不是了8.How does DB2 Optimizer worker?DB2 OptimizerSQL STATEMENTS9. Properties of index (索引属性)Usually, an index is like a card catalog in a library. Each card(entry) has:(key-value, row-pointer )key-value is for lookup

4、, call row-pointer ROWIDROWID is enough to locate row on disk: one I/OEntries are placed in Alphabetical order by lookup key in B-tree usually.Also might be hashed.An index is a lot like memory resident structures youve seen for lookup: binary tree, 2-3-tree.index is disk resident. Like the data its

5、elf, often wont all fit in memory at once.lO.Parallel Database Architectures(并行数据库结构)并行数据库系统是由多个处理机、多个磁盘连接组成通过快 速连接和网状交互进行交互工作,分为粗粒度并行机和细粒 度并行机。 .Transaction Server Process Structure (事务服务进程结构) 一个典型的事务服务器由多个在共享内存中访问数据的 进程组成。 服务器进程:这样的进程接收用户的查询(关于事务 的),执行写并返回结果;进程可以是多线程的,允许一个 单一的进程去并发的执行几个客户的查询;服务器进程

6、是典 型的多T线性服务进程。 锁管理器进程 数据库写入进程:持续的输出已被修改的缓存块到磁 写日志进程:服务器进程把日志记录增加到日志记录 缓存中,日志写入进程输出日志记录到稳定的存储器中 检查点进程:执行周期性检查 进程监控进程:此进程监控其他进程,如发现有任何 进程故障,进行恢复操作12. Two Phase Commit Protocol(2PC) 假定采用fail-stop模型-故障场地简单的停止工作不 会导致任何其他坏处,如向其他场地发送不正确的消息之类 协议的执行是由协调者在到达事物的最后一步之后 开始的 协议涉及事务执行所位于的全部局部场地 分为两个阶段:投票阶段和决定阶段 令T

7、是在场地S上开始的一个事务,S.的事务协调者ii是C.i当场地S.恢复时,他检查日志以确定故障发生时激活事务i的命运若日志包含commit T记录:场地执行redo (T)若日志包含vabort T记录:场地执行undo (T)若日志包含vready T记录:场地必须咨询q以确定T的命运 若T提交,执行redo(T) 若T夭折,执行undo (T)若日志不包含任何涉及T的控制记录意味着S.在响1 应来自prepare T消息之前就出了故障 由于S.的故障导致了未响应,C.必须夭折了1 1 S.必须执行undo (T)113. What are differences between coars

8、e-grain(粗粒度)and fine-grain (细粒度)parallel machine?并行系统通过并行的使用多个CPU和磁盘来提高处理速度 和I/O速度 并行数据库系统通过一个快速的互联网络连接起来 的多个处理器和多个磁盘组成系统。 粗粒度的并行机由少量的高性能的处理器组成 细粒度的并行机使用数个更小的处理器14. Describe the criteria for naming of Data items in distributed database system(命名标准) 每个数据项必须有系统范围内的唯一的名字 应能高效的找到数据项的位置 应能透明的改变数据项的位置 每个场

9、地应能自主的创建新的数据项15. Describe the duty of transaction manager and transaction coordinator 事务管理器:用作维护一个用于恢复的日志;在节点 上,参与到整个事务系统中进行协调 事务协调器:在节点上开始执行事务;把子事务分发 到并发的节点上;在节点上开始协调每个事物的结束,结果 可能是所有节点上的事务被提交,也可能是被回滚16. What is Distributed Database System? 由松耦合节点组成,这些节点在物理成分上没有任何 共享; 运行在每个数据库上的节点彼此独立 既可以访问本地节点,又可以访

10、问其他节点17. What is Homogeneous distributed databases and Heterogeneous databases?同构分布式数据库: 所有的节点都有统一的软件或图表,数据可能分割在 不同的节点上 彼此知道且通过协商来完成要求 为了改变图表或软件每个节点交出了对本地资源自 治管理目的:提供一个单一的数据库,不让用户觉察到数据来自不同节点异构分布式数据库:a. 不同的节点可以用不同的图表和不同的软件b. 对于查询优化过程,不同的图表是主要的问题c. 对于事务过程,不同的软件是主要问题d. 在事务进程中,节点彼此不知道,只能提供有限工具 处理目的:集成现有

11、的已经存在的数据库,提供更强大的功 能18. Three types of Distributed Data Storage(三种分布式数据存 储方式) 复制:系统来维护多个备份,存放在不同的节点,目 的是快速恢复和错误容限 分片:把一个关系数据库拆成很多片分布在不同节点 上 混合:复制与分片混合技术:把关系拆成很多片,在不同的分片 上,系统维护一些复制品19. Commit Protocols (提交协议) 原子性a. 一个事务被多节点执行时,要么被所有节点全部提 交,要么被所有节点全部回滚b. 不可能接受一个事务在这个点上被提交,在另外一 个点上被回滚 2PC被广泛应用 3PC更复杂,昂贵

12、,但可以弥补2PC不足2O.What is 3PC ? 前提:a. 不会出现网络分割b. 在任何时间上,至少有一个节点正常工作c. 最多只能有K个节点出错 分为阶段:a. 投票阶段(与2PC相同)b. 预提交阶段:至少要有K个节点进行提交c. 提交阶段:向所有节点发布消息 好处:防止协调器发生故障坏处:a. 开销比较大b. 在现实中,前提不一定满足 3PC与2PC差别3PC把2PC的决定阶段分成为两个阶段21.Single Lock Manager Apporach 单一锁管理器方式 系统维护一个归属于单一特定(如Si)节点的单一锁 管理器 当一个事务需要锁一个数据项目时,它给Si传送 把锁,

13、且锁管理器决定锁是否被立即同意使用a. 如果是,锁管理器传送一个消息发起要求的节点b. 如果不是,要求则会被推迟,直到锁被启用,在这 段时间消息会传送给发起节点 事务可以从任何一个数据项目备份归属的节点来读 取数据项目 写操作必须在所有数据项目的备份上进行22. 处理数据项复制的几种可选的方法 主副本 多数协议 有偏协议 法定人数同意协议23. What is master-slave replication and Multimaster replication ?主从复制:更新操作在一个主节点进行,从节点可以不一致 多主操作:又叫到处更新,更新操作允许在从副本上进行, 而且自动在所有副本上

14、传播,即可立刻传播副本,又可延迟 传播副本24. High Availability and Robustress(高可用性和健壮性)高可用性:系统几乎在任何时间都可用健壮性:尽管数据库系统某些时刻会出现状况,但它具有数 据库可用这样的能力25. What is Bully Algorithm ?(威逼算法)如果节点S发出请求,但协调器在一定时间内无法应答,则认为协调器出错了,则S马上把自己当协调器。S.把选举信ii息发给每个带有更咼标识数字的节点,S.在T时间内等待i 若在T内无回应,就以为是比S,咼的节点都坏了,Si选自己为协调器 若在T内有回应,26. 谓词筛选(Predicate fi

15、lter):当DB2使用非匹配谓词的过滤因子时,在它存取任何数据行以前,它遍历了大量的索引的叶子层次,同时排出了不符合谓词的项。27. Parallel Database Architectures(并行数据库体系结构): 共享内存:处理器共享一个公共存储器 共享磁盘:处理器共享一个公共磁盘 不共享:既不共享内存也不共享磁盘 层次结构:上述三种体系结构的混合28. Differences between local and global transactions( 本地事务和全局事务的区别)本地事务是仅访问在发起事务的节点上的数据的事务全局事务具有需要访问发起事务的节点之外的某个节点上的数据或有几个不同节点上的数据的事务29. 分布式系统中可能产生的四种错误类型 节点故障 消息丢失 通信链路故障 网络分割30. 三种索引 B+树索引:最

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号