数据结构课件查找－金锄头文库

资源描述

《数据结构课件查找》由会员分享，可在线阅读，更多相关《数据结构课件查找（93页珍藏版）》请在金锄头文库上搜索。

1、第九章查找由于查找运算的使用效率很高几乎在任意一个计算机系统软件和应用软件中都会涉及到所以当问题所涉及的数据量相当大时查找方法的效率就显得格外重要在一些实事查询系统中尤其如此因此本章将系统地讨论各种查找方法并通过对它们的效率分析来比较各种查找方法的优劣 Date1 第九章查找 9 1 静态查找表 9 2 动态查找表 9 3 哈希表 Date2 查找的基本概念查找又称为查询或检索是在一批记录中依照某个域的指定域值找出相应的记录的操作在计算机中被查找的数据对象是由同一类型的记录构成的集合可称之为查找表 search table 在实际应用问题中每个记录

2、一般包含有多个数据域查找是根据其中某一个指定的域进行的这个作为查找依据的域称为关键字 key Date3 对于给定的关键字的值如果在表中经过查找能找到相应的记录则称查找成功一般可输出该记录的有关信息或指示该记录在查找表中的位置若表中不存在相应的记录则称查找不成功此时应该给出不成功的信息查找算法中的基本运算是记录的关键字与给定值所进行的比较其执行时间通常取决于比较的次数因此通常以关键字与给定值进行比较的记录个数的平均值作为衡量查找算法好坏的依据 Date4 查找表操作及分类操作 1 查询某个特定的数据元素是否在查找表中 2 某个特定的数据元素的各种

3、属性 3 在查找表中插入一个数据元素 4 从查找表中删去某个数据元素分类若对查找表只作 1 和 2 两种操作则称此类查找表为静态查找表若在查找过程中同时插入查找表中不存在的数据元素或者从查找表中删除已存在的某个数据元素则称此类查找表为动态查找表 Date5 9 1 静态查找表抽象数据类型静态查找表的定义 ADT StaticSearchTable 数据对象D D是具有相同属性的数据元素的集合数据关系R 数据元素同属一个集合基本操作P Create Destroy Search ST key Traverse ST Visit ADT StaticSearchTable

4、Date6 一顺序查找顺序查找的基本思想是顺序查找的基本思想是从线性表的一端开始依次将扫描到得结点关键字和给定值K相比较若当前扫描到得结点关键字与K相等则查找成功若扫描结束后仍未找到关键字等于K的结点则查找失败顺序查找的存储结构要求顺序查找的存储结构要求顺序查找方法既适用于线性表的顺序存储结构也适用于线性表的链式存储结构使用单链表作为存储结构时扫描必须从第一个结点开始顺序查找对数据在表中存放的先后次序没有任何要求在表的组织方式中线性表是最简单的一种顺序查找是一种最简单的查找方式 Date7 顺序查找的线性表定义如下 typedef struct E

5、lemType elem int length 每个结点包含两部分内容 Key 和info 其他信息 Date8 2 算法的实现技巧把待查关键字key存入表头或表尾俗称哨兵这样可以加快执行速度例若将待查找的特定值key存入顺序表的首部如0号单元则顺序查找的实现方案为从后向前逐个比较 int Search Seq SSTable ST KeyType key 在顺序表ST中查找关键字与key相同的元素若成功返回其位置信息否则返回0 ST elem 0 key key 设立哨兵可免去查找过程中每一步都要检测是否查找完毕 0单元被当作监视哨用来判断表是否查找

6、完毕技巧当n 1000时查找时间将减少一半 for i ST length ST elem i key key i 不要用for i n i 0 i 或 for i 1 i0 i if ST elem i key key return i 使用了监视哨在查找过程中不用每一步都去判断是否查找结束 0单元被当作监视哨用来判断表是否查找完毕技巧当n 1000时查找时间将减少一半找到返回元素在线性表中的存储位置未找到返回0 Date10 查找效率怎样计算用平均查找长度ASL衡量讨论平均查找长度为确定记录在查找表中的位置需和给定值进行比较的关键字个数的

7、期望值称为查找算法在查找成功时的平均查找长度 Average Search Length Date11 平均查找长度 ASL average search length 其中 n是文件记录个数 Pi是查找第i个记录的查找概率通常取等概率即Pi 1 n Ci是找到第i个记录时所经历的比较次数统计意义上的数学期望值物理意义假设每一元素被查找的概率相同则查找每一元素所需的比较次数之总和再取平均即为ASL 显然 ASL值越小时间效率越高 Date12 讨论如何计算ASL 分析查找第1个元素所需的比较次数为1 查找第2个元素所需的比较次数为2 查找第n个元素所需的比较次数为n

8、总计全部比较次数为 1 2 n 1 n n 2 未考虑查找不成功的情况查找哨兵所需的比较次数为n 1 这是查找成功的情况若求某一个元素的平均查找次数还应当除以n 等概率即 ASL 1 n 2 时间效率为 O n Date13 u 如果查找不成功的情况不能忽略时 ASL的计算步骤查找成功的概率为1 2 那么查找成功时第i个记录的概率 pi 1 2n 所以查找成功时的ASL n i 1 n 1 n i 1 1 2n 4 1 1 2 查找不成功的概率为1 2 所以查找不成功时的ASL n 1 所以所以 ASLss 3 4 n 1 Date14 顺序查找算法分析顺序查找的优点是算法简单

9、适应面广且不要求表中数据有序缺点是平均查找长度较大特别是当n较大时查找效率较低不宜采用 Date15 二有序表的查找折半查找折半查找 Birary search 也称为二分查找它的查找速度比顺序查找快但它要求数据在线性表中数据在线性表中按查找的关键字域有序排列按查找的关键字域有序排列设n个数据存放于数组r中且已经过排序按由小到大递增的顺序排列采用二分查找首先用要查找的给定值k与表正中间元素的关键值相比较此元素的下标 Date16 比较结果有三种可能如果r m key k 说明如果存在欲查找的元素该元素一定在数组的前半部分查找范围缩小了一半

10、修改查找范围的的上界high m 1 继续对数组的前半部分进行二分查找如果r m key k 说明如果存在欲查找的元素该元素一定在数组的后半部分查找范围缩小了一半修改查找范围的的下界low m 1 继续对数组的后半部分进行二分查找如果r m key k 查找成功 m所指的记录就是查找到的数据 Date17 重复上述过程查找范围每次缩小1 2 当范围不断缩小出现查找范围的下界大于上界时则查找失败确定关键字为key的记录不存在二分查找是一种效率较高的算法最好的情况是第一次比较即找到所查元素即使一次比较没有找到也把进一步查找的范围缩小一半与此类似每比

11、较一次均使查找范围减半故最坏的情况所需比较次数为O log2n 对于较大的n显然较顺序查找速度快得多 Date18 查找23和79的过程如下图 mid low high 2不进位取整 08 14 23 37 46 55 68 79 91 08 14 23 37 46 55 68 79 91 low highmid 08 14 23 37 46 55 68 79 91 low high mid 1mid 08 14 23 37 46 55 68 79 91 low mid 1high mid 08 14 23 37 46 55 68 79 91 lowhigh mid 08 14 23 37

12、 46 55 68 79 91 lowhigh mid 08 14 23 37 46 55 68 79 91 low high mid Date19 折半查找的c语言算法程序 int Search Bin SSTable ST int n int key int low high mid low 1 high n while low high mid low high 2 if ST mid key key return mid 查找成功 else if key50n 50时可得近似结果时可得近似结果 ASLbs 2 n 1 1 Date22 二分查找的性能分析具体例子 11个元素查找

13、过程可用判定树描述查找成功时进行比较的关键字个数最多不超过树的深度 log2n 1 当n较大时平均查找长度为 ASLbs log2 n 1 1 6 3 1 9 4710 25811 Date23 三静态树表的查找 u 当有序表中各记录的查找概率相等时按照判定树描述的查找过程来进行折半查找性能最优有序表中各记录的查找概率不等时二分查找性能不一定最优 u 可由具体例子说明 u 静态最优查找树和次优查找树方法可解决这一问题 Date24 例如关键字 A B C D E ci 2 3 1 2 3 此时 ASL 2 0 2 3 0 3 1 0 05 2 0 3 3 0 15

14、 2 4 若改变ci的值 2 1 3 2 3 则 ASL 2 0 2 1 0 3 3 0 05 2 0 3 3 0 15 1 9 不是中间的比而是根据概率值得不同具体选择不是中间的比而是根据概率值得不同具体选择 C AD B 12345 pi 0 2 0 3 0 05 0 3 0 15 E Date25 在概率不等的情况下在概率不等的情况下如何能够使平均查找长度最小如何能够使平均查找长度最小查找概率大的查找路径要短判定树该如何设计判定树该如何设计 PH wihi n i 1 其中 wi cpi c为常量 pi为结点i的查找概率 hi为结点所在的层次称PH值最小的判定二叉树为

15、静态最优查找树这里只考虑查找成功的情况如果只考虑查找成功的情况则使查找性能达到最佳的判定树是其带全路径长度之和PH值取最小的二叉树 Date26 构建静态最优查找树的代价很高这里介绍一种构建静态最优查找树的代价很高这里介绍一种构造近似最有树的算法构造近似最有树的算法次优查找树次优查找树二次优查找树的构造二次优查找树的构造已知一个序列 rl rl 1 rh 递增有序其中 rl key rl 1 key data k return b Date38 二叉排序树查找递归算法 if kdata return search b left k else return sear

16、ch b right k Date39 非递归算法 btree treesearch btree b int k btree p p b while p NULL if p data k return p else if kdata p p left else p p right return NULL Date40 二叉排序树的插入二叉排序树是一种动态树表特点是树的结构不是一次生成而是在查找过程中当树中不存在关键字等于给定值的结点时再进行插入新插入的结点一定是一个新添加的叶子结点并且是查找不成功时查找路径上访问的最后一个结点的左孩子或右孩子结点 Date41 二叉排序树的插入续从空树出发经过一系列的查找插入操作之后可生成一棵二叉排序树设查找的关键字序列为 45 12 53 3 37 50 98 1 8 43 60 则生成的二叉排序树如下中序遍历二叉排序树可得到一个关键字的有序序列插入时不必移动结点 45 12 3 53 375098 843 1 60 Date42 二叉排序树的删除一般二叉树删除存在的问题如何在二叉排序树上删除结

展开阅读全文

数据结构课件查找

最新文档