数据结构C描述查找ppt课件.ppt

资源描述

《数据结构C描述查找ppt课件.ppt》由会员分享，可在线阅读，更多相关《数据结构C描述查找ppt课件.ppt（68页珍藏版）》请在金锄头文库上搜索。

1、第8章查找数据结构 C 描述 1 目录 8 4 散列查找 8 3 树表查找 8 1 查找的基本概念 8 2 线性表的查找退出 2 8 1 查找的基本概念查找也称为检索在我们日常生活中随处可见查找的实例如查找某人的地址电话号码查某单位45岁以上职工等都属于查找范畴本书中我们规定查找是按关键字进行的所谓关键字 key 是数据元素或记录中某个数据项的值用它可以标识或识别一个数据元素例如描述一个考生的信息可以包含考号姓名性别年龄家庭住址电话号码成绩等关键字但有些关键字不能唯一标识一个数据元素而有的关键字可以唯一标识一个数据元素

2、如刚才的考生信息中姓名不能唯一标识一个数据元素因有同名同姓的人而考号可以唯一标识一个数据元素每个考生考号是唯一的不能相同我们将能唯一标识一个数据元素的关键字称为主关键字而其它关键字称为辅助关键字或从关键字 3 有了主关键字及关键字后我们可以给查找下一个完整的定义所谓查找就是根据给定的值在一个表中查找出其关键字等于给定值的数据元素若表中有这样的元素则称查找是成功的此时查找的信息为给定整个数据元素的输出或指出该元素在表中的位置若表中不存在这样的记录则称查找是不成功的或称查找失败并可给出相应的提示因为查找是对已存入计算机中的数据所进行的操作

3、所以采用何种查找方法首先取决于使用哪种数据结构来表示表即表中结点是按何种方式组织的为了提高查找速度我们经常使用某些特殊的数据结构来组织表因此在研究各种查找算法时我们首先必须弄清这些算法所要求的数据结构特别是存储结构查找有内查找和外查找之分若整个查找过程全部在内存进行则称这样的查找为内查找反之若在查找过程中还需要访问外存则称之为外查找我们仅介绍内查找 4 要衡量一种查找算法的优劣主要是看要找的值与关键字的比较次数但我们将找到给定值与关键字的比较次数的平均值来作为衡量一个查找算法好坏的标准对于一个含有n个元素的表查找成功时的平均查找长度可表

4、示为 ASL 其中 i为查找第i个元素的概率且 1 一般情形下我们认为查找每个元素的概率相等 i为查找第i个元素所用到的比较次数要衡量一种查找算法的优劣主要是看要找的值与关键字的比较次数但我们将找到给定值与关键字的比较次数的平均值来作为衡量一个查找算法好坏的标准对于一个含有n个元素的表查找成功时的平均查找长度可表示为 ASL 其中 i为查找第i个元素的概率且 1 一般情形下我们认为查找每个元素的概率相等 i为查找第i个元素所用到的比较次数 5 8 2 线性表的查找 8 2 1 顺序查找 1 顺序查找的基本思想顺序查找是一种最简单的查找方法它的基本思想是从表的一端

5、开始顺序扫描线性表依次将扫描到的结点关键字和待找的值相比较若相等则查找成功若整个表扫描完毕仍末找到关键字等于的元素则查找失败顺序查找既适用于顺序表也适用于链表若用顺序表查找可从前往后扫描也可从后往前扫描但若采用单链表则只能从前往后扫描另外顺序查找的表中元素可以是无序的下面以顺序表的形式来描述算法 6 2 顺序查找算法实现 const int n maxn n为表的最大长度 struct node elemtype key key为关键字类型设定为elemtype int seqsearch node R n 1 elemtype k 在表中

6、查找关键字值为的元素 R 0 key k int i n 从表尾开始向前扫描 while R i key k i return i 7 在函数seqsearch中若返回的值为表示查找不成功否则查找成功函数中查找的范围从 n 到为监视哨起两个作用其一是为了省去判定 while循环中下标越界的条件i 1 从而节省比较时间其二保存要找值的副本若查找时遇到它表示查找不成功若算法中不设立监视哨R 0 程序花费的时间将会增加这时的算法可写为下面形式 int seqsearch node R n 1 elemtype k int i n while R i key k

7、return i 当然上面算法也可以改成从表头向后扫描将监视哨设在右边这种方法请读者自己完成 8 3 顺序查找性能分析假设在每个位置查找的概率相等即有pi 1 n 由于查找是从后往前扫描则有每个位置的查找比较次数Cn 1 Cn 1 2 C1 n 于是查找成功的平均查找ASL 即它的时间复杂度为O n 这就是说查找成功的平均比较次数约为表长的一半若k值不在表中则必须进行n 1次比较之后才能确定查找失败另处从ASL可知当n较大时 ASL值较大查找的效率较低顺序查找的优点是算法简单对表结构无任何要求无论是用向量还是用链表来存放结点也无论结点之间是否按关键

8、字有序或无序它都同样适用顺序查找的缺点是查找效率低当n较大时不宜采用顺序查找而必须寻求更好的查找方法 9 8 2 2二分查找 1 二分查找的基本思想二分查找也称折半查找它是一种高效率的查找方法但二分查找有条件限制要求表必须用向量作存贮结构且表中元素必须按关键字有序升序或降序均可我们不妨假设表中元素为升序排列二分查找的基本思想是首先将待查值K与有序表R 1 到R n 的中点mid上的关键字R mid key进行比较若相等则查找成功否则若R mid key k 则在R 1 到R mid 1 中继续查找若有R mid key k 则在R mid 1

9、到R n 中继续查找每通过一次关键字的比较区间的长度就缩小一半区间的个数就增加一倍如此不断进行下去直到找到关键字为K的元素若当前的查找区间为空表示查找失败 10 从上述查找思想可知每进行一次关键字比较区间数目增加一倍故称为二分区间一分为二而区间长度缩小一半故也称为折半查找的范围缩小一半 2 二分查找算法实现 int binsearch node R n 1 elemtype k int low 1 high n while lowk high mid 1 在左子区间中查找 else low mid 1 在右子区间中查找 return 0 查找失败 11 例

10、如假设给定有序表中关键字为 8 17 25 44 68 77 98 100 115 125 将查找K 17和K 120 的情况描述为图8 1及图8 2形式 12 13 14 15 3 二分查找的性能分析为了分析二分查找的性能可以用二叉树来描述二分查找过程把当前查找区间的中点作为根结点左子区间和右子区间分别作为根的左子树和右子树左子区间和右子区间再按类似的方法由此得到的二叉树称为二分查找的判定树例如图8 1给定的关键字序列 8 17 25 44 68 77 98 100 115 125 的判定树见图8 3 16 从图8 3 可知查找根结点68 需一次查找查找17和

11、100 各需二次查找查找8 25 77 115各需三次查找查找44 98 125各需四次查找于是可以得到结论二叉树第K层结点的查找次数各为k次根结点为第1层而第k层结点数最多为2k 1个假设该二叉树的深度为h 则二分查找的成功的平均查找长度为假设每个结点的查找概率相等 ASL 1 n 1 n 1 2 2 3 22 h 2h 1 因此在最坏情形下上面的不等号将会成立并根据二叉树的性质最大的结点数n 2h 1 h log2 n 1 于是可以得到平均查找长度ASL n 1 n log2 n 1 1 该公式可以按如下方法推出 17 设s 20 2 21 3 2

12、2 h 1 2h 2 h 2h 1 则2s 21 2 22 h 2 2h 2 h 1 2h 1 h 2h s 2s s h 2h 20 21 22 2h 2 2h 1 h 2h 2h 1 log2 n 1 n 1 n 所以 ASL s n n 1 n log2 n 1 1 当n很大时 ASL log2 n 1 1 可以作为二分查找成功时的平均查找长度它的时间复杂度为O log2n 18 8 2 3 索引查找 1 索引查找的思想索引查找又称分级查找它既是一种查找方法又是一种存贮方法称为索引存贮它在我们的日常生活中有着广泛的应用例如在汉语字典中查找某个汉字时若知道某个汉字

13、读者则可以先在音节表中查找到对应正文中的页码然后再在正文中所对应的页中查出待查的汉字若知道该汉字的字形但不知道读者则可以先在部首表中根据字的部首查找到对应检字表中的页码再在检字表中根据字的笔画找到该汉字所在的页码在这里整个字典就是索引查找的对象字典的正文是字典的主要部分被称之为主表而检字表部首表和音节表都有是为了方便查找主表而建立的索引所以被称之为索引表 19 在索引查找中主表只有一个其中包含的是待查找的内容而索引表可以有多个包含一级索引二级索引所需的级数可根据具体问题而定如刚才的利用读音查找汉字为一级索引而利用字形查找汉字为二级

14、索引部首表检字表汉字在此我们仅讨论一级索引索引查找是在线性表主表的索引存贮结构上进行的而索引存贮的基本思想是首先将一个线性表主表按照一定的规则分成若干个逻辑上的子表并为每个子表分别建立一个索引项由所有这些索引项得到主表的一个索引表然后可采用顺序或链接的方法来存储索引表和各个子表索引表中的每个索引项通常包含三个域一是索引值域用来存储标识对应子表的索引值它相当于记录的关键字在索引表中由此索引值来唯一标识一个索引项子表二是子表的开始位置用来存储对应子表的第一个元素的存储位置三是子表的长度用来存储对应子表的元素个数 20 例如设有

15、一个学校部分教师档案表如表8 1所示设编号为主关键字则该表可以用一个线性表L a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 来表示其中ai 1 i n 表示第i位教师的信息包含有编号姓名部门职称而它的索引表可以按部门进行也可以按职称进行按部门的索引表中有4个子表分别为计算机系J a1 a2 a3 a4 电工系 D a5 a6 a7 管理系G a8 a9 成教部C a10 该4个子表示成一个索引表如表8 2所示 21 表8 1 教师档案表编号姓名部门职称 J001 赵一计算机系教授 J002 钱二计算机系讲师 J003 张三计算机

16、系副教授 J004 李四计算机系助教 D001 王五电工系讲师 D002 孙六电工系助教 D003 刘七电工系副教授 G001 朱八管理系教授 G002 杨九管理系讲师 C001 罗十成教部副教授表8 2 按部门的索引表 J 0 4 D 4 3 G 7 2 C 9 1 index start length 22 若按职称进行索引则得到的索引表中也有4个子表分别为 Jiaosou a1 a8 FuJiaosou a3 a7 a10 Jiangshi a2 a5 a9 Zhujiao a4 a6 这时的主表用顺序存贮不太方便因相同职称的教师没有连在一起故用链式存储得到主表较方便具体的存贮如图8 4所示在图8 4中箭头上面的数字表示该元素在主表中的下标位置指针每个子表中最后个元素的指针为 1 表示为空指针 23 于是可以得到如表8 3所示的职称索引表表8 3 按职称的索引表 index start length 教授 0 2 副教授 2 3 讲师 1 3 助教 3 2 24 从刚才的两种索引表中可以给出索引查找的基本思想如下

展开阅读全文

数据结构C描述 查找ppt课件.ppt

最新文档

数据结构C描述查找ppt课件.ppt