2022年2022年快速掌握数据结构

上传人:博****1 文档编号:567362578 上传时间:2024-07-20 格式:PDF 页数:35 大小:373KB
返回 下载 相关 举报
2022年2022年快速掌握数据结构_第1页
第1页 / 共35页
2022年2022年快速掌握数据结构_第2页
第2页 / 共35页
2022年2022年快速掌握数据结构_第3页
第3页 / 共35页
2022年2022年快速掌握数据结构_第4页
第4页 / 共35页
2022年2022年快速掌握数据结构_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《2022年2022年快速掌握数据结构》由会员分享,可在线阅读,更多相关《2022年2022年快速掌握数据结构(35页珍藏版)》请在金锄头文库上搜索。

1、快速掌握数据结构第一章概论站点式生活1. 数据:信息的载体, 能被计算机识别、存储和加工处理。2. 数据元素:数据的基本单位,可由若干个数据项组成,数据项是具有独立含义的最小标识单位。3. 数据结构:数据之间的相互关系,即数据的组织形式。站点式生活它包括: 1)数据的逻辑结构,从逻辑关系上描述数据,与数据存储无关,独立于计算机;2) 数据的存储结构,是逻辑结构用计算机语言的实现,依赖于计算机语言。3) 数据的运算, 定义在逻辑结构上, 每种逻辑结构都有一个运算集合。常用的运算: 检索/ 插入/ 删除 / 更新/ 排序。4. 数据的逻辑结构可以看作是从具体问题抽象出来的数学模型。数据的存储结构是

2、逻辑结构用计算机语言的实现。5. 数据类型:一个值的集合及在值上定义的一组操作的总称。分为:原子类型和结构类型。6. 抽象数据类型:抽象数据的组织和与之相关的操作。优点:将数据和操作封装在一起实现了信息隐藏。7. 抽象数据类型ADT :是在概念层上描述问题;类:是在实现层上描述问题;在应用层上操作对象( 类的实例 )解决问题。8. 数据的逻辑结构,简称为数据结构,有:站点式生活(1) 线性结构,若结构是非空集则仅有一个开始和终端结点,并且所有结点最多只有一个直接前趋和后继。(2) 非线性结构,一个结点可能有多个直接前趋和后继。9. 数据的存储结构有:1) 顺序存储,把逻辑相邻的结点存储在物理上

3、相邻的存储单元内。2) 链接存储,结点间的逻辑关系由附加指针字段表示。站点式生活3) 索引存储,存储结点信息的同时,建立附加索引表,有稠密索引和稀疏索引。4) 散列存储,按结点的关键字直接计算出存储地址。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 35 页 - - - - - - - - - 10. 评价算法的好坏是:算法是正确的;执行算法所耗的时间;执行算法的存储空间( 辅助存储空间 ) ;易于理解、编码、调试。11. 算法的时间复杂度T(n) :是该算法的时间耗费

4、,是求解问题规模n 的函数。记为O(n)。站点式生活时间复杂度按数量级递增排列依次为:常数阶O(1) 、对数阶 O(log2n) 、线性阶 O(n)、线性对数阶O(nlog2n) 、平方阶 O(n2) 、立方阶 O(n3) 、,k次方阶 O(nk) 、指数阶 O(2n) 。13. 算法的空间复杂度S(n) :是该算法的空间耗费,是求解问题规模n 的函数。12. 算法衡量:是用时间复杂度和空间复杂度来衡量的,它们合称算法的复杂度。13. 算法中语句的频度不仅与问题规模有关,还与输入实例中各元素的取值相关。第 二 章线 性 表1. 线性表:是由n(n0)个数据元素组成的有限序列。2. 线性表的基本

5、运算有:1)InitList(L),构造空表,即表的初始化;2)ListLength(L),求表的结点个数,即表长;3)GetNode(L,i),取表中第 i 个结点,要求1i ListLength(L); 站点式生活4)LocateNode(L,x)查找 L 中值为 x 的结点并返回结点在L 中的位置, 有多个 x 则返回首个, 没有则返回特殊值表示查找失败。5)InsertList(L,x,i)在表的第 i 个位置插入值为x 的新结点,要求1i ListLength(L)+1;6)DeleteList(L,i)删除表的第i 个位置的结点,要求1i ListLength(L);3. 顺序表:

6、把线性表的结点按逻辑次序存放在一组地址连续的存储单元里。4. 顺序表结点的存储地址计算公式:Loc(ai)=Loc(a1)+(i-1)*C;1i n 5. 顺序表上的基本运算站点式生活(1) 插入复制内容到剪贴板名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 35 页 - - - - - - - - - 代码 : void insertlist(seqlist *L,datatype x,int i) int j; if(iL-length+1) error( “posi

7、tion error”);if(L-length=listsize) error( “overflow ”);for(j=L-length-1;j=i-1;j-) L-dataj+1=L-dataj; 结点后移L-datai-1=x; L-length+; 在顺序表上插入要移动表的n/2 结点,算法的平均时间复杂度为O(n) 。(2) 删除复制内容到剪贴板代码 : void delete (seqlist *L,int i) int j; if(iL-length) error( “position error”);for(j=i;jlength-1;j+) L-dataj-1=L-dataj

8、; 结点前移L-length-; 在顺序表上删除要移动表的(n+1)/2结点,算法的平均时间复杂度为O(n)。6. 单链表:只有一个链域的链表称单链表。在结点中存储结点值和结点的后继结点的地址,data next data是数据域, next 是指针域。(1) 建立单链表。时间复杂度为O(n)。加头结点的优点:1) 链表第一个位置的操作无需特殊处理;2) 将空表和非空表的处理统一。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 35 页 - - - - - - - - -

9、 (2) 查找运算。时间复杂度为O(n) 。 站点式生活1) 按序号查找。复制内容到剪贴板代码 : Listnode * getnode(linklist head,int i) int j; listnode *p; p=head;j=0; while(p-next&jnext; 指针下移j+; if(i=j) return p; else return NULL; 2) 按值查找。复制内容到剪贴板代码 : Listnode * locatenode(linklist head ,datatype key) listnode *p=head-next; while(p&p-data!=key

10、) p=p-next; return p; (3) 插入运算。时间复杂度为O(n) 。复制内容到剪贴板代码 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 35 页 - - - - - - - - - Void insertlist(linklist head ,datatype x, int i) listnode *p; p=getnode(head,i-1); if(p=NULL); error( “position error”);s=(listnode *)

11、malloc(sizeof(listnode); s-data=x; s-next=p-next; p-next=s; (4) 删除运算。时间复杂度为O(n)。复制内容到剪贴板代码 : Void deletelist(linklist head ,int i) listnode *p ,*r; p=getnode(head ,i-1); if(p=NULL|p-next=NULL) error( “position error”);r=p-next; p-next=r-next; free(r); 7. 循环链表:是一种首尾相连的链表。特点是无需增加存储量,仅对表的链接方式修改使表的处理灵活方

12、便。8. 空循环链表仅由一个自成循环的头结点表示。站点式生活站点式生活9. 很多时候表的操作是在表的首尾位置上进行,此时头指针表示的单循环链表就显的不够方便,改用尾指针rear来表示单循环链表。用头指针表示的单循环链表查找开始结点的时间是O(1), 查找尾结点的时间是O(n) ;用尾指针表示的单循环链表查找开始结点和尾结点的时间都是O(1) 。10. 在结点中增加一个指针域,prior|data|next。形成的链表中有两条不同方向的链称为双链表。1) 双链表的前插操作。时间复杂度为O(1) 。复制内容到剪贴板代码 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - -

13、- - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 35 页 - - - - - - - - - Void dinsertbefore(dlistnode *p ,datatype x) dlistnode *s=malloc(sizeof(dlistnode); s-data=x; s-prior=p-prior; s-next=p; p-prior-next=s; p-prior=s; 2) 双链表的删除操作。时间复杂度为O(1) 。复制内容到剪贴板代码 : Void ddeletenode(dlistnode *p) p-prior-next

14、=p-next; p-next-prior=p-prior; free(p); 11. 顺序表和链表的比较1) 基于空间的考虑: 顺序表的存储空间是静态分配的,链表的存储空间是动态分配的。顺序表的存储密度比链表大。因此,在线性表长度变化不大,易于事先确定时,宜采用顺序表作为存储结构。站点式生活2) 基于时间的考虑:顺序表是随机存取结构,若线性表的操作主要是查找,很少有插入、删除操作时, 宜用顺序表结构。对频繁进行插入、删除操作的线性表宜采用链表。若操作主要发生在表的首尾时采用尾指针表示的单循环链表。12. 存储密度 =( 结点数据本身所占的存储量)/( 整个结点结构所占的存储总量) 存储密度:

15、顺序表=1,链表 top=-1; 2) 判栈空。复制内容到剪贴板代码 : int stackempty(seqstack *s) return s-top=-1; 3) 判栈满。复制内容到剪贴板代码 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 35 页 - - - - - - - - - int stackfull(seqstack *s) return s-top=stacksize-1; 4) 进栈。复制内容到剪贴板代码 : Void push(seqstac

16、k *s,datatype x) if(stackfull(s) error( “stack overflow”);s-data+s-top=x; 5) 退栈。复制内容到剪贴板代码 : Datatype pop(seqstack *s) if(stackempty(s) error( “stack underflow”);return S-datas-top-; 6) 取栈顶元素。复制内容到剪贴板代码 : Dtatatype stacktop(seqstack *s) if(stackempty(s) error( “stack underflow”);return S-datas-top;

17、6. 链栈:栈的链式存储结构称链栈。栈顶指针是链表的头指针。7. 链栈上的基本运算:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 35 页 - - - - - - - - - 1) 建栈。复制内容到剪贴板代码 : Void initstack(linkstack *s) s-top=NULL; 2) 判栈空。复制内容到剪贴板代码 : Int stackempty (linkstack *s) return s-top=NULL; 3) 进栈。复制内容到剪贴板代码 : V

18、oid push(linkstack *s,datatype x) stacknode *p=(stacknode *)malloc(sizeof(stacknode); p-data=x; p-next=s-top; s-top=p; 4) 退栈。复制内容到剪贴板代码 : Datatype pop(linksatck *s) datatype x; stacknode *p=s-top; if(stackempty(s) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共

19、35 页 - - - - - - - - - error( “stack underflow”);x=p-data; s-top=p-next; free(p); return x; 5) 取栈顶元素。复制内容到剪贴板代码 : Datatype stacktop(linkstack *s) if(stackempty(s) error( “stack is empty”);return s-top-data; 8. 队列是一种运算受限的线性表,允许删除的一端称队首,允许插入的一端称队尾。队列又称为先进先出线性表,FIFO 表。9. 队列的基本运算:1) initqueue(q),置空队;2)

20、queueempty(q),判队空;3) queuefull(q),判队满;4) enqueue(q,x),入队;5) dequeue(q),出队;6) queuefront(q),返回队头元素。 站点式生活10. 顺序队列: 队列的顺序存储结构称顺序队列。设置 front和 rear 指针表示队头和队尾元素在向量空间的位置。11. 顺序队列中存在“假上溢”现象,由于入队和出队操作使头尾指针只增不减导致被删元素的空间无法利用,队尾指针超过向量空间的上界而不能入队。12. 为克服 “假上溢”现象,将向量空间想象为首尾相连的循环向量,存储在其中的队列称循环队列。i=(i+1)%queuesize

21、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 35 页 - - - - - - - - - 13. 循环队列的边界条件处理:由于无法用front=rear来判断队列的“空”和“满”。解决的方法有:1) 另设一个布尔变量以区别队列的空和满;2) 少用一个元素,在入队前测试rear 在循环意义下加1 是否等于 front;3) 使用一个记数器记录元素总数。14. 循环队列的基本运算:站点式生活1) 置队空。复制内容到剪贴板代码 : Void initqueue(cirqu

22、eue *q) q-front=q-rear=0; q-count=0; 2) 判队空。复制内容到剪贴板代码 : Int queueempty(cirqueue *q) return q-count=0; 3) 判队满。复制内容到剪贴板代码 : Int queuefull(cirqueue *q) return q-count=queuesize; 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 35 页 - - - - - - - - - 4) 入队。复制内容到剪贴板

23、代码 : Void enqueue(cirqueue *q ,datatype x) if(queuefull(q) error( “queue overfolw ”);q-count+; q-dataq-rear=x; q-rear=(q-rear+1)%queuesize; 5) 出队。复制内容到剪贴板代码 : Datatype dequeue(cirqueue *q) datatype temp; if(queueempty(q) error( “queue underflow ”);temp=q-dataq-front; q-count-; q-front=(q-front+1)%qu

24、euesize; return temp; 6) 取队头元素。复制内容到剪贴板代码 : Datatype queuefront(cirqueue *q) if(queueempty(q) error( “queue is empty ”);return q-dataq-front; 15. 链队列:队列的链式存储结构称链队列,链队列由一个头指针和一个尾指针唯一确定。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 35 页 - - - - - - - - - 16. 链队

25、列的基本运算:1) 建空队。复制内容到剪贴板代码 : Void initqueue(linkqueue *q) q-front=q-rear=NULL; 2) 判队空。复制内容到剪贴板代码 : Int queueempty(linkqueue *q) return q-front=NULL&q-rear=NULL; 3) 入队。复制内容到剪贴板代码 : Void enqueue(linkqueue *q,datatype x) queuenode *p=(queuenode *)malloc(sizeof(queuenode); p-data=x; p-next=NULL; if(queuee

26、mpty(q) q-front=q-rear=p; else q-rear-next=p; q-rear=p; 4) 出队。复制内容到剪贴板代码 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 35 页 - - - - - - - - - Datatype dequeue(linkqueue *q) datatype x; queuenode *p; if(queueempty(q) error( “queue is underflow”);p=q-front; x

27、=p-data; q-front=p-next; if(q-rear=p) q-rear=NULL; free(p); return x; 5) 取队头元素。复制内容到剪贴板代码 : Datatype queuefront(linkqueue *q) if(queueempty(q) error( “queue is empty ”);return q-front-data; 第 四 章串1. 串:是由零个或多个字符组成的有限序列;包含字符的个数称串的长度;2. 空串:长度为零的串称空串;空白串:由一个或多个空格组成的串称空白串;子串:串中任意个连续字符组成的子序列称该串的子串;主串:包含子串

28、的串称主串;子串的首字符在主串中首次出现的位置定义为子串在主串中的位置;3. 空串是任意串的子串;任意串是自身的子串;串常量在程序中只能引用但不能改变其值;串变量取值可以改变;站点式生活4. 串的基本运算1) int strlen(char *s);求串长。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 35 页 - - - - - - - - - 2) char *strcpy(char * to,char * from);串复制。3) char *strcat(ch

29、ar * to,char * from);串联接。4) int strcmp(char *s1,char *s2);串比较。5) char *strchr(char *s,char c);字符定位。5. 串的存储结构: 站点式生活(1) 串的顺序存储:串的顺序存储结构称顺序串。按存储分配不同分为:1) 静态存储分配的顺序串:直接用定长的字符数组定义,以“0”表示串值终结。复制内容到剪贴板代码 : #define maxstrsize 256 typedef char seqstringmaxstrsize; seqstring s;不设终结符,用串长表示。复制内容到剪贴板代码 : Typede

30、f struct Char chmaxstrsize; Int length; seqstring;以上方式的缺点是:串值空间大小是静态的,难以适应插入、链接等操作。2) 动态存储分配的顺序串:简单定义: typedef char * string; 复杂定义: typedef struct 复制内容到剪贴板名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 35 页 - - - - - - - - - 代码 : char *ch; int length; hstring;

31、(2) 串的链式存储:串的链式存储结构称链串。链串由头指针唯一确定。类型定义:复制内容到剪贴板代码 : typedef struct node char data; struct node *next; linkstrnode; typedef linkstrnode *linkstring; linkstring s;将结点数据域存放的字符个数定义为结点的大小。结点大小不为1 的链串类型定义:复制内容到剪贴板代码 : #define nodesize 80 typedef struct node char datanodesize; struct node * next; linkstrno

32、de;6. 串运算的实现(1) 顺序串上的子串定位运算。站点式生活1) 子串定位运算又称串的模式匹配或串匹配。主串称目标串;子串称模式串。站点式生活2) 朴素的串匹配算法。时间复杂度为O(n2) 。比较的字符总次数为(n-m+1)m。复制内容到剪贴板代码 : Int naivestrmatch(seqstring t,seqstring p) int i,j,k; int m=p.length; 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 35 页 - - - -

33、- - - - - int n=t.length; for(i=0;i=n-m;i+) j=0;k=i; while(jdata=p-data) t=t-next; p=p-next; else shift=shift-next; t=shift; p=P; if(p=NULL) return shift; else return NULL; 第 五 章多 维 数 组 和 广 义 表1. 多维数组:一般用顺序存储的方式表示数组。2. 常用方式有: 1) 行优先顺序,将数组元素按行向量排列;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - -

34、- - 名师精心整理 - - - - - - - 第 17 页,共 35 页 - - - - - - - - - 2) 列优先顺序,将数组元素按列向量排列。站点式生活3. 计算地址的函数:LOC(Aij)=LOC(Ac1c2)+(i-c1)*(d2-c2+1)+j-c2)*d 4. 矩阵的压缩存储:为多个非零元素分配一个存储空间;对零元素不分配存储空间。(1) 对称矩阵:在一个n 阶的方阵 A 中,元素满足Aij=Aji 0=i,j(k-1)/2 以行优先顺序存放的Aij与 SAk 的关系: k=2i+j; 5. 稀疏矩阵:当矩阵A中有非零元素S 个,且 S 远小于元素总数时,称为稀疏矩阵。对

35、其压缩的方法有顺序存储和链式存储。站点式生活(1) 三元组表: 将表示稀疏矩阵的非零元素的三元组( 行号、列号、值) 按行或列优先的顺序排列得到的一个结点均是三元组的线性表,将该表的线性存储结构称为三元组表。其类型定义:复制内容到剪贴板名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 18 页,共 35 页 - - - - - - - - - 代码 : #define maxsize 10000 typedef int datatype; typedef struct int i,j;

36、 datatype v; trituplenode; typedef struct trituplenode datamaxsize; int m,n,t; tritupletable;(2) 带行表的三元组表:在按行优先存储的三元组表中加入一个行表记录每行的非零元素在三元组表中的起始位置。类型定义:复制内容到剪贴板代码 : #define maxrow 100 typedef struct tritulpenode datamaxsize; int rowtabmaxrow; int m, n, t; rtritulpetable;6. 广义表:是线性表的推广,广义表是n 个元素的有限序列,

37、元素可以是原子或一个广义表,记为LS。7. 若元素是广义表称它为LS的子表。若广义表非空,则第一个元素称表头,其余元素称表尾。8. 表的深度是指表展开后所含括号的层数。9. 把与树对应的广义表称为纯表,它限制了表中成分的共享和递归;10. 允许结点共享的表称为再入表;11. 允许递归的表称为递归表;12. 相互关系:线性表纯表再入表递归表;13. 广义表的特殊运算:1)取表头 head(LS) ;2) 取表尾 tail(LS); 第 六 章树站点式生活名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - -

38、- - - 第 19 页,共 35 页 - - - - - - - - - 1. 树:是 n 个结点的有限集T,T 为空时称空树,否则满足:1) 有且仅有一个特定的称为根的结点;站点式生活2) 其余结点可分为m个互不相交的子集,每个子集本身是一棵树,并称为根的子树。2. 树的表示方法: 1) 树形表示法; 2) 嵌套集合表示法;3) 凹入表表示法; 4) 广义表表示法;3. 一个结点拥有的子树数称为该结点的度;一棵树的度是指树中结点最大的度数。4. 度为零的结点称叶子或终端结点;度不为零的结点称分支结点或非终端结点5. 根结点称开始结点,根结点外的分支结点称内部结点;6. 树中某结点的子树根称

39、该结点的孩子;该结点称为孩子的双亲;7. 树中存在一个结点序列K1,K2,,Kn,使Ki 为 Ki+1 的双亲,则称该结点序列为K1到 Kn 的路径或道路;8. 树中结点 K到 Ks 间存在一条路径,则称K是 Ks 的祖先, Ks 是 K 的子孙;9. 结点的层数从根算起,若根的层数为1,则其余结点层数是其双亲结点层数加1;双亲在同一层的结点互为堂兄弟;树中结点最大层数称为树的高度或深度;10. 树中每个结点的各个子树从左到右有次序的称有序树,否则称无序树;11. 森林是 m棵互不相交的树的集合。12. 二叉树: 是 n 个结点的有限集,它或为空集, 或由一个根结点及两棵互不相交的、分别称为该

40、根的左子树和右子树的二叉树组成。13. 二叉树不是树的特殊情况,这是两种不同的数据结构;它与无序树和度为2 的有序树不同。14. 二叉树的性质:1) 二叉树第 i 层上的结点数最多为2(i-1);2) 深度为 k 的二叉树至多有2k-1 个结点; 站点式生活3) 在任意二叉树中,叶子数为n0,度为 2 的结点数为n2,则 n0=n2+1;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 20 页,共 35 页 - - - - - - - - - 15. 满二叉树是一棵深度为k 的且有

41、2k-1 个结点的二叉树;16. 完全二叉树是至多在最下两层上结点的度数可以小于2,并且最下层的结点集中在该层最左的位置的二叉树;17. 具有 N 个结点的完全二叉树的深度为log2N 取整加 1;18. 二叉树的存储结构站点式生活(1) 顺序存储结构: 把一棵有 n 个结点的完全二叉树,从树根起自上而下、 从左到右对所有结点编号,然后依次存储在一个向量b0n 中,b1n 存放结点, b0 存放结点总数。各个结点编号间的关系:1) i=1是根结点; i1 则双亲结点是i/2取整;2) 左孩子是 2i, 右孩子是 2i+1 ;( 要小于 n) 3) i(n/2取整 ) 的结点是叶子;4) 奇数没

42、有右兄弟,左兄弟是i-1 ;5) 偶数没有左兄弟,右兄弟是i+1 ;(2) 链式存储结构结点的结构为:lchild|data|rchild ;相应的类型说明:复制内容到剪贴板代码 : typedef char data; typedef struct node datatype data; structnode *lchild , *rchild; bintnode; typedef bintnode * bintree;19. 在二叉树中所有类型为bintnode的结点和一个指向开始结点的bintree类型的头指针构成二叉树的链式存储结构称二叉链表。20. 二叉链表由根指针唯一确定。在n 个

43、结点的二叉链表中有2n 个指针域,其中n+1 个为空。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 21 页,共 35 页 - - - - - - - - - 21. 二叉树的遍历方式有:前序遍历、中序遍历、后序遍历。时间复杂度为O(n) 。22. 线索二叉树: 利用二叉链表中的n+1 个空指针域存放指向某种遍历次序下的前趋和后继结点的指针,这种指针称线索。加线索的二叉链表称线索链表。相应二叉树称线索二叉树。23. 线索链表结点结构:lchild|ltag|data|rtag|rc

44、hild;ltag=0,lchild是指向左孩子的指针;ltag=1,lchild是指向前趋的线索;rtag=0,rchild是指向右孩子的指针;rtag=1,rchild是指向后继的线索;站点式生活24. 查找 *p 在指定次序下的前趋和后继结点。算法的时间复杂度为O(h) 。线索对查找前序前趋和后序后继帮助不大。25. 遍历线索二叉树。时间复杂度为O(n) 。26. 树、森林与二叉树的转换站点式生活(1) 树、森林与二叉树的转换1) 树与二叉树的转换:1 所有兄弟间连线;2 保留与长子的连线,去除其它连线。该二叉树的根结点的右子树必为空。2) 森林与二叉树的转换:1将所有树转换成二叉树;2

45、 将所有树根连线。(2) 二叉树与树、森林的转换。是以上的逆过程。27. 树的存储结构(1) 双亲链表表示法:为每个结点设置一个parent 指针,就可唯一表示任何一棵树。Data|parent (2) 孩子链表表示法:为每个结点设置一个firstchild指针,指向孩子链表头指针,链表中存放孩子结点序号。Data|firstchild。(3 双亲孩子链表表示法:将以上方法结合。Data|parent|firstchild (4) 孩子兄弟链表表示法:附加两个指向左孩子和右兄弟的指针。Leftmostchild|data|rightsibling 28. 树和森林的遍历:前序遍历一棵树等价于前

46、序遍历对应二叉树;后序遍历等价于中序遍历对应二叉树。29. 最优二叉树 ( 哈夫曼树 ):树的路径长度是从树根到每一结点的路径长度之和。将树中的结点赋予实数称为结点的权。30. 结点的带权路径是该结点的路径长度与权的乘积。树的带权路径长度又称树的代价,是所有叶子的带权路径长名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 22 页,共 35 页 - - - - - - - - - 度之和。31. 带权路径长度最小的二叉树称最优二叉树( 哈夫曼树 ) 。站点式生活32. 具有 2n-1

47、个结点其中有n 个叶子,并且没有度为1 的分支结点的树称为严格二叉树。33. 哈夫曼编码站点式生活34. 对字符集编码时,要求字符集中任一字符的编码都不是其它字符的编码前缀,这种编码称前缀码。35. 字符出现频度与码长乘积之和称文件总长;字符出现概率与码长乘积之和称平均码长;36. 使文件总长或平均码长最小的前缀码称最优前缀码37. 利用哈夫曼树求最优前缀码,左为0,右为 1。编码平均码长最小;没有叶子是其它叶子的祖先,不可能出现重复前缀。第 七 章图1. 图:图 G是由顶点集V 和边集 E 组成,顶点集是有穷非空集,边集是有穷集;站点式生活2.G 中每条边都有方向称有向图;有向边称弧; 边的

48、始点称弧尾;边的终点称弧头; G中每条边都没有方向的称无向图。3. 顶点 n 与边数 e 的关系:无向图的边数e 介于 0n(n-1)/2之间,有 n(n-1)/2条边的称无向完全图;有向图的边数 e 介于 0n(n-1) 之间,有 n(n-1) 条边的称有向完全图;4. 无向图中顶点的度是关联与顶点的边数;有向图中顶点的度是入度与出度的和。所有图均满足:所有顶点的度数和的一半为边数。5. 图 G(V,E),如 V是 V的子集, E是E 的子集,且 E中关联的顶点均在V中,则 G (V,E)是G的子图。6. 在有向图中,从顶点出发都有路径到达其它顶点的图称有根图;7. 在无向图中,任意两个顶点

49、都有路径连通称连通图;极大连通子图称连通分量;8. 在有向图中,任意顺序两个顶点都有路径连通称强连通图;极大连通子图称强连通分量;9. 将图中每条边赋上权,则称带权图为网络。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 23 页,共 35 页 - - - - - - - - - 10. 图的存储结构: 站点式生活(1) 邻接矩阵表示法:邻接矩阵是表示顶点间相邻关系的矩阵。n 个顶点就是n 阶方阵。无向图是对称矩阵;有向图行是出度,列是入度。(2) 邻接表表示法: 对图中所有顶点,

50、把与该顶点相邻接的顶点组成一个单链表,称为邻接表, adjvex|next,如要保存顶点信息加入data ;对所有顶点设立头结点,vertex|firstedge,并顺序存储在一个向量中;vertex保存顶点信息, firstedge保存邻接表头指针。11. 邻接矩阵表示法与邻接表表示法的比较:1) 邻接矩阵是唯一的,邻接表不唯一;2) 存储稀疏图用邻接表,存储稠密图用邻接矩阵;站点式生活3) 求无向图顶点的度都容易,求有向图顶点的度邻接矩阵较方便;4) 判断是否是图中的边,邻接矩阵容易,邻接表最坏时间为O(n) ;5) 求边数 e,邻接矩阵耗时为O(n2) ,与 e 无关,邻接表的耗时为O(

51、e+n) ;12. 图的遍历:(1) 图的深度优先遍历:类似与树的前序遍历。按访问顶点次序得到的序列称DFS序列。对邻接表表示的图深度遍历称DFS ,时间复杂度为O(n+e); 对邻接矩阵表示的图深度遍历称DFSM ,时间复杂度为O(n2); (2) 图的广度优先遍历:类似与树的层次遍历。按访问顶点次序得到的序列称BFS序列。对邻接表表示的图广度遍历称BFS ,时间复杂度为O(n+e); 对邻接矩阵表示的图广度遍历称BFSM ,时间复杂度为O(n2); 13. 将没有回路的连通图定义为树称自由树。14. 生成树:连通图G的一个子图若是一棵包含G中所有顶点的树,该子图称生成树。有 DFS生成树和

52、 BFS生成树, BFS生成树的高度最小。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 24 页,共 35 页 - - - - - - - - - 非连通图生成的是森林。15. 最小生成树:将权最小的生成树称最小生成树。( 是无向图的算法) (1) 普里姆算法:1) 确定顶点 S、初始化候选边集T0n-2 ;formvex|tovex|lenght 2) 选权值最小的T(i) 与第 1 条记录交换;3) 从 T1 中将 tovex 取出替换以下记录的fromvex 计算权;若权小则

53、替换,否则不变;4) 选权值最小的T(i) 与第 2 条记录交换;5) 从 T2 中将 tovex 取出替换以下记录的fromvex 计算权;若权小则替换,否则不变;6) 重复 n-1 次。初始化时间是O(n), 选轻边的循环执行n-1-k 次,调整轻边的循环执行n-2-k ;算法的时间复杂度为O(n2) ,适合于稠密图。(2) 克鲁斯卡尔算法:1) 初始化确定顶点集和空边集;对原边集按权值递增顺序排序;2) 取第 1 条边,判断边的2 个顶点是不同的树,加入空边集,否则删除;3) 重复 e 次。站点式生活对边的排序时间是O(elog2e) ;初始化时间为O(n) ;执行时间是O(log2e)

54、 ;算法的时间复杂度为O(elog2e) ,适合于稀疏图。16. 路径的开始顶点称源点,路径的最后一个顶点称终点;站点式生活17. 单源最短路径问题:已知有向带权图,求从某个源点出发到其余各个顶点的最短路径;18. 单目标最短路径问题:将图中每条边反向,转换为单源最短路径问题;19. 单顶点对间最短路径问题:以分别对不同顶点转换为单源最短路径问题;20. 所有顶点对间最短路径问题:分别对图中不同顶点对转换为单源最短路径问题;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 25 页,共

55、 35 页 - - - - - - - - - 21. 迪杰斯特拉算法:1) 初始化顶点集S(i),路径权集 D(i),前趋集 P(i) ;2) 设置 Ss 为真, Ds 为 0;3) 选取 D(i) 最小的顶点加入顶点集;4) 计算非顶点集中顶点的路径权集;5) 重复 3)n-1 次。算法的时间复杂度为O(n2) 。22. 拓扑排序: 对一个有向无环图进行拓扑排序,是将图中所有顶点排成一个线性序列,满足弧尾在弧头之前。这样的线性序列称拓扑序列。(1) 无前趋的顶点优先:总是选择入度为0 的结点输出并删除该顶点的所有边。设置各个顶点入度时间是O(n+e) ,设置栈或队列的时间是O(n) ,算法

56、时间复杂度为O(n+e)。(2) 无后继的顶点优先:总是选择出度为0 的结点输出并删除该顶点的所有边。设置各个顶点出度时间是O(n+e) ,设置栈或队列的时间是O(n) ,算法时间复杂度为O(n+e)。求得的是逆拓扑序列。站点式生活第 八 章排 序1. 文件:由一组记录组成,记录有若干数据项组成,唯一标识记录的数据项称关键字;2. 排序是将文件按关键字的递增( 减) 顺序排列; 站点式生活3. 排序文件中有相同的关键字时,若排序后相对次序保持不变的称稳定排序,否则称不稳定排序;4. 在排序过程中,文件放在内存中处理不涉及数据的内、外存交换的称内排序,反之称外排序;5. 排序算法的基本操作:1)

57、比较关键字的大小;2) 改变指向记录的指针或移动记录本身。6. 评价排序方法的标准:1) 执行时间; 2) 所需辅助空间, 辅助空间为 O(1) 称就地排序; 另要注意算法的复杂程度。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 26 页,共 35 页 - - - - - - - - - 7. 若关键字类型没有比较运算符,可事先定义宏或函数表示比较运算。8. 插入排序(1) 直接插入排序算法中引入监视哨R0 的作用是: 1) 保存 R(i) 的副本; 2)简化边界条件,防止循环下标

58、越界。关键字比较次数最大为(n+2)(n-1)/2;记录移动次数最大为(n+4)(n-1)/2;算法的最好时间是O(n) ;最坏时间是O(n2) ;平均时间是O(n2) ;是一种就地的稳定的排序;(2) 希尔排序 站点式生活实现过程:是将直接插入排序的间隔变为d。d 的取值要注意:1) 最后一次必为1;2) 避免 d 值互为倍数;关键字比较次数最大为n1.25 ;记录移动次数最大为1.6n1.25 ;算法的平均时间是O(n1.25) ;是一种就地的不稳定的排序;9. 交换排序 站点式生活(1) 冒泡排序实现过程:从下到上相邻两个比较,按小在上原则扫描一次,确定最小值,重复n-1 次。关键字比较

59、次数最小为n-1 、最大为 n(n-1)/2;记录移动次数最小为0,最大为 3n(n-1)/2;算法的最好时间是O(n) ;最坏时间是O(n2) ;平均时间是O(n2) ;是一种就地的稳定的排序;(2) 快速排序实现过程:将第一个值作为基准,设置i,j指针交替从两头与基准比较,有交换后, 交换 j ,i 。i=j时确定基准,并以其为界限将序列分为两段。重复以上步骤。关键字比较次数最好为nlog2n+nC(1) 、最坏为 n(n-1)/2;站点式生活算法的最好时间是O(nlog2n) ;最坏时间是O(n2) ;平均时间是O(nlog2n) ;辅助空间为O(log2n) ;是一种不稳定排序;名师资

60、料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 27 页,共 35 页 - - - - - - - - - 10. 选择排序(1) 直接选择排序实现过程:选择序列中最小的插入第一位,在剩余的序列中重复上一步,共重复n-1 次。关键字比较次数为n(n-1)/2;记录移动次数最小为0,最大为 3(n-1) ;算法的最好时间是O(n2) ;最坏时间是O(n2) ;平均时间是O(n2) ;是一种就地的不稳定的排序;(2) 堆排序实现过程:把序列按层次填入完全二叉树,调整位置使双亲大于或小于孩子,建

61、立初始大根或小根堆,调整树根与最后一个叶子的位置,排除该叶子重新调整位置。算法的最好时间是O(nlog2n) ;最坏时间是O(nlog2n) ;平均时间是O(nlog2n) ;是一种就地的不稳定排序;11. 归并排序站点式生活实现过程:将初始序列分为2 个一组,最后单数轮空,对每一组排序后作为一个单元,对2 个单元排序,直到结束。站点式生活算法的最好时间是O(nlog2n) ;最坏时间是O(nlog2n) ;平均时间是O(nlog2n) ;辅助空间为O(n);是一种稳定排序;12. 分配排序(1) 箱排序实现过程:按关键字的取值范围确定箱子的个数,将序列按关键字放入箱中,输出非空箱的关键字。在

62、桶内分配和收集,及对各桶进行插入排序的时间为O(n), 算法的期望时间是O(n), 最坏时间是O(n2) 。(2) 基数排序实现过程:按基数设置箱子,对关键字从低位到高位依次进行箱排序。算法的最好时间是O(d*n+d*rd);最坏时间是O(d*n+d*rd);平均时间是O(d*n+d*rd) ;辅助空间O(n+rd) ;是一种稳定排序;13. 各种内部排序方法的比较和选择:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 28 页,共 35 页 - - - - - - - - - (1

63、) 按平均时间复杂度分为:站点式生活1) 平方阶排序:直接插入、直接选择、冒泡排序;2) 线性对数阶:快速排序、堆排序、归并排序;3) 指数阶:希尔排序;4) 线性阶:箱排序、基数排序。(2) 选择合适排序方法的因素:1) 待排序的记录数;2) 记录的大小; 3) 关键字的结构和初始状态;4) 对稳定性的要求;5) 语言工具的条件;6) 存储结构; 7)时间和辅助空间复杂度。站点式生活(3) 结论:1) 若规模较小可采用直接插入或直接选择排序;2) 若文件初始状态基本有序可采用直接插入、冒泡或随机快速排序;3) 若规模较大可采用快速排序、堆排序或归并排序;站点式生活4) 任何借助于比较的排序,

64、至少需要O(nlog2n) 的时间,箱排序和基数排序只适用于有明显结构特征的关键字;5) 有的语言没有提供指针及递归,使归并、快速、基数排序算法复杂;6) 记录规模较大时为避免大量移动记录可用链表作为存储结构,如插入、归并、基数排序,但快速、堆排序在链表上难以实现,可提取关键字建立索引表,然后对索引表排序。第 九 章查 找1. 查找的同时对表做修改操作( 如插入或删除 ) 则相应的表称之为动态查找表,否则称之为静态查找表。2. 衡量一个查找算法次序优劣的标准是在查找过程中对关键字需要执行的平均比较次数( 即平均查找长度ASL). 3. 线性表上进行查找的方法主要有三种:顺序查找、二分查找和分块

65、查找。(1) 顺序查找的算法基本思想:是从表的一端开始顺序扫描线性表,依次将扫描到的结点关键字与给定值K比较,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 29 页,共 35 页 - - - - - - - - - 若当前扫描到的结点关键字与k 相等则查找成功;若扫描结束后,仍未找到关键字等于K 的结点,则查找失败。1) 顺序查找方法可用链式存储结构和顺序存储结构实现。2) 在顺序存储结构的顺序查找算法中所设的哨兵是为了简化循环的边界条件而引入的附加结点( 元素 ) ,其作用是使

66、for循环中省去判定防止下标越界的条件从而节省了比较的时间。站点式生活3) 在等概率情况下,查找成功时其平均查找长度约为表长的一半(n+1)/2.查找失败的话其平均查找长度为n+1. 站点式生活(2) 二分查找 ( 又称折半查找 ) ,它的算法思想: 是对一有序表中的元素,从初始的查找区间开始,每经过一次与当前查找区间的中点位置上的结点关键字进行比较,若相等,则查找成功,否则,当前查找区间的缩小一半,按k值大小在某半个区间内重复相同的步骤进行查找,直到查找成功或失败为止。1) 二分查找在等概率的情况下查找成功的平均查找长度ASL为 lg(n+1)-1,在查找失败时所需比较的关键字个数不超过判定

67、树的深度,最坏情况下查找成功的比较次数也不超过判定树的深度lg(n+1) (不小于lg(n+1) 的最小整数 ) 2) 二分查找只适用于顺序存储结构而不能用链式存储结构实现。因为链表无法进行随机访问,如果要访问链表的中间结点,就必须先从头结点开始进行依次访问,这就要浪费很多时间,还不如进行顺序查找,而且,用链存储结构将无法判定二分的过程是否结束,因此无法用链表实现二分查找。(3) 分块查找 ( 又称索引顺序查找) 的基本思想:是将原表分成若干块,各块内部不一定有序,但表中的块是 分块有序 的,并抽取各块中的最大关键字及其起始位置建立索引表。因为索引表是有序的,分块查找就是先用二分查找或顺序查找

68、确定待查结点在哪一块,然后在已确定的块中进行顺序查找( 不能用二分查找, 因为块内是无序的 ) 。分块查找实际上是两次查找过程,它的算法效率介与顺序查找和二分查找之间。4. 以上三种查找方法的比较如下表:查找算法存储结构优点 缺点适用于顺序查找顺序结构链表结构算法简单且对表的结构无任何要求查找效率低 n较小的表的查找和查找较少但改动较多的表( 用链表作存储结构 ) 二分查找顺序结构查找效率高关键字要有序且只能用顺序存储结构实现特别适用于一经建立就很少改动又经常需要查找的线性表分块查找顺序结构 站点式生活链表在表中插入或删除记录时就只要在该记录所属块内操作,因为块内记录的存放是随意的,所以插入和

69、删除名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 30 页,共 35 页 - - - - - - - - - 比较容易要增加一个辅助数组的存储空间,并要进行将初始表分块排序运算适用于有分块特点的记录,如一个学校的学生登记表可按系号或班号分块。5. 树的查找:以树做为表的组织形式有一个好处,就是可以实现对动态查找表进行高效率的查找。这里讲到了二叉排序树和B-树,以及在这些树表上进行查找和修改操作的方法。6. 二叉排序树 (BST) 又称二叉查找树,其定义是:二叉排序树要或者是空树或者

70、满足如下性质的二叉树:1) 若它的左子树非空,则左子树上所有结点的值均小于根结点的值;2) 若它的右子树非空,则右子树上所有结点的值均大于根结点的值;3) 左、右子树本身又是一棵二叉排序树。(1) 二叉排序树实际上是满足BST性质的二叉树。(2) 二叉排序树的插入、建立的算法平均时间性能是O(nlgn),但其执行时间约为堆排序的2 至 3 倍。二叉排序树的删除操作可分三种情况进行处理:1)*P 是叶子,则直接删除*P,即将 *P 的双亲 *parent 中指向*P 的指针域置空即可。2)*P 只有一个孩子 *child,此时只需将 *child和*p 的双亲直接连接就可删去*p. 3)*p 有

71、两个孩子 , 则将操作转换成删除*p 结点的中序后继,在删去它之前把这个结点的数据复制到原来要删的结点位置上就完成了删除。(3) 二叉排序树上的查找和二分查找类似,它的关键字比较次数不超过树的深度。在最好的情况下, 二叉排序树在生成的过程中比较匀称,此时的叉排序树是平衡的二叉树( 也就是树中任一结点的左右子树的高度大致相同) ,它的高度约为1.44lgn ,完全平衡的二叉树高度约为lgn. 在最坏的情况下,输入的实例产生的二叉排序树的高度将达到 O(n), 这种情况应当避免。站点式生活7. 关于 B-树( 多路平衡查找树 ) 。它适合在磁盘等直接存取设备上组织动态的查找表,是一种外查找算法。B

72、 树的阶是指 B-树的度数, B-树的结点具有k 个孩子时,该结点必有k-1(k=2) 个关键字。实际上 B-树是二叉排序树的推广,它就是一棵m叉树, 且满足四个性质,这些性质与二叉排序树有相似之处,请仔细理解之。8. 上面的几种查找方法均是建立在比较关键字的基础上,因此它们的平均和最坏情况下所需的比较次数的下界是lgn+O(1). 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 31 页,共 35 页 - - - - - - - - - 9. 散列技术:可以无需任何比较就找到待查关

73、键字,其查找的期望时间为O(1). 散列表的概念: 就是将所有可能出现的关键字的集合U(全集)映射到一个表T0.m-1的下标集上, 这个表就是散列表。10. 而关键字与这个表地址之间以什么样的关系发生联系呢,这就要通过一个函数来建立,这个函数是以U中的关键字为自变量,以相应结点的存储地址为函数值,它就称为散列函数。将结点按其关键字的散列地址存储到散列表的过程称为散列。11. 根据某种散列函数, 一个关键字的散列函数值是唯一的,但是有可能两个或多个不同关键字的函数值是相同的,这时就会把几个结点存储到同一个表位置上,这时就造成冲突( 或碰撞 ) 现象,这两个关键字称为该散列函数的同义词。 站点式生

74、活要完全 ( 不是 安全) 避免冲突需满足两个条件,一是关键字集合U 不大于散列表长m ,另一个是选择合适的散列函数 , 如果用 h(ki)=0)这样的函数的话,看看有什么结果。12. 通常情况下U总是大大于 m的,因此不可能完全避免冲突。冲突的频繁程度还与表的填满程度相关。装填因子 表示表中填入的结点数与表长的比值,通常取1,因为 越大,表越满,冲突的机会也越大。13. 散列函数的选择有两条标准:简单和均匀。看看h(ki)=0这样的函数,简单是简单,但绝不均匀。14. 下面是常见的几种散列函数构的造方法:(1) 平方取中法站点式生活(2) 除余法: 它是用表长 m来除关键字, 取余数作为散列

75、地址。若选除数 m是关键字的基数的幂次,就会使得高位不同而低位相同的关键字互为同义词。因此最好选取素数为除数. (3) 相乘取整法:有两个步骤,先用关键字key 乘上某个常数A(0) (4) 随机数法,此法以关键字为自变量,通过一随机函数得到的值作为散列地址。15. 处理冲突的方法:当不可避免发生冲突时,就必须对冲突加以解决,使发生冲突的同义词能存储到表中。16. 通常有两类方法处理冲突:开放定址法和拉链法。前者是将所有结点均存放在散列T0.m-1中,后者是将互为同义词的结点链成一个单链表,而将此链表的头指针放在散列表中。站点式生活17. 开放定址法的一般形式为:hi=(h(key)+di)%

76、m 1i m -1 18. 开放定址法要求散列表的装填因子1。开放定址法又有线性探查法、二次探查法和双重散列法之分。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 32 页,共 35 页 - - - - - - - - - (1) 由于线性探查法在构造散列表时,遇到冲突 ( 有同义词 ) 的时候会按探查序列向后面的空地址插入,从而使原来应插入到此位置的结点又与它发生冲突,当一连串的位置均已有结点时,本应插入到这些位置的结点又只能将其插入到更后面的同一个空结点上,这种散列地址不同的结点

77、争夺同一个后继散列地址的现象就是聚集或堆积。(注意,同义词发生冲突不是堆积) 为了减小堆积现象的发生,可以用二次探查法和双重散列法进行探查。(2) 拉链法解决冲突的做法是,将所有关键字为同义词的结点链接在同一个单链表中。19. 与开放定址法相比,拉链法有如下几个优点:站点式生活(1) 拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;( 简单无堆积 ) (2) 由于拉链法中各链表上的结点空间是动态申请的,故它更适于造表前无法确定表长的情况;( 动态申表长 ) (3) 开放定址法为减少冲突要求装填因子 较小,当结点规模较大时会浪费很多空间,拉链法中 可以大于 1,

78、且结点较大时,其指针域可忽略不计,因此节省空间;( 空间可节省 ) 站点式生活(4) 拉链法构造的散列表删除结点易实现,而开放定址法中则不能真正删除结点只能做删除标记。( 删除易实现 ) 20. 拉链法也有缺点:当结点规模较小时,用拉链法中的指针域也要占用额外空间,还是开放定址法省空间。21. 在散列表上的运算有查找、插入和删除, 主要是查找。这三个操作的算法并不复杂,也容易理解。关于查找操作的时间性能,可看教材p202 的表 9.1 。由表可见,散列表的平均查找长度不是结点个数n 的函数,而是装填因子 的函数。 越小,冲突的概率越小,但空间的浪费将增加,当 大小合适时,散列表上的平均查找长度

79、就是一个常数,时间性能是O(1). 第 十 章文 件1. 对数据结构来说,文件是性质相同的记录的集合。2. 记录是文件中存取的基本单位,数据项是文件可使用的最小单位,数据项有时称字段或者属性。主关键字项 (唯一标识一个记录的字段) 、次关键字项、主关键字、次关键字。单关键字文件、多关键字文件等。3. 文件的逻辑结构是一种线性结构。4. 文件上的操作主要有两类:检索和维护。并有实时和批量处理两种处理方式。5. 文件的存储结构是指文件在外存上的组织方式,基本的组织方式有:顺序组织、 索引组织、 散列组织和链组织。文件组织的各种方式往往是这四种基本方式的结合。站点式生活名师资料总结 - - -精品资

80、料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 33 页,共 35 页 - - - - - - - - - 6. 常用的文件组织方式:顺序文件、索引文件、散列文件和多关键字文件。站点式生活7. 评价一个文件组织的效率,是执行文件操作所花费的时间和文件组织所需的存储空间。通常文件组织的主要目的,是为了能高效、 方便地对文件进行操作,而检索功能的多寡和速度的快慢,是衡量文件操作质量的重要标志。8. 顺序文件:是指按记录进入文件的先后顺序存放、其逻辑顺序和物理顺序一致的文件。1) 一切存储在顺序存储器(如磁带 ) 上的

81、文件都只能顺序文件。这种顺序文件只能按顺序查找法存取( 注意,没有折半法了 ) 2) 存储在直接存取存储器(如磁盘 ) 上的顺序文件可以顺序查找法存取,也可以用分块查找法或二分查找法存取。3) 顺序文件多用于磁带。9. 索引文件:组织方式:通常是在文件本身( 主文件 ) 之外,另外建立一张表,它指明逻辑记录和物理记录之间一一对应的关系,这张表就叫做索引表,它和主文件一起构成索引文件。1) 索引非顺序文件中的索引表为稠密索引。索引顺序文件中的索引表为稀疏索引。2) 若记录很大使得索引表也很大时,可对索引表再建立索引,称为查找表。通常可达四级索引。10. 索引顺序文件: 是最常用的文件组织:因为索

82、引顺序文件的主文件也是有序的,所以它既适合于随机存取也适合于顺序存取。另一方面,索引非顺序文件的索引是稠密索引,而索引顺序文件的稀疏索引,占用空间较少,因此索引顺序文件是最常用的一种文件组织。1) 索引顺序文件常用的有两种:ISAM文件和 VSAM 文件11. 散列文件:是利用散列存储方式组织的文件,亦称为直接存取文件。1) 它类似于散列表,即根据文件中关键字的特点,设计一个散列函数和处理冲突的方法,将记录散列到存储设备上。与散列表不同的是,对于文件来说,记录通常是成组存放的,若干个记录组成一个存储单位,称为桶。对散列而言,处理冲突的方法主要采用拉链法。2) 散列文件的优点是: 文件随机存放,

83、记录不需要排序;插入删除方便;存取速度快;不需要索引区,节省存储空间。缺点是:不能进行顺序存取,只能按关键字随机存取,且询问方式限地简单询问,需要重新组织文件。站点式生活12. 对被查询的次关键字也建立相应的索引,则这种包含有多个次关键字索引的文件称为多关键字文件。1) 两种多关键字文件的组织方法:多重表文件和倒排表。站点式生活名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 34 页,共 35 页 - - - - - - - - - 2) 一般的文件组织中,是先找记录,然后再找到该记录所含的各次关键字;而倒排文件是先给定次关键字,然后查找含有该次关键字的各个记录,因此称为倒排。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 35 页,共 35 页 - - - - - - - - -

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号