《公共知识部分数据结构》由会员分享,可在线阅读,更多相关《公共知识部分数据结构(20页珍藏版)》请在金锄头文库上搜索。
1、公共知识部分陈宏第一章数据结构及算法一、算法 1、算法的概念算法:是指解题方案的准确而完整的描述 。 算法不等于程序,也不等计算机方法,程序 需考虑许多与方法分析无关的细节,因为在 编写程序时要受到计算机系统运行环境的影 响,因此程序的编制不可能优于算法的设计 。 2、算法的基本特征(P2) (1)可行性 (2)确定性,算法中每一步骤都必须有明确定义, 不充许有模棱两可的解释,不允许有多义性 (3)有穷性,算法必须能在有限的时间内做完,即 能在执行有限个步骤后终止,包括合理的执行时间 的含义 。 (4)拥有足够的情报。当有足够的情报时,该算法 才有效。综上所述:算法是一组严谨地定义运算顺序的规
2、 则,每一个规则都是有效的,是明确的,此顺序将 在有限的次数下终止。 3、算法的基本要素 (1)是对数据对象的运算和操作;每个算法实际 上是按解题要求从环境能进行的所有操作中选 择合适的操作所组成的一组指令序列。因此, 计算机算法就是计算机能处理的操作所组成的 指令序列。通常,计算机可以执行的基本操作 是以指令的形式描述的。计算机系统能执行的 所有指令的集合,称为该计算机系统的指令系 统。基本运算和操作包括:算术运算、逻辑运算、 关系运算、数据传输 (赋值、输入、输出)(2)是算法的控制结构。一个算法的功能不仅取决于 所选用的操作,而且还与各操作之间的执行顺序有关 。算法中各操作之间的执行顺序
3、称为算法的控制结构 。算法的控制结构给出了算法的基本框架,它不仅决 定了算法中各操作的执行顺序,而且也直接反映了算 法的设计是否符合结构化原则。算法的控制结构:顺序结构、选择结构、循环结构。 算法描述工具有:传统流程图、N-S流程图、算法描 述语言。算法基本设计方法:列举法、归纳法、递推、递归 、减斗递推技术、回溯法。(P5) 4、算法复杂度包括:算法时间复杂度和算法空间复杂度。 算法时间复杂度是指执行算法所需要的计算工 作量。算法的工作量用算法所执行的基本运算 次数来度量。 算法空间复杂度是指执行这个算法所需要的内 存空间。 1、数据结构是指相互有关联的数据元素的集合 (比如春、夏、秋、冬,
4、有共同特征,存在某 种关系,这种关系用前后件来描述,夏是秋的 前件,是春的后件) 2、数据结构研究的三个方面: (1)数据集合中各数据元素之间所固有的逻辑 关系,即数据的逻辑结构; (2)在对数据进行处理时,各数据元素在计算 机中的存储关系,即数据的存储结构; (3)对各种数据结构进行的运算。 二、数据结构 3、数据的逻辑结构数据结构是指反映数据元素之间关系的数据元素集 合的表示。更通俗地说,数据结构是带有结构的数 据元素的集合。这种结构实际上就是指数据元素之 间的前后件关系。数据的逻辑结构包含: (1)表示数据元素的信息; (2)表示各数据元素之间的前后件关系。数据的逻辑结构,是指反映数据元
5、素之间的 逻辑关系的数据结构,与计算机中的存储位 置无关,即与数据的存储结构无关。 4、数据的存储结构l 在实际进行数据处理时,被处理的各数据元素总是 被存放在计算机的存储空间中,并且,各数据元素 在计算机存储空间中的位置关系与它们逻辑关系不 一定是相同的,而且一般也不可能相同。l 数据的逻辑结构在计算机存储空间中的存放形式 称为数据的存储结构(也称数据的物理结构)l为了表示存放在计算机存储空间中的各数据元素之 间的逻辑关系(前后件关系),在数据的存储结构 中,不仅要存放各数据元素的信息,还需要存放各 数据元素之间的前后件关系的信息。l 一般来说,一种数据的逻辑结构根据需要可以表示 成多种存储
6、结构,常用的存储结构有顺序、链接、 索引等存储结构。5、数据结构l 根据数据结构中各数据元素之间前后件关系 的复杂程序,一般将数据结构分为二大类型: 线性结构与非线性结构。l线性结构(也称为线性表)条件: (1)有且只有一个根结点; (2)每一个结点最多有一个前件,也最多有一 个后件。 l非线性结构:不满足线性结构条件的数据结构 。 6、线性表及其顺序存储结构 线性表由一组数据元素构成,数据元素的位置只取决于自 己的序号,元素之间的相对位置是线性的。 在复杂线性表中,由若干项数据元素组成的数据元素称为 记录,而由多个记录构成的线性表又称为文件。 非空线性表的结构特征: (1)且只有一个根结点a
7、1,它无前件; (2)有且只有一个终端结点an,它无后件; (3)除根结点与终端结点外,其他所有结点有且只有一个前件 ,也有且只有一个后件。结点个数n称为线性表的长度,当n=0 时,称为空表。 线性表的顺序存储结构具有以下两个基本特点: (1)线性表中所有元素的所占的存储空间是连续的; (2)线性表中各数据元素在存储空间中是按逻辑顺序依次存 放的。 ai的存储地址为:ADR(ai)=ADR(a1)+(i-1)k,,ADR(a1)为第一 个元素的地址,k代表每个元素占的字节数。 顺序表的运算:插入、删除。 (详见14-16页) 7、线性表的顺序存储结构:栈 、队列栈实际上也是线性表,只不过是种特
8、殊的线性表, 在这种特殊的线性表中,其插入与删除运算都只在线 性表的一端进行,即在这种线性表的结构中,一端是 封闭的,不允许进行插入与删除元素;另一端是开口 的,允许插入与删除元素。在顺序存储结构下,该类 线性表的插入与删除运算是不需要移动表中其他数据 元素的,栈是限定在一端进行插入与删除的线性表。 允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。 栈按照“先进后出”(FILO)或“ 后进先出”(LIFO)组织数据,栈具有记忆作用。用 top表示栈顶位置,用bottom表示栈底。 栈的基本运算:(1)插入元素称为入栈运算:首先将栈顶指针进一( 即top加1),然后将新元素插入到
9、栈顶指针指向的位 置(2)删除元素称为退栈运算:首先将栈顶元素赋给指 定变量,然后将栈顶指针退一(即top减1)(3)读栈顶元素是将栈顶元素赋给一个指定的变量 ,即时不删除元素,指针无变化。 在计算机系统中,如一次只能执行一个用户程序,则在多个 用户程序需执行时,这些用户程序必须按到来的顺序进行排 队等待。用一个线性表来组织管理用户程序的排队执行,原 则是:P19(1)初始时线性表为空(2)当有用户程序来到时,将该用户程序加入到线性表的 末尾进行等待(3)当计算机系统执行当前的用户程序后,就从线性表的 头部取出一个用户程序执行。队列是“先进行出”(FIFO)或“后进后出”(LILO)的线性 表
10、。 队列运算包括(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删除一个元素。 循环队列:s=0表示队列空,s=1且front=rear表示队列满 8、线性链表 数据结构中的每一个结点对应于一个存储单元, 这种存储单元称为存储结点,简称结点。 结点由两部分组成:(1)用于存储数据元素值, 称为数据域;(2)用于存放指针,称为指针域,用于 指向前一个或后一个结点。 在链式存储结构中,存储数据结构的存储空间可 以不连续,各数据结点的存储顺序与数据元素之间的 逻辑关系可以不一致,而数据元素之间的逻辑关系是 由指针域来确定的。 链式存储方式即可用于表示线性结构,也可用于 表示非线性结构。 线
11、性链表,HEAD称为头指针,HEAD=NULL(或0) 称为空表,如果是两指针:左指针(Llink)指向前件 结点,右指针(Rlink)指向后件结点。 线性链表的基本运算:查找、插入、删除。 9、树树是一种简单的非线性结构,所有元素之间具 有明显的层次特性。 在树结构中,每一个结点只有一个前件,称为父结 点,没有前件的结点只有一个,称为树的根结点, 简称树的根。每一个结点可以有多个后件,称为该 结点的子结点。没有后件的结点称为叶子结点 在树结构中,一个结点所拥有的后件的个数称为该 结点的度,所有结点中最大的度称为树的度。树的 最大层次称为树的深度。 在树中,以某结点的一个子结点为根构成的树称为
12、 该结点的一棵子树。10、二叉树(p32)l 二叉树的特点:(1)非空二叉树只有一个根结点;(2)每一个 结点最多有两棵子树,且分别称为该结点的左子树与右子树。 l 由上可看出,在二叉树中,每个结点的度最大为2,即所有子树 (左子树或右子树)也均为二叉树,面树结构中每一个结点的度 可以是任意的。在二叉树中,一个结点可以只有左子树而没有右 子树,也可以只有右子树而没有左子树,当一个结点既没有左子 树也没有右子树时,廖结点即是叶子结点 二叉树的基本性质: (1)在二叉树的第k层上,最多有2k-1(k1)个结点; (2)深度为m的二叉树最多有2m-1个结点; (3)度为0的结点(即叶子结点)总是比度
13、为2的结点多一 个; (4)具有n个结点的二叉树,其深度至少为log2n+1,其中 log2n表示取log2n的整数部分;l满二叉树:除最后一层外,每一层上的所有结点都有两个 子结点。 在满二叉树,每一层上的结点数都达到最大值,即在满二叉在满二叉树,每一层上的结点数都达到最大值,即在满二叉树的第树的第K K层上有层上有2 2k-1k-1(k1)(k1)个结点个结点, ,深度为深度为mm的满二叉树有的满二叉树有2 2mm-1-1个个结点结点l l完全二叉树:除最后一层外,第一层上的结点数均达到最完全二叉树:除最后一层外,第一层上的结点数均达到最 大值,在最后一层上只缺少右边的若干结点。大值,在最
14、后一层上只缺少右边的若干结点。 (5 5) 具有具有n n个结点的完全二叉树的深度为个结点的完全二叉树的深度为loglog2 2n+1n+1; (6 6)设完全二叉树共有)设完全二叉树共有n n个结点。如果从根结点开始,按层个结点。如果从根结点开始,按层 序(每一层从左到右)用自然数序(每一层从左到右)用自然数1 1,2 2,.n.n给结点进行编号给结点进行编号 (k=1,2.nk=1,2.n),有以下结论:),有以下结论: 若若k=1k=1,则该结点为根结点,它没有父结点;若,则该结点为根结点,它没有父结点;若k1k1, 则该结点的父结点编号为则该结点的父结点编号为INT(k/2)INT(k
15、/2); 若若2kn2kn,则编号为,则编号为k k的结点的左子结点编号为的结点的左子结点编号为2k2k;否;否 则该结点无左子结点(也无右子结点);则该结点无左子结点(也无右子结点); 若若2k+1n2k+1n,则编号为,则编号为k k的结点的右子结点编号为的结点的右子结点编号为2k+12k+1 ;否则该结点无右子结点。;否则该结点无右子结点。 二叉树存储结构采用链式存储结构,对于满二 叉树与完全二叉树可以按层序进行顺序存储。 二叉树的遍历: (1)前序遍历(DLR),首先访问根结点,然 后遍历左子树,最后遍历右子树;注意遍历左 、右子树时也采用前序遍历方法 (2)中序遍历(LDR),首先遍
16、历左子树,然 后访问根结点,最后遍历右子树;注意遍历左 、右子树时也采用中序遍历方法 (3)后序遍历(LRD)首先遍历左子树,然后 访问遍历右子树,最后访问根结点。注意遍历 左、右子树时也采用后序遍历方法 11、查找技术 顺序查找:从线性表的第一个元素开始,依次将线性表中 的元素与被查元素进行比较,若相等则表示找到(查找成 功),若线性表中所有的元素都与被查元素进行了比较但都不相等,则表示查找失败。对于长度为n的线性表,最 坏情况需比较n次。 顺序查找的使用情况: (1)线性表为无序表; (2)表采用链式存储结构。二分查找:只适用于顺序存储的有序表设有序线性表的长度为N,被查元素为X,对分查找方法 如下:将X与线性表的中间项进行比较:=X,查到,查找结束; X,则在线性表前半部分以相同方法进行查找