[理学]计算机算法基础第一章

资源描述

《[理学]计算机算法基础第一章》由会员分享，可在线阅读，更多相关《[理学]计算机算法基础第一章（77页珍藏版）》请在金锄头文库上搜索。

1、计算机算法基础,参考书目,算法导论（第二版影印版）Introduction to Algorithms(Second Edition ) （美）Thomas H.Cormen等高等教育出版社计算机程序设计艺术（英文影印版）（1-3卷精装全套）The Art of Computer Programming Volumes 1-3 Boxed Set （美）Donald E.Knuth 清华大学出版社,序,计算机算法是计算机科学和计算机应用的核心数据结构+算法 = 程序算法：计算机软件的灵魂,章节安排,第一章导引与基本数据结构第二章分治法第三章贪心方法第四章动态规划第五章

2、检索与周游第六章回溯法第七章分枝-限界第八章 NP-问题第九章并行算法 ,第一章导引与基本数据结构,1.1 算法的定义及特性 1. 什么是算法？算法如数字、计算一样，是一个基本概念。算法是解一确定类问题的任意一种特殊的方法。在计算机科学中，算法是使用计算机解一类问题的精确、有效方法的代名词：算法是一组有穷的规则，它规定了解决某一特定类型问题的一系列运算。,2. 算法的五个重要特性确定性、能行性、输入、输出、有穷性,1）确定性：算法的每种运算必须要有确切的定义，不能有二义性。例：不符合确定性的运算 5/0 将6或7与x相加未赋值变量参与运算,2）能行性算法中有待

3、实现的运算都是基本的运算，原理上每种运算都能由人用纸和笔在有限的时间内完成。例：整数的算术运算是“能行”的实数的算术运算是“不能行”的,3）输入每个算法有0个或多个输入。这些输入是在算法开始之前给出的量，取自于特定的对象集合定义域（或值域）,4）输出一个算法产生一个或多个输出，这些输出是同输入有某种特定关系的量。,5）有穷性一个算法总是在执行了有穷步的运算之后终止。计算过程：只满足确定性、能行性、输入、输出四个特性但不一定能终止的一组规则。准确理解算法和计算过程的区别：不能终止的计算过程：操作系统算法是“可以终止的计算过程” 算法的时效性：只能把在相当有穷步内终止的算法投入

4、到计算机上运行,算法和程序,程序：一个计算机程序是对一个算法使用某种程序设计语言的具体实现任何一种程序设计语言都可以实现任何一个算法算法的有穷性意味着不是所有的计算机程序都是算法,3. 我们的主要任务算法学习将涉及5个方面的内容： 1）设计算法：创造性的活动 2）表示算法：思想的表示形式 3）确认算法：证明算法的正确性程序的证明 4）分析算法：算法时空特性分析 5）测试程序：“调试只能指出有错误，而不能指出它们不存在错误” 本课程集中于学习算法的设计与分析。通过学习，掌握计算机算法设计和分析基本策略与方法，为设计更复杂、更有效的算法奠定基础,被实践证明是有用的基本设计策略,算法所需时

5、间和空间的定量分析,4. 课程关系数据结构、离散数学程序设计语言：结构化设计数学基础非数值计算领域的基本知识,1.2 分析算法,计算机程序设计的核心目标： 1、设计一个容易理解、编码和调试的算法 2、设计一个能有效利用计算机资源的算法怎样度量效率？算法分析,1. 分析算法的目的在于：通过对算法的分析，在把算法变成程序实际运行前，就知道为完成一项任务所设计的算法的好坏，从而运行好的算法，改进差的算法，避免无益的人力和物力浪费。算法分析是计算机领域的古老而前沿的课题。进行算法分析的基本技术：抽象,2. 重要的假设和约定 1）计算机模型的假设 Turing机模型：计算机形式理论模型

6、通用计算机模型：顺序计算机有足够的“内存” 能在固定的时间内存取数据单元,2）计算的约定算法的执行时间=Fi*ti 其中，Fi是算法中用到的某种运算i的次数， ti是该运算执行一次所用的时间。确定使用什么样的运算及其执行时间。从计算时间上，运算的分类：时间囿界于常数的运算：基本算术运算，如整数、浮点数的加、减、乘、除字符运算赋值运算过程调用等特点：尽管每种运算的执行时间不同，但一般只花一个固定量的时间（单位时间）就可完成。,2）计算的约定（续）,其他运算：字符串操作：与字符串中字符的数量成正比记录操作：与记录的属性数、属性类型等有关特点：运算时间无定量如何分析非

7、时间囿界于常数的运算：分解成若干时间囿界于常数的运算。如：Tstring = Length（String）* tchar,3）工作数据集的选择编制能够反映算法在最好、平均、最坏情况下工作的数据配置。然后使用这些数据配置运行算法，以了解算法的性能。测试数据集的生成在目前算法证明与程序正确性证明没有取得理论上的突破性进展的情况下，是程序测试与算法分析中的关键技术之一。作为算法分析的数据集：典型特征作为程序性能测试的数据集：对执行指标产生影响的性质,3. 如何进行算法分析？对算法进行全面分析，可分两个阶段进行：事前分析：就算法本身，通过对其执行性能的理论分析，得出关于算法特性时间和空

8、间的一个特征函数（、）与计算机物理软硬件没有直接关系。事后测试：将算法编制成程序后实际放到计算机上运行，收集其执行时间和空间占用等统计资料，进行分析判断直接与物理实现有关。,1）事前分析目的：试图得出关于算法执行特性的一种形式描述，以“理论上”衡量算法的“好坏”。如何给出反映算法执行特性的描述？最直接方法：统计算法中各种运算的执行情况，包括：运用了哪些运算每种运算被执行的次数该种运算执行一次所花费的时间等。算法的执行时间=Fi*ti,频率计数例： xx+y for i 1 to n do for i 1 to n do x x + y for j 1 to n do

9、 repeat x x +y repeat repeat (a) (b) (c) 分析： (a)： xx+y执行了1次 (b)： xx+y执行了n次 (c)： xx+y执行了n2次定义：频率计数：一条语句或一种运算在算法（或程序）体中的执行次数。,一条语句在整个程序运行时实际执行时间= 频率计数 * 每执行一次该语句所需的时间如何刻画算法执行特性的形式描述实际执行时间受约于诸多实际因素，如机器类型、编程与语言、操作系统等，没有统一的描述模型。在事前分析中，只限于确定与所使用的机器及其他环境因素无关的频率计数，依此建立理论分析模型。,数量级语句的数量级：语句的执行频率例：1，n ，

10、n2 算法的数量级：算法所包含的所有语句的执行频率之和。算法的数量级从本质上反映了一个算法的执行特性。例：假如求解同一个问题的三个算法分别具有n， n2 ， n3数量级。若n=10，则可能的执行时间将分别是10，100，1000个单位时间与环境因素无关。,算法的输入规模,算法的执行时间随问题规模的增长而增长，增长的速度随不同的算法而不同没有一个方法可以准确的计算算法的具体执行时间语言、编译系统、计算机实际上，在评估算法的性能时，并不需要对算法的执行时间作出准确的统计，人们希望算法与实现的语言无关、与执行的计算机无关所关心的是：算法的执行时间，随着输入规模的增长而增长的情况,

11、计算时间/频率计数的表示函数通过事前分析给出算法计算时间（频率计数）的一个函数表示形式，一般记为与输入规模n有关的函数形式：f(n) 空间特性分析 UA(n) = 算法在实例大小为n上运行时，所需要的内存单元数目处理器的特性如果算法在并行机上运行，则还需要考虑算法对处理器的需求。,2）事后测试目的：运行程序，确定程序实际耗费的时间与空间，验证先前的分析结论包括正确性、执行性能等，比较、优化所设计的算法。分析手段：作时、空性能分布图,4. 计算时间的渐近表示,记：算法的计算时间为f(n) 数量级限界函数为g(n) 其中， n是输入或输出规模的某种测度。 f(n)表示算法的“实际”执行时

12、间与机器及语言有关。 g(n)是形式简单的函数，如nm，logn，2n，n!等。是事前分析中通过对计算时间或频率计数统计分析所得的、与机器及语言无关的函数。以下给出算法执行时间：上界（）、下界（）、“平均”（）的定义。,1）上界函数,定义1 如果存在两个正常数c和n0，对于所有的nn0，有 |f(n)| c|g(n)| 则记作f(n) = (g(n) 含义：如果算法用n值不变的同一类数据在某台机器上运行时，所用的时间总是小于|g(n)|的一个常数倍。所以g(n)是计算时间f(n)的一个上界函数。 f(n)的数量级就是g(n)。 f(n)的增长最多像g(n)的增长那样快试图求出最小的g(

13、n)，使得f(n) = (g(n)。,多项式定理: 定理1 若A(n) = amnm+a1n+a0是一个m次多项式，则有A(n) = (nm) 即：变量n的固定阶数为m的任一多项式，与此多项式的最高阶nm同阶。证明：取n0=1,当nn0时，有 |A(n)|am|nm+|a1|n+|a0| (|am|+|am-1|/n+|a0|/nm) nm (|am|+|am-1|+|a0|) nm 令c= |am|+|am-1|+|a0| 则，定理得证。,计算时间的数量级对算法有效性的影响数量级的大小对算法的有效性有决定性的影响。例：假设解决同一个问题的两个算法，它们都有n个输入，计算时间的数量级

14、分别是n2和nlogn。则， n=1024：分别需要1048576和10240次运算。 n=2048：分别需要4194304和22528次运算。分析：在n加倍的情况下，一个(n2)的算法计算时间增长4 倍，而一个(nlogn)算法则只用两倍多一点的时间即可完成。,算法分类（计算时间）,多项式时间算法：可用多项式（函数）对其计算时间限界的算法。常见的多项式限界函数有： (1) (logn) (n) (nlogn) (n2) (n3) 指数时间算法：计算时间用指数函数限界的算法常见的指数时间限界函数： (2n) (n！) (nn) 说明：当n取值较大时，指数时间算法和多项式时间算法在计算

15、时间上非常悬殊。,典型的计算时间函数曲线,当数据集的规模很大时，要在现有的计算机系统上运行具有比(nlogn)复杂度还高的算法是比较困难的。指数时间算法只有在n取值非常小时才实用。要想在顺序处理机上扩大所处理问题的规模，有效的途径是降低算法的计算复杂度，而不是（仅仅依靠）提高计算机的速度。,计算时间函数值比较,3,定义1.2 如果存在两个正常数c和n0，对于所有的nn0，有 |f(n)| c|g(n)| 则记作f(n) = (g(n) 含义：如果算法用n值不变的同一类数据在某台机器上运行时，所用的时间总是不小于|g(n)|的一个常数倍。所以g(n)是计算时间f(n)的一个下界函数。 f(n)的增长至少像g(n)的增长那样快试图求出“最大”的g(n)，使得f(n) = (g(n)。,2）下界函数,定义1.3 如果存在正常数c1，c2和n0，对于所有的nn0，有 c1|g(n)| |f(n)| c2|g(n)| 则记作含义：算法在最好和最坏情况下的计算时间就一个常数因子范围内而言是相同的。可看作：既有f(n) = (g(n)，又有f(n) = (g(n) 记号表明算法的运行时间有一个较准确的界,3）“平均情况”限界函数,4）限界函数的性质,1）若且，则。即具有传递性。（同）

展开阅读全文