《数据结构严蔚敏课件第10章专业教育》由会员分享,可在线阅读,更多相关《数据结构严蔚敏课件第10章专业教育(119页珍藏版)》请在金锄头文库上搜索。
1、第十章第十章排序排序1高等课堂【课前思考【课前思考】1. 你熟悉排序吗?你过去曾经学过哪些排序方法你熟悉排序吗?你过去曾经学过哪些排序方法?在第一章中曾以选择排序和起泡排序为例讨论算法实践复杂度,不知你还记得吗?2. 你自己有没有编过排序的程序?是用的什么策你自己有没有编过排序的程序?是用的什么策略?略? 2高等课堂【学习目标】【学习目标】 1理解排序的定义和各种排序方法的特点,并能加以灵活应用。排序方法有不同的分类方法,基于关键字间的比较进行排序的方法可以按排序过程所依据的不同原则分为插入排序、交换排序、选择排序、归并排序和计数排序等五类。2掌握各种排序方法的时间复杂度的分析方法。能从关键字
2、间的比较次数分析排序算法的平均情况和最坏情况的时间性能。按平均时间复杂度划分,内部排序可分为三类:O (n2) 的简单排序方法,O (nlogn) 的高效排序方法和O (dn)的基数排序方法。3理解排序方法稳定或不稳定的含义,弄清楚在什么情况下要求应用的排序方法必须是稳定的。3高等课堂【重点和难点】【重点和难点】希尔排序、快速排序、堆排序和归并排序等高效方法是本章的学习重点和难点。【知识点】【知识点】排序、直接插入排序、折半插入排序、表插入排序、希尔排序、起泡排序、快速排序、简单选择排序、堆排序、2-路归并排序、基数排序、排序方法的综合比较 。4高等课堂【学习指南】【学习指南】 本章学习的要点
3、主要是了解各种排序方法实现时所依据的原则以及它们的主要操作(“关键字间的比较”和“记录的移动”)的时间分析。学习中应注意掌握各种排序方法实现的要点,可通过对基础知识题中算法的手工执行和比较分析,切实掌握各种排序过程的排序特点所在,注意同一排序方法在不同的教科书上可以有不同书写形式描述的算法。在学习本章过程中需练习的算法设计题为:10.23,10.25,10.27 , 10.32, 10.34, 10.38, 10.42 和 10.45。5高等课堂10.1 概述概述10.2 插入排序插入排序10.3 快速排序快速排序10.4 堆排序堆排序10.5 归并排序归并排序10.6 基数排序基数排序10.
4、7 各种排序方法的综合比较各种排序方法的综合比较10.8 外部排序外部排序6高等课堂10.1 概概 述述一、排序的定义一、排序的定义二、内部排序和外部排序二、内部排序和外部排序三、内部排序方法的分类三、内部排序方法的分类7高等课堂一、什么是排序?一、什么是排序?排序是计算机内经常进行的一种操作,其目的是将一组“无序无序”的记录序列调的记录序列调整为整为“有序有序”的记录序列。例如:将下列关键字序列52, 49, 80, 36, 14, 58, 61, 23, 97, 75调整为14, 23, 36, 49, 52, 58, 61 ,75, 80, 978高等课堂 一般情况下,假设含n个记录的序
5、列为 R1, R2, , Rn 其相应的关键字序列为 K1, K2, ,Kn 这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系 : Kp1Kp2Kpn按此固有关系将上式记录序列重新排列为 Rp1, Rp2, ,Rpn 的操作操作称作排序排序。9高等课堂二、内部排序和外部排序二、内部排序和外部排序若整个排序过程不需要访问外存不需要访问外存便能完成,则称此类排序问题为内部排内部排序序; 反之,若参加排序的记录数量很大, 整个序列的排序过程不可能在内存中 完成,则称此类排序问题为外部排序外部排序。10高等课堂三、内部排序的方法三、内部排序的方法内部排序的过程是一个逐步扩大逐步扩大记录的
6、有序序列长度有序序列长度的过程。经过一趟排序经过一趟排序有序序列区无 序 序 列 区有序序列区无 序 序 列 区11高等课堂基于不同的“扩大扩大” 有序序列长度的方法,内部排序方法方法,内部排序方法大致可分下列几种类型:插入类插入类交换类交换类选择类选择类 归并类归并类其它方法其它方法12高等课堂待排记录的数据类型定义如下待排记录的数据类型定义如下:#define MAXSIZE 1000 / 待排顺序表最大长度待排顺序表最大长度typedef int KeyType; / 关键字类型为整数类型关键字类型为整数类型typedef struct KeyType key; / 关键字项关键字项 I
7、nfoType otherinfo; / 其它数据项其它数据项 RcdType; / 记录类型记录类型typedef struct RcdType rMAXSIZE+1; / r0闲置闲置 int length; / 顺序表长度顺序表长度 SqList; / 顺序表类型顺序表类型13高等课堂1. 插入类插入类将无序子序列中的一个或几个记录“插入插入”到有序序列中,从而增加记录的有序子序列的长度。14高等课堂2. 交换类交换类通过“交换交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。15高等课堂3. 选择类选择类从记录的无序
8、子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。16高等课堂4. 归并类归并类通过“归并归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。5. 其它方法其它方法17高等课堂 10. 2 插插 入入 排排 序序18高等课堂有序序列R1.i-1Ri无序序列 Ri.n一趟直接插入排序的基本思想:有序序列R1.i无序序列 Ri+1.n19高等课堂实现实现“一趟插入排序一趟插入排序”可分三步进行:可分三步进行:3将Ri 插入插入(复制)到Rj+1的位置上。2将Rj+1.i-1中的所有记录记录均后移后移 一个位置;1在R1.i-1中查找
9、查找Ri的插入位置, R1.j.key Ri.key Rj+1.i-1.key;20高等课堂直接插入排序直接插入排序(基于顺序查找)(基于顺序查找)表插入排序表插入排序(基于链表存储)(基于链表存储)不同的具体实现方法导致不同的算法描述不同的具体实现方法导致不同的算法描述折半插入排序折半插入排序(基于折半查找)(基于折半查找)希尔排序希尔排序(基于逐趟缩小增量)(基于逐趟缩小增量)21高等课堂一、直接插入排序一、直接插入排序利用 “顺序查找顺序查找”实现“在R1.i-1中查找查找Ri的插入位置”算法的实现要点:算法的实现要点:22高等课堂从Ri-1起向前进行顺序查找, 监视哨设置在R0;R0
10、= Ri; / 设置“哨兵”循环结束表明Ri的插入位置为 j +1R0jRifor (j=i-1; R0.keyRj.key; -j); / 从后往前找j=i-1插入位置插入位置23高等课堂 对于在查找过程中找到的那些关键字不小于Ri.key的记录,并在查找的同时实现记录向后移动;for (j=i-1; R0.keyRj.key; -j); Rj+1 = RjR0jRij= i-1上述循环结束后可以直接进行“插入”插入位置插入位置24高等课堂令 i = 2,3,, n, 实现整个序列的排序。for ( i=2; i=n; +i ) if (Ri.keyRi-1.key) 在 R1.i-1中查找
11、Ri的插入位置; 插入Ri ; 25高等课堂void InsertionSort ( SqList &L ) / 对顺序表 L 作直接插入排序。 for ( i=2; i=L.length; +i ) if (L.ri.key L.ri-1.key) / InsertSortL.r0 = L.ri; / 复制为监视哨for ( j=i-1; L.r0.key L.rj.key; - j ) L.rj+1 = L.rj; / 记录后移L.rj+1 = L.r0; / 插入到正确位置26高等课堂内部排序的时间分析时间分析:实现内部排序的基本操作基本操作有两个:(2)“移动移动”记录。(1)“比较比
12、较”序列中两个关键字的 大小;27高等课堂对于直接插入排序:最好的情况(关键字在记录序列中顺序有序):最好的情况(关键字在记录序列中顺序有序):“比较”的次数:最坏的情况(关键字在记录序列中逆序有序):最坏的情况(关键字在记录序列中逆序有序):“比较”的次数:0“移动”的次数:“移动”的次数:28高等课堂 因为 R1.i-1 是一个按关键字有序的有序序列,则可以利用折半查找折半查找实现“在R1.i-1中查找查找Ri的插入位置”,如此实现的插入排序为折半插折半插入入排序。二、折半插入排序二、折半插入排序29高等课堂void BiInsertionSort ( SqList &L ) / BIns
13、ertSort在在 L.r1.i-1中折半查找插入位置;中折半查找插入位置;for ( i=2; i=high+1; -j ) L.rj+1 = L.rj; / 记录后移L.rhigh+1 = L.r0; / 插入30高等课堂low = 1; high = i-1;while (low=high) m = (low+high)/2; / 折半if (L.r0.key L.rm.key) high = m-1; / 插入点在低半区else low = m+1; / 插入点在高半区31高等课堂14 36 49 52 80 58 61 23 97 75ilowhighmmlowlowmhigh14
14、36 49 52 58 61 80 23 97 75ilowhighmhighmhighmlow例如:再如:插入位置插入位置L.rL.r32高等课堂三、表插入排序三、表插入排序 为了减少在排序过程中进行的“移动”记录的操作,必须改变排序过程中采用的存储结构。利用静态链表进行排序,并在排序完成之后,一次性地调整各个记录相互之间的位置,即将每个记录都调整到它们所应该在的位置上。33高等课堂void LInsertionSort (Elem SL , int n) / 对记录序列SL1.n作表插入排序 SL0.key = MAXINT ; SL0.next = 1; SL1.next = 0; fo
15、r ( i=2; i=n; +i ) for ( j=0, k = SL0.next;SLk.key= SLi.key ; j=k, k=SLk.next ) SLj.next = i; SLi.next = k; / 结点i插入在结点j和结点k之间/ LinsertionSort34高等课堂算法中使用了三个指针:其中:p指示第i个记录的当前位置 i指示第i个记录应在的位置 q指示第i+1个记录的当前位置如何在排序之后调整记录序列?如何在排序之后调整记录序列?35高等课堂void Arrange ( Elem SL , int n ) p = SL0.next; / p指示第一个记录的当前位置
16、 for ( i=1; in; +i ) while (pi) p = SLp.next; q = SLp.next; / q指示尚未调整的表尾 if ( p!= i ) SLpSLi; / 交换记录,使第交换记录,使第i个记录到位个记录到位 SLi.next = p; / 指向被移走的记录指向被移走的记录 p = q; / p指示尚未调整的表尾, / 为找第i+1个记录作准备 / Arrange36高等课堂 四、希尔排序(又称缩小增量排序)四、希尔排序(又称缩小增量排序) 基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。 所谓“宏观”调整,指的是,“跳跃式”的插入排序。 具体做法
17、为:37高等课堂将记录序列分成若干子序列,分别对每个子序列进行插入排序。其中,d 称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为 1。例如:将 n 个记录分成 d 个子序列: R1,R1+d,R1+2d,R1+kd R2,R2+d,R2+2d,R2+kd Rd,R2d,R3d,Rkd,R(k+1)d 38高等课堂例如:16 25 12 30 47 11 23 36 9 18 31 第一趟希尔排序,设增量 d =511 23 12 9 18 16 25 36 30 47 31 第二趟希尔排序,设增量 d = 39 18 12 11 23 16 25 31 30 47 36第三
18、趟希尔排序,设增量 d = 1 9 11 12 16 18 23 25 30 31 36 47 39高等课堂void ShellInsert ( SqList &L, int dk ) for ( i=dk+1; i=n; +i ) if ( L.ri.key0&(L.r0.keyL.rj.key); j-=dk) L.rj+dk = L.rj; / 记录后移,查找插入位置 L.rj+dk = L.r0; / 插入 / if / ShellInsert40高等课堂void ShellSort (SqList &L, int dlta, int t) / 增量为dlta的希尔排序 for (k=
19、0; kt; +t) ShellInsert(L, dltak); /一趟增量为dltak的插入排序 / ShellSort41高等课堂10.3 快快 速速 排排 序序一、起泡排序一、起泡排序二、一趟快速排序二、一趟快速排序三、快速排序三、快速排序四、快速排序的时间分析四、快速排序的时间分析42高等课堂一、起泡排序一、起泡排序假设在排序过程中,记录序列R1.n的状态为:第 i 趟起泡排序无序序列R1.n-i+1有序序列 Rn-i+2.nn-i+1无序序列R1.n-i有序序列 Rn-i+1.n比较相邻记录,将关关键字最大的记录交换键字最大的记录交换到 n-i+1 的位置上43高等课堂void b
20、ibubble (int r,int n)void bibubble (int r,int n) int flag=1; int flag=1; int i=0,j; int i=0,j; int temp; int temp; while(flag=1) while(flag=1) flag=0; flag=0; for(j=i+1;jn-i-1;j+) for(j=i+1;jrj+1) if(rjrj+1) flag=1; flag=1; temp=rj;rj=rj+1;rj+1=temp; temp=rj;rj=rj+1;rj+1=temp; i+; i+; 44高等课堂注意注意: :2
21、. 一般情况下,每经过一趟“起泡”,“i 减一”,但并不是每趟都如此。例如例如:25531579 89i=7i=6for (j = 1; j i; j+) if (Rj+1.key Rj.key) 13i=21. 起泡排序的结束条件为, 最后一趟没有进行最后一趟没有进行“交换记录交换记录”。45高等课堂时间分析时间分析: :最好的情况(关键字在记录序列中顺序有序):最好的情况(关键字在记录序列中顺序有序): 只需进行一趟起泡只需进行一趟起泡“比较比较”的次数:的次数:最坏的情况(关键字在记录序列中逆序有序):最坏的情况(关键字在记录序列中逆序有序): 需进行需进行n-1趟起泡趟起泡“比较比较”
22、的次数:的次数:0“移动移动”的次数:的次数:“移动移动”的次数:的次数:n-146高等课堂二、一趟快速排序(一次划分)二、一趟快速排序(一次划分)目标:目标:找一个记录,以它的关键字作为“枢轴枢轴”,凡其关键字小于枢轴关键字小于枢轴的记录均移动至该记录之前移动至该记录之前,反之,凡关键字大于关键字大于枢轴枢轴的记录均移动至该记录之后移动至该记录之后。致使一趟排序一趟排序之后,记录的无序序列Rs.t将分割成两部分分割成两部分:Rs.i-1和Ri+1.t,且 Rj.key Ri.key Rj.key (sji-1) 枢轴枢轴 (i+1jt)。47高等课堂stlowhigh设设 Rs=52 为枢轴
23、为枢轴 将 Rhigh.key 和 枢轴的关键字进行比较,要求Rhigh.key 枢轴的关键字 将 Rlow.key 和 枢轴的关键字进行比较,要求Rlow.key 枢轴的关键字high23low80high14low52例如例如R052lowhighhighhighlow48高等课堂 可见,经过“一次划分一次划分” ,将关键字序列 52, 49, 80, 36, 14, 58, 61, 97, 23, 75 调整为: 23, 49, 14, 36, (52) 58, 61, 97, 80, 75 在调整过程中,设立了两个指针: low 和high,它们的初值分别为: s 和 t, 之后逐渐减
24、小 high,增加 low,并保证 Rhigh.key52,和 Rlow.key52,否则进行记录的“交换”。49高等课堂int Partition (RedType& R, int low, int high) pivotkey = Rlow.key; while (lowhigh) while (low=pivotkey) -high; RlowRhigh; while (lowhigh & Rlow.key=pivotkey) +low; RlowRhigh; return low; / 返回枢轴所在位置 / Partition50高等课堂int Partition (RedType R
25、, int low, int high) / Partition R0 = Rlow; pivotkey = Rlow.key; / 枢轴 while (lowhigh) while(low=pivotkey) - high; / 从右向左搜索Rlow = Rhigh;while (lowhigh & Rlow.key=pivotkey) + low; / 从左向右搜索Rhigh = Rlow;Rlow = R0; return low;51高等课堂三、快速排序三、快速排序 首先对无序的记录序列进行“一次划分一次划分”,之后分别分别对分割所得两个子序列“递归递归”进行快速排序进行快速排序。无
26、序 的 记 录 序 列无序记录子序列(1)无序子序列(2)枢轴枢轴一次划分分别进行快速排序52高等课堂void QSort (RedType & R, int s, int t ) / 对记录序列Rs.t进行快速排序 if (s t-1) / 长度大于1 / QSortpivotloc = Partition(R, s, t); / 对 Rs.t 进行一次划分一次划分QSort(R, s, pivotloc-1); / 对低子序列递归排序,pivotloc是枢轴位置是枢轴位置QSort(R, pivotloc+1, t); / 对高子序列递归排序53高等课堂void QuickSort( Sq
27、List & L) / 对顺序表进行快速排序 QSort(L.r, 1, L.length); / QuickSort 第一次调用函数 Qsort 时,待排序记录序列的上、下界分别为 1 和 L.length。54高等课堂四、快速排序的时间分析四、快速排序的时间分析假设一次划分所得枢轴位置 i=k,则对n 个记录进行快排所需时间:其中 Tpass(n)为对 n 个记录进行一次划分所需时间。 若待排序列中记录的关键字是随机分布的,则 k 取 1 至 n 中任意一值的可能性相同。T(n) = Tpass(n) + T(k-1) + T(n-k)55高等课堂设 Tavg(1)b则可得结果:结论结论:
28、 快速排序的时间复杂度为快速排序的时间复杂度为O(nlogn)由此可得快速排序所需时间的平均值为:56高等课堂 若待排记录的初始状态为按关键字有序若待排记录的初始状态为按关键字有序时,快速排序将蜕化为起泡排序时,快速排序将蜕化为起泡排序,其时间复杂度为O(n2)。 为避免出现这种情况,需在进行一次划分之前,进行“予处理予处理”,即: 先对 R(s).key, R(t).key 和 R(s+t)/2.key,进行相互比较,然后取取关键字为 “三者之中三者之中”的记录为枢轴为枢轴记录。57高等课堂10.4 堆堆 排排 序序简简 单单 选选 择择 排排 序序堆堆 排排 序序58高等课堂一、简单选择排
29、序一、简单选择排序假设排序过程中,待排记录序列的状态为:有序序列R1.i-1无序序列 Ri.n 第 i 趟简单选择排序从中选出关键字最小的记录有序序列R1.i无序序列 Ri+1.n59高等课堂简单选择排序的算法描述如下:void SelectSort (Elem R, int n ) / 对记录序列R1.n作简单选择排序。 for (i=1; i0; -i ) HeapAdjust ( H.r, i, H.length ); / 建大顶堆for ( i=H.length; i1; -i ) H.r1H.ri; / 将堆顶记录和当前未经排序子序列 / H.r1.i中最后一个记录相互交换 Heap
30、Adjust(H.r, 1, i-1); / 对 H.r1 进行筛选65高等课堂如何如何“建堆建堆”?两个问题两个问题:如何如何“筛选筛选”?定义堆类型为定义堆类型为:typedef SqList HeapType; / 堆采用顺序表表示之66高等课堂所谓“筛选筛选”指的是,对一棵左/右子树均为堆的完全二叉树,“调整调整”根结根结点点使整个二叉树也成为一个堆。堆堆筛筛选选67高等课堂98814973556412362740例如例如:是大顶堆是大顶堆12但在 98 和 12 进行互换之后,它就不不是堆了,因此,需要对它进行“筛选”。98128173641298比较比较比较68高等课堂void H
31、eapAdjust (RcdType &R, int s, int m) / 已知 Rs.m中记录的关键字除 Rs 之外均 / 满足堆的特征,本函数自上而下调整 Rs 的 / 关键字,使 Rs.m 也成为一个大顶堆 / HeapAdjustrc = Rs; / 暂存 Rs for ( j=2*s; j= Rj.key ) break; / 再作“根”和“子树根”之间的比较, / 若“=”成立,则说明已找到 rc 的插 / 入位置 s ,不需要继续往下调整Rs = Rj; s = j; / 否则记录上移,尚需继续往下调整if ( jm & Rj.keyRj+1.key ) +j; / 左/右“子
32、树根”之间先进行相互比较 / 令 j 指示关键字较大记录的位置70高等课堂建堆是一个从下往上进行建堆是一个从下往上进行“筛选筛选”的过程。的过程。40554973816436122798例如例如: 排序之前的关键字序列为123681734998817355 现在,左/右子树都已经调整为堆,最后只要调整根结点,使整个二叉树是个“堆”即可。9849406436122771高等课堂堆排序的时间复杂度分析:堆排序的时间复杂度分析:1. 对深度为 k 的堆,“筛选”所需进行的关键字比较的次数至多为2(k-1);3. 调整“堆顶” n-1 次,总共进行的关键 字比较的次数不超过 2 ( log2(n-1)
33、 + log2(n-2) + +log22) 2n( log2n ) 因此,堆排序的时间复杂度为O(nlogn)。2. 对 n 个关键字,建成深度为h(=log2n+1)的堆,所需进行的关键字比较的次数至多 4n;72高等课堂10.5 归归 并并 排排 序序归并排序的过程基于下列基本思想基本思想进行: 将两个或两个以上的有序子序列 “归并” 为一个有序序列。73高等课堂在内部排序中,通常采用的是2-路归并排序。即:将两个位置相邻位置相邻的记录有序子序列归并为一个一个记录的有序序列。有有 序序 序序 列列 Rl.n有序子序列有序子序列 Rl.m有序子序列有序子序列 Rm+1.n这个操作对顺序表而
34、言,是轻而易举的。74高等课堂void Merge (RcdType SR, RcdType &TR, int i, int m, int n) / 将有序的记录序列 SRi.m 和 SRm+1.n / 归并为有序的记录序列 TRi.n / Mergefor (j=m+1, k=i; i=m & j=n; +k) / 将SR中记录由小到大地并入TR if (SRi.key=SRj.key) TRk = SRi+; else TRk = SRj+; 75高等课堂if (i=m) TRk.n = SRi.m; / 将剩余的 SRi.m 复制到 TRif (j=n) TRk.n = SRj.n; /
35、 将剩余的 SRj.n 复制到 TR76高等课堂归并排序的算法归并排序的算法如果记录无序序列 Rs.t 的两部分 Rs. (s+t)/2 和 R (s+t)/2 +1.t分别按关键字有序,则利用上述归并算法很容易将它们归并成整个记录序列是一个有序序列。 由此,应该先分别对这两部分进行 2-路归并排序。77高等课堂例如:例如:52, 23, 80, 36, 68, 14 (s=1, t=6) 52, 23, 80 36, 68, 14 52, 2380 52 23, 52 23, 52, 8036, 6814366836, 6814, 36, 68 14, 23, 36, 52, 68, 80
36、2378高等课堂void Msort ( RcdType SR, RcdType &TR1, int s, int t ) / 将SRs.t 归并排序为 TR1s.t if (s= =t) TR1s=SRs; else / Msort 79高等课堂m = (s+t)/2; / 将SRs.t平分为SRs.m和SRm+1.tMsort (SR, TR2, s, m); / 递归地将SRs.m归并为有序的TR2s.mMsort (SR, TR2, m+1, t); /递归地SRm+1.t归并为有序的TR2m+1.tMerge (TR2, TR1, s, m, t); / 将TR2s.m和TR2m+1
37、.t归并到TR1s.t80高等课堂void MergeSort (SqList &L) / 对顺序表 L 作2-路归并排序 MSort(L.r, L.r, 1, L.length); / MergeSort容易看出,对 n 个记录进行归并排序的时间复杂度为(nlogn)。即: 每一趟归并的时间复杂度为 O(n), 总共需进行 log2n 趟。81高等课堂10.6 基基 数数 排排 序序82高等课堂基数排序基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法。多关键字的排序多关键字的排序链式基数排序链式基数排序83高等课堂一、多关键字的排序一、多关键字的排序 n 个记录的
38、序列个记录的序列 R1, R2, ,Rn对关键字对关键字 (Ki0, Ki1, ,Kid-1) ) 有序有序是指: 其中其中: : K0 被称为被称为 “最主最主”位关键字位关键字Kd-1 被称为被称为 “最次最次”位关键字位关键字 对于序列中任意两个记录 Ri 和 Rj(1ijn) 都满足满足下列(词典词典)有序有序关系: (Ki0, Ki1, , ,Kid-1) ) (Kj0, Kj1, , ,Kjd-1) )84高等课堂 实现多关键字排序通常有两种作法:最低位优先最低位优先LSD法法最高位优先最高位优先MSD法85高等课堂先对先对K0进行排序进行排序,并按 K0 的不同值将记录序列分成若
39、干子序列之后,分别对 K1 进行排序,., 依次类推,直至最后对最次位直至最后对最次位关键字排序完成为止关键字排序完成为止。86高等课堂 先对 Kd-1 进行排序,然后对 Kd-2 进行排序,依次类推,直至对最主位直至对最主位关键字关键字 K0 排序完成为止排序完成为止。 排序过程中不需要根据 “前一个” 关键字的排序结果,将记录序列分割成若干个(“前一个”关键字不同的)子序列。87高等课堂例如例如: :学生记录含三个关键字:系别系别、班号班号和班内的序列号班内的序列号,其中以系别为最主位关键字。 无序序列无序序列对对K2排序排序对对K1排序排序对对K0排序排序3,2,301,2,153,1,
40、202,3,182,1,201,2,152,3,183,1,202,1,203,2,303,1,202,1,201,2,153,2,302,3,18 1,2,152,1,202,3,183,1,203,2,30LSD的排序过程如下:88高等课堂二、链式基数排序二、链式基数排序假如多关键字的记录序列中,每个关键字的取值范围相同,则按LSD法进行排序时,可以采用“分配分配- -收集收集”的方法,其好处是不需要进行关键字间的比较。对于数字型或字符型的单关键字单关键字,可以看成看成是由多个数位或多个字符构成的多多关键字关键字,此时可以采用采用这种“分配分配- -收集收集”的办法进行排序进行排序,称作基
41、数排序法称作基数排序法。89高等课堂例如:例如:对下列这组关键字 209, 386, 768, 185, 247, 606, 230, 834, 539 首先按其 “个位数” 取值分别为 0, 1, , 9 “分配分配” 成 10 组,之后按从 0 至 9 的顺序将 它们 “收集收集” 在一起; 然后按其 “十位数” 取值分别为 0, 1, , 9 “分配分配” 成 10 组,之后再按从 0 至 9 的顺序将它们 “收集收集” 在一起;最后按其“百位数”重复一遍上述操作。90高等课堂在计算机上实现基数排序时,为减少所需辅助存储空间,应采用链表作存储结构,即链式基数排序,具体作法为: 待排序记录
42、以指针相链,构成一个链表;“分配” 时,按当前“关键字位”所取值,将记录分配到不同的 “链队列” 中,每个队列中记录的 “关键字位” 相同;“收集”时,按当前关键字位取值从小到大将各队列首尾相链成一个链表;对每个关键字位均重复 2) 和 3) 两步。91高等课堂例如:p369367167239237138230139进行第一次分配进行第一次分配进行第一次收集进行第一次收集f0 r0f7 r7f8 r8f9 r9p230230367 167237367167237138368239139369 23913913892高等课堂进行第二次分配进行第二次分配p230237138239139p23036
43、7167237138368239139f3 r3f6 r6230 237138239139367 167368367167368进行第二次收集93高等课堂 进行第三次收集之后便得到记录的有序序列进行第三次收集之后便得到记录的有序序列f1 r1p230237138239139367167368进行第三次分配进行第三次分配f2 r2f3 r3138 139167230 237239367 368p13813916723023723936736894高等课堂提醒注意:提醒注意:“分配分配”和和“收集收集”的实际操作仅为的实际操作仅为修改链表中的指针和设置队列的头、修改链表中的指针和设置队列的头、尾指
44、针。尾指针。95高等课堂 基数排序的时间复杂度为基数排序的时间复杂度为O(d(n+rd)其中:分配为O(n) 收集为O(rd)(rd为“基”) d为“分配-收集”的趟数96高等课堂10.7 各种排序方法的综合比较各种排序方法的综合比较97高等课堂一、时间性能一、时间性能1. 平均的时间性能平均的时间性能基数排序基数排序时间复杂度为时间复杂度为 O(nlogn):快速排序、堆排序和归并排序快速排序、堆排序和归并排序时间复杂度为时间复杂度为 O(n2):直接插入排序、起泡排序和直接插入排序、起泡排序和简单选择排序简单选择排序时间复杂度为时间复杂度为 O(n):98高等课堂2. 当待排记录序列按关键
45、字顺序有序时当待排记录序列按关键字顺序有序时3. 简单选择排序、堆排序和归并排序简单选择排序、堆排序和归并排序的时间性能不随不随记录序列中关键字的分布而改变。 直接插入排序直接插入排序和起泡排序起泡排序能达到O(n)的时间复杂度, 快速排序快速排序的时间性能蜕化为O(n2) 。99高等课堂二、空间性能二、空间性能指的是排序过程中所需的辅助空间大小1. 所有的简单排序方法简单排序方法(包括:直接插入、起泡和简单选择) 和堆排序堆排序的空间复杂度为为O(1);2. 快速排序为快速排序为O(logn),为递归程序执行过程中,栈所需的辅助空间;100高等课堂3. 归并排序归并排序所需辅助空间最多,其空
46、间复杂度为 O(n);4. 链式基数排序链式基数排序需附设队列首尾指针,则空间复杂度为 O(rd)。101高等课堂三、排序方法的稳定性能三、排序方法的稳定性能 1. 稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和经过排序之后,没有改变。 2. 当对多关键字的记录序列进行LSD方法排序时,必须采用稳定的排序方法。排序之前 : Ri(K) Rj(K) 排序之后 : Ri(K) Rj(K) 102高等课堂例如:例如: 排序前 ( 56, 34, 47, 23, 66, 18, 82, 47 )若排序后得到结果 ( 18, 23, 34, 47, 47, 56,
47、66, 82 )则称该排序方法是稳定稳定的;若排序后得到结果 ( 18, 23, 34, 47, 47, 56, 66, 82 )则称该排序方法是不稳定不稳定的。103高等课堂 3. 对于不稳定的排序方法,只要能举出一个实例说明即可。 4. 快速排序、堆排序和希尔排序是不稳快速排序、堆排序和希尔排序是不稳定的排序方法定的排序方法。例如例如 : 对 4, 3, 4, 2 进行快速排序, 得到 2, 3, 4, 4 104高等课堂四、关于四、关于“排序方法的时间复杂度的下限排序方法的时间复杂度的下限” 本章讨论的各种排序方法,除基数排序外,其它方法都是基于基于“比较关键字比较关键字”进进行排序的排
48、序方法。行排序的排序方法。 可以证明, 这类排序法可能达到的最可能达到的最快的时间复杂度为快的时间复杂度为O(nlogn)。 (基数排序不是基于“比较关键字”的排序方法,所以它不受这个限制。)105高等课堂 例如:对三个关键字进行排序的判定树如下:K1K3K1K2K1K3K2K3K2 K3K2K1K3K1K2K3K3K2K1K2K3K1K3K1K2K1K3K2树上的每一次“比较”都是必要的;树上的叶子结点包含所有可能情况。106高等课堂 一般情况下,对n个关键字进行排序,可能得到的结果有n! 种,由于含n! 个叶子结点的二叉树的深度不小于log2(n!) +1, 则对 n 个关键字进行排序的比
49、较次数至少是 log2(n!) nlog2n (斯蒂林近似公式)。 所以,基于基于“比较关键字比较关键字”进行排序进行排序的的排序方法,可能达到的最快的时间复杂排序方法,可能达到的最快的时间复杂度为度为 O(nlogn)。107高等课堂10.8外外 部部 排排 序序108高等课堂一一. 问题的提出问题的提出 待排序的记录数量很大,不能一次装入内存,则无法利用前几节讨论的排序方法 (否则将引起频繁访问内存);109高等课堂 对外存中数据的读/写是以“数据块”为单位进行的; 读/写外存中一个“数据块”的数据所需要的时间为: TI/O = tseek + tla + n twm 其中 tseek 为
50、寻查时间(查找该数据块所在磁道) tla 为等待(延迟)时间 n twm 为传输数据块中n个记录的时间。110高等课堂 按可用内存大小,利用内部排序 方法,构造若干( 记录的) 有序子序列,通常称外存中这些记录有序子序列为 “归并段归并段”;二、外部排序的基本过程二、外部排序的基本过程由相对独立的两个步骤组成: 通过“归并归并”,逐步扩大 (记录的)有序子序列的长度,直至外存中整个记录序列按关键字有序为止。111高等课堂例如:例如:假设有一个含10,000个记录的磁盘 文件,而当前所用的计算机一次只 能对1000个记录进行内部排序,则 首先利用内部排序的方法得到10个 初始归并段,然后进行逐趟
51、归并。假设进行2路归并(即两两归并),则第一趟第一趟由10个归并段得到5个归并段;最后一趟最后一趟归并得到整个记录的有序序列。第三趟第三趟由 3 个归并段得到2个归并段;第二趟第二趟由 5 个归并段得到3个归并段;112高等课堂假设“数据块”的大小为200,即每一次访问外存可以读/写200个记录。则对于10,000个记录,处理一遍需访问外存100次(读和写各50次)。分析上述外排过程中访问外存(对外存进行读/写)的次数:113高等课堂由此,对上述例子而言,1)求得10个初始归并段需访问外存100次;2)每进行一趟归并需访问外存100次;3)总计访问外存 100 + 4 100 = 500次。1
52、14高等课堂 外排总的时间还应包括内部排序所需时间和逐趟归并时进行内部归并的时间,显然,除去内部排序的因素外,外部排序的时间取决于逐趟归并外部排序的时间取决于逐趟归并所需进行的所需进行的“趟数趟数”。例如例如,若对上述例子采用5路归并,则只需进行2趟归并,总的访问外存的次数将压缩到 100 + 2 100 = 300 次。115高等课堂 一般情况下,假设待排记录序列含含 m 个初始归并段个初始归并段,外排时采用 k 路路归并归并,则归并趟数归并趟数为 logkm ,显然,随之k的增大归并的趟数将减少,因此对外排而言,通常采用多路归并。k 的大小可选,但需综合考虑各种因素。116高等课堂【本章小
53、结】【本章小结】 本章主要讨论各种内部排序的方法。学习本章的目的是了解各种排序方法的原理以及各自的优缺点,以便在编制软件时能按照情况所需合理选用。一般来说,在选择排序方法时,可有下列几种选择:1) 若待排序的记录个数n值较小(例如n30),则可选用插入排序法,但若记录所含数据项较多,所占存储量大时,应选用选择排序法。反之,若待排序的记录个数n值较大时,应选用快速排序法。但若待排序记录关键字有有序倾向时,就慎用快速排序,而宁可选用堆排序或归并排序,而后两者的最大差别是所需辅助空间不等。117高等课堂 2) 快速排序和归并排序在n值较小时的性能不及直接插入排序,因此在实际应用时,可将它们和插入排序混合使用。如在快速排序划分子区间的长度小于某值时,转而调用直接插入排序;或者对待排记录序列先逐段进行直接插入排序,然后再利用归并操作进行两两归并直至整个序列有序为止。3) 基数排序的时间复杂度为O (dn),因此特别适合于待排记录数 n 值很大,而关键字位数 d 较小的情况。并且还可以调整基数(如将基数定为100或1000等)以减少基数排序的趟数d的值。4) 一般情况下,对单关键字进行排序时,所用的排序方法是否稳定无关紧要。但当按最次位优先进行多关键字排序时(除第一趟外)必须选用稳定的排序方法。118高等课堂重庆工商大学重庆工商大学计算计算机与信息工程学院机与信息工程学院119高等课堂