数据结构课程设计电文编码译码(哈夫曼编码).doc

上传人:re****.1 文档编号:549760951 上传时间:2022-11-12 格式:DOC 页数:15 大小:186.50KB
返回 下载 相关 举报
数据结构课程设计电文编码译码(哈夫曼编码).doc_第1页
第1页 / 共15页
数据结构课程设计电文编码译码(哈夫曼编码).doc_第2页
第2页 / 共15页
数据结构课程设计电文编码译码(哈夫曼编码).doc_第3页
第3页 / 共15页
数据结构课程设计电文编码译码(哈夫曼编码).doc_第4页
第4页 / 共15页
数据结构课程设计电文编码译码(哈夫曼编码).doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《数据结构课程设计电文编码译码(哈夫曼编码).doc》由会员分享,可在线阅读,更多相关《数据结构课程设计电文编码译码(哈夫曼编码).doc(15页珍藏版)》请在金锄头文库上搜索。

1、数据结构课程设计电文编码译码(哈夫曼编码)福建农林大学计算机与信息学院数据结构课程设计设计:哈夫曼编译码器姓名:韦邦权专业:2013级计算机科学与技术学号:13224624班级:13052316达成日期:1哈夫曼编译码器一、需求分析在现在信息爆炸时代,怎样采用有效的数据压缩技术节俭数据文件的储藏空间和计算机网络的传达时间已越来越惹起人们的重视,哈夫曼编码正是一种应用宽泛且特别有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。哈夫曼编码使用一张特其他编码表将源字符(比方某文件中的一个符号)进行编码。这张编码表的特别之处在于,它是依

2、照每一个源字符出现的估计概率而成立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码此后的字符串的平均希望长度降低,进而达到无损压缩数据的目的)。哈夫曼编码的应用很宽泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈夫曼译码输入字符串能够把它编译成二进制代码,输入二进制代码时能够编译成字符串。二、设计要求对输入的一串电文字符实现哈夫曼编码,再对哈夫曼编码生

3、成的2代码串进行译码,输出电文字符串。平常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传达文字的二进制码形式的字符串。但在信息传达时,总希望总长度能尽可能短,即采用最短码。假定每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为WiLi。若将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。那么,WiLi恰巧为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频次作权,结构一棵哈夫曼树,此结构过程称为哈夫曼编码。设计实现的功能:(1)哈夫曼树的成立;(2) 哈夫曼编码的生成;(3)编码文件的译

4、码。三、纲领设计哈夫曼编译码器的主要功能是先成立哈夫曼树,尔后利用建好的哈夫曼树生成哈夫曼编码后进行译码。在数据通信中,经常需要将传达的文字变换成由二进制字符0、1 组成的二进制串,称之为编码。结构一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,则从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。最简单的二进制编码方式是等长编码。若采用不等长编码,让出现频次高的字符拥有较短的编码,让出现频次低的字符拥有较长的编码,这样可能缩短传达电文的总长度。哈夫曼树课用于结构使电文的编码总长最短的编码方案。3设计包含的几个方面:哈夫曼树的成立赫夫曼

5、树的成立由赫夫曼算法的定义可知,初始森林中共有n棵只含有根结点的二叉树。算法的第二步是:将目前森林中的两棵根结点权值最小的二叉树,归并成一棵新的二叉树;每归并一次,森林中就减少一棵树,产生一个新结点。明重要进行n1次归并,因此共产生n1个新结点,它们都是拥有两个孩子的分支结点。由此可知,最终求得的哈夫曼树中一共有2n1个结点,其中n个结点是初始森林的n个孤立结点。并且哈夫曼树中没有度数为1的分支结点。我们能够利用一个大小为2n-1的一维数组来储藏赫夫曼树中的结点。定义的结构体种类以下:typedefstructchardata;/结点字符intweight;/权值intparent;/双亲结点

6、intlchild;/左孩子结点intrchild;/右孩子结点HTNode;哈夫曼编码要求电文的哈夫曼编码,必定先定义哈夫曼编码种类,依照设计要求和实质需要定义的种类以下:typedetstructcharcdN;/寄存编码的数组intstart;/从start开始读cd中的哈夫曼编码Hcode;/编码结构体种类代码文件的译码译码的基本思想是:读文件中编码,并与本来生成的哈夫曼编码表比较,碰到相等时,即取出其对应的字符存入一个新串中。四、详尽设计4字符统计intjsq(char*s,intcnt,charstr)char*p;inti,j,k;for(i=1;i=256;i+)cnti=0;

7、for(p=s;*p!=0;p+)k=*p;cntk+;j=0;for(i=1,j=0;i=256;i+)if(cnti!=0)j+;returnj;哈夫曼树的算法voidCreateHT(HTNodeht,intn,charstr,intcn)/创办哈夫曼树函数for(intinput=1;input=256;input+)strinput=input;intl=0;for(intoutput=1;output=256;output+)if(cnoutput!=0)htl.data=stroutput;/按字母次序将出现的字母依次存入数组hthtl.weight=cnoutput;l+;in

8、ti,k,lnode,rnode;intmin1,min2;for(i=0;i2*n-1;i+)hti.parent=hti.lchild=hti.rchild=0;/所有结点的有关域置初值0for(i=n;i2*n-1;i+)/结构哈夫曼树5min1=min2=MAX;/int的范围是-32768-32767lnode=rnode=0;/lnode和rnode记录最小权值的两个结点地址for(k=0;k=i-1;k+)/选出每次外层循环最小权值的两个结点if(htk.parent=0)/只在还没有结构二叉树的结点中查找if(htk.weightmin1)/比min1小时min2=min1;r

9、node=lnode;min1=htk.weight;lnode=k;elseif(htk.weightmin2)/比min1大,比min2小min2=htk.weight;rnode=k;htlnode.parent=i;htrnode.parent=i;/两个最小节点的父节点是ihti.weight=htlnode.weight+htrnode.weight;/两个最小节点的父节点权值为两个最小节点权值之和hti.lchild=lnode;hti.rchild=rnode;/父节点的左节点和右节点哈夫曼编码voidCreateHCode(HTNodeht,HCodehcd,intn)int

10、i,p,c;HCodehc;for(i=0;in;i+)/依照哈夫曼树求哈夫曼编码hc.start=n;/初始地址c=i;/从叶子结点hti开始上溯p=hti.parent;while(p!=0)/次序直到树根结点结束循环hc.cdhc.start-=(htp.lchild)=c?0:1;/左孩子记为0,右孩子记为1c=p;p=htp.parent;/与上句c=i;p=hti.parent同义,促使循环hc.start+;/start指向哈夫曼编码hc.cd中最开始字符hcdi=hc;6哈夫曼译码voiddeHCode(HTNodeht,HCodehcd,intn,charstr)/译码函数p

11、rintf(输出译码结果为:n);inti,j,k,x,m=0;charcodeMAX;for(i=0;iMAX;i+)for(j=0;jn;j+)if(stri=htj.data)/循环查找与输入字符相同的编号,相同的就输出这个字符的编码for(k=hcdj.start;k=n;k+)codem=hcdj.cdk;/将输出的编码赋值到数组中m+;break;/输出达成后跳出目前for循环codem=#;/把要进行译码的字符串存入code数组中while(code0!=#)for(i=0;in;i+)m=0;/m为想同编码个数的计数器for(k=hcdi.start,j=0;k=n;k+,j+)/j为记录所储藏这个字符的编码个数if(codej=hcdi.cdk)/当有相同编码时m值加1m+;if(m=j)/当输入的字符串与所储藏的编码字符串个数相等时则输出这个的data数据printf(%c,hti.data);for(x=0;codex-j!=#;x+)/把已经使用过的code数组里的字符串删除codex=codex+j;/删除j个数,往前搬动j位7printf(n);主函数voidmain()charstMAX,sstMAX;intcn257;intn,i;p

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号