数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf

上传人:摩西的****12 文档编号:141865522 上传时间:2020-08-13 格式:PDF 页数:14 大小:345.40KB
返回 下载 相关 举报
数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf_第1页
第1页 / 共14页
数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf_第2页
第2页 / 共14页
数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf_第3页
第3页 / 共14页
数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf_第4页
第4页 / 共14页
数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf》由会员分享,可在线阅读,更多相关《数据结构课程设计:电文编码译码(哈夫曼编码)(2020年7月整理).pdf(14页珍藏版)》请在金锄头文库上搜索。

1、 1 福建农林大学福建农林大学 计算机与信息学院计算机与信息学院 数据结构课程设计数据结构课程设计 设计设计:哈夫曼编译码器哈夫曼编译码器 姓名:姓名:韦邦权韦邦权 专业:专业:2012013 3 级级计算机科学与技术计算机科学与技术 学号:学号:1322462413224624 班级:班级:1305231613052316 完成日期:完成日期:2013.12.282013.12.28 哈夫曼编译码器哈夫曼编译码器 一一、需求分析需求分析 在当今信息爆炸时代, 如何采用有效的数据压缩技术节省数据文 件的存储空间和计算机网络的传送时间已越来越引起人们的重视, 哈 夫曼编码正是一种应用广泛且非常有

2、效的数据压缩技术。 哈夫曼编码 是一种编码方式,以哈夫曼树即最优二叉树,带权路径长度最小的 二叉树,经常应用于数据压缩。哈夫曼编码使用一张特殊的编码表将 源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之 处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现 2 概率高的字符使用较短的编码,反之出现概率低的则使用较长的编 码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压 缩数据的目的) 。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用 于通信的二进制编码称为哈夫曼编码。 树中从根到每个叶子都有一条 路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指 向右子

3、树的分支表示“1”码,取每条路径上的“0”或“1”的序列 作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈夫曼译码 输入字符串可以把它编译成二进制代码, 输入二进制代码时可以编译 成字符串。 二、二、设计要求设计要求 对输入的一串电文字符实现哈夫曼编码, 再对哈夫曼编码生成的 代码串进行译码,输出电文字符串。通常我们把数据压缩的过程称为 编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式 的字符串。但在信息传递时,总希望总长度能尽可能短,即采用最短 码。假设每种字符在电文中出现的次数为 Wi,编码长度为 Li,电文 中有 n 种字符, 则电文编码总长度为WiLi。 若将此对应到二

4、叉树上, Wi 为叶结点的权,Li 为根结点到叶结点的路径长度。那么,WiLi 恰好为二叉树上带权路径长度。因此 ,设计电文总长最短的二进制 前缀编码,就是以 n 种字符出现的频率作权,构造一棵哈夫曼树,此 构造过程称为哈夫曼编码。设计实现的功能: (1) 哈夫曼树的建立; (2) 哈夫曼编码的生成; (3) 编码文件的译码。 三、三、概要设计概要设计 3 哈夫曼编译码器的主要功能是先建立哈夫曼树,然后利用建好 的哈夫曼树生成哈夫曼编码后进行译码 。 在数据通信中,经常需要将传送的文字转换成由二进制字符 0、 1 组成的二进制串,称之为编码。构造一棵哈夫曼树,规定哈夫曼树 中的左分之代表 0,

5、右分支代表 1,则从根节点到每个叶子节点所经 过的路径分支组成的 0 和 1 的序列便为该节点对应字符的编码, 称之 为哈夫曼编码。 最简单的二进制编码方式是等长编码。若采用不等长编码,让出 现频率高的字符具有较短的编码, 让出现频率低的字符具有较长的编 码,这样可能缩短传送电文的总长度。哈夫曼树课用于构造使电文的 编码总长最短的编码方案。 设计包含的几个方面: 哈夫曼树的建立哈夫曼树的建立 赫夫曼树的建立由赫夫曼算法的定义可知, 初始森林中共有 n 棵只含 有根结点的二叉树。算法的第二步是:将当前森林中的两棵根结点权 值最小的二叉树,合并成一棵新的二叉树;每合并一次,森林中就减 少一棵树,产

6、生一个新结点。显然要进行 n1 次合并,所以共产生 n1 个新结点,它们都是具有两个孩子的分支结点。由此可知,最 终求得的哈夫曼树中一共有 2n1 个结点, 其中 n 个结点是初始森林 的 n 个孤立结点。并且哈夫曼树中没有度数为 1 的分支结点。我们可 以利用一个大小为 2n-1 的一维数组来存储赫夫曼树中的结点。定义 的结构体类型如下: typedef struct 4 char data; /结点字符 int weight; /权值 int parent; /双亲结点 int lchild; /左孩子结点 int rchild; /右孩子结点 HTNode; 哈夫曼编码哈夫曼编码 要求电

7、文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求 和实际需要定义的类型如下: typedet struct char cdN; / 存放编码的数组 int start; /从 start 开始读 cd 中的哈夫曼编码 Hcode; / 编码结构体类型 代码文件的译码代码文件的译码 译码的基本思想是:读文件中编码,并与原先生成的哈夫曼编码表比 较,遇到相等时,即取出其对应的字符存入一个新串中。 四、四、详细设计详细设计 字符字符统计统计 int jsq(char *s,int cnt,char str) char *p; int i,j,k; for(i=1;i=256;i+) cnti=

8、0; for(p=s;*p!=0;p+) k=*p; cntk+; j=0; for(i=1,j=0;i=256;i+) if(cnti!=0) j+; return j; 哈夫哈夫曼树的算法曼树的算法 void CreateHT(HTNode ht,int n,char str,int cn) /创建哈夫曼树函数 for(int input=1;input=256;input+) 5 strinput=input; int l=0; for(int output=1;output=256;output+) if(cnoutput !=0) htl.data=stroutput; /按字母顺序

9、将出现 的字母依次存入数组 ht htl.weight=cnoutput; l+; int i,k,lnode,rnode; int min1,min2; for (i=0;i2*n-1;i+) hti.parent=hti.lchild=hti.rchild=0; /所有结点的相关域置初值 0 for (i=n;i2*n-1;i+) /构造哈夫曼树 min1=min2=MAX; /int 的范围是-32768-32767 lnode=rnode=0; /lnode 和 rnode 记录最小权值的两个结点位置 for (k=0;k=i-1;k+) /选出每次外层循环最小权值的两个结点 if (

10、htk.parent=0) /只在尚未构造二叉树的结点中查找 if (htk.weightmin1) /比 min1 小时 min2=min1;rnode=lnode; min1=htk.weight;lnode=k; else if (htk.weightmin2) /比 min1 大,比 min2 小 min2=htk.weight;rnode=k; htlnode.parent=i;htrnode.parent=i; /两个最小节点的父节点是 i hti.weight=htlnode.weight+htrnode.weight; /两个最小节点的父节点权值 为两个最小节点权值之和 hti

11、.lchild=lnode;hti.rchild=rnode; /父节点的左节点和右节点 哈夫哈夫曼编码曼编码 void CreateHCode(HTNode ht,HCode hcd,int n) 6 int i,p,c; HCode hc; for (i=0;in;i+) /根据哈夫曼树求哈夫曼编码 hc.start=n; /初始位置 c=i; /从叶子结点 hti开始上溯 p=hti.parent; while (p!=0) /循序直到树根结点结束循环 hc.cdhc.start-=(htp.lchild)=c?0:1; /左孩子记为 0,右孩 子记为 1 c=p; p=htp.pare

12、nt; /与上句 c=i;p=hti.parent 同义,促进循环 hc.start+; /start 指向哈夫曼编码 hc.cd中最开始字符 hcdi=hc; 哈夫曼译码哈夫曼译码 void deHCode(HTNode ht,HCode hcd,int n,char str) /译码函数 printf(输出译码结果为:n); int i,j,k,x,m=0; char codeMAX; for (i=0;iMAX;i+) for (j=0;jn;j+) if(stri=htj.data) /循环查找与输入字符相同的编号,相同的就 输出这个字符的编码 for (k=hcdj.start;k=

13、n;k+) codem=hcdj.cdk; /将输出的编码赋值到数组中 m+; break; /输出完成后跳出当前 for 循环 codem=#; /把要进行译码的字符串存入 code 数组中 while(code0!=#) for (i=0;in;i+) 7 m=0; /m 为想同编码个数的计数器 for (k=hcdi.start,j=0;k=n;k+,j+) /j 为记录所存储这个字符的编码个数 if(codej=hcdi.cdk) /当有相同编码时 m 值加 1 m+; if(m=j) /当输入的字符串与所存储的编码字符 串个数相等时则输出这个的 data 数据 printf(%c,h

14、ti.data); for(x=0;codex-j!=#;x+) /把已经使用过的 code 数组里的字符串 删除 codex=codex+j; /删除 j 个数,往前移动 j 位 printf(n); 主函数主函数 void main() char stMAX,sstMAX; int cn257; int n,i; printf(请输入字符串(任意字符):n); gets(st); n=jsq(st,cn,sst); /99 for(i=0;i99;i+) ssti=sti; / HTNode htM; HCode hcdN; CreateHT(ht,n,st,cn); CreateHCode(ht

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号