安徽大学数据结构课程设计报告项目名称:哈弗曼编/译码系统的设计与实现姓名:鉏飞祥学号:E21414018专业:软件工程完成日期2016/7/4计算机科学与技术学院1.需求分析1.1问题描述•问题描述:利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码(解码)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站设计一个哈夫曼编译码系统。1.2基本要求(1)输入的形式和输入值的范围;(2)输出的形式;(3)程序所能达到的功能。1.基本要求(1)初始化(Initialzation)。从数据文件DataFile.data中读入字符及每个字符的权值,建立哈夫曼树HuffTree;(2)编码(EnCoding)。用已建好的哈夫曼树,对文件ToBeTran.data中的文本进行编码形成报文,将报文写在文件Code.txt中;(3)译码(Decoding)。利用已建好的哈夫曼树,对文件CodeFile.data中的代码进行解码形成原文,结果存入文件Textfile.txt中;(4)输出(Output)。输出DataFile.data中出现的字符以及各字符出现的频度(或概率);输出ToBeTran.data及其报文Code.txt;输出CodeFile.data及其原文Textfile.txt;2.概要设计说明本程序中用到的所有抽象数据类型的定义。主程序的流程以及各程序模块之间的层次(调用)关系。(1)数据结构哈夫曼树的节点structhuff{1intweight;intparent;intl;intr;};哈夫曼编码的存储structhuff*hufftree;(2)程序模块选择1到i-1中parent为0且权值最小的两个下标voidSelect(structhuff*HT,intn,int&s1,int&s2)构建哈夫曼树:voidhuffmancoding(structhuff*ht,int*w,intn)对原文进行编码:voidcode(char*c)根据报文找到原文:voiddecoding(char*zifu)3.详细设计核心技术分析:1:构建哈夫曼树及生成哈夫曼编码:根据每个字符权值不同,根据最优二叉树的构建方法,递归生成哈夫曼树,并且用数组存放哈夫曼树。再从每一叶子节点向树根遍历,求得编码例如:如图所示的四个节点v1,v2,v3,v4,他们的权值分别为7,11,4,571145第一步:选择两个权值最小的节点作为左右子孩子,建立一个二叉树,双亲权值为两个自孩子之和,如图2V1V2V3V47119重复第一步:111627重复第一步:16则此时建立的是优有二叉树,约定定左子树边编码为1,右子树编码为0,则可以对次二叉树进行编码,如图:3V1V3V2V4VV2V1V3V4V2V1V3V4101010则各顶点的编码为:V101V21V3001V40002:将原文编码:逐个从文件读入字符,根据已经建立好的哈夫曼树,找到每一字符对应的编码3:将报文译码:步骤一:先读入一个字符,存入匹配字符串步骤二:根据匹配串找所有的哈夫曼编码,如果找到对应的编码,则输入该编码所对应的字符,如果找不到,则读入两个字符存入匹配串,重复步骤二,找到为止。步骤三:把剩下的字符重复步骤一二4V2V1V3V44.测试与分析调试过程,不可能错的分配空间的语句却莫名的让整个程序崩溃,关于编译原理和内存分配的各种问题太欠缺。学了计算机组成原理与体系结构也不知道比如在自定义函数中:Char**c;C=(char**)malloc(4*sizoef(char*));C[2]=(char*)malloc(4*sizeof(char));这样竟然会让程序这执行到这一句时崩溃,本来不可能有错误的。而这句如果写在主函数中,就不会有问题。分配的空间不大,不可能是内存不够用。解决的方法是分开,把C=(char**)malloc(4*sizoef(char*));放在主函数中,另外一句不变依然在自定义函数中。malloc和free尽量配对使用,注意:malloc后通常要对返回值进行判断,避免发生不必要的错误。注意,最好再p被free掉后,加上p=NULL这句“野指针”不是NULL指针,是指向“垃圾”内存(不可用内存)的指针。人们一般不会错用NULL指针,因为用if语句很容易判断。但是“野指针”是很危险的,if无法判断一个指针是正常指针还是“野指针”。有个良好的编程习惯是避免“野指针”的唯一方法。指针p被free或者delete之后,没有置为NULL,让人误以为p是个合法的指针。别看free和delete的名字(尤其是delete),它们只是把指针所指的内存给释放掉,但并...