哈夫曼树(C语言实现)

哈夫曼树(C语言实现)文章目录哈夫曼树的基本概念哈夫曼树的构建构建思路代码实现哈夫曼编码的生成编码生成思路代码实现完整代码展示以及代码测试哈夫曼树的基本概念在认识哈夫曼树之前 你必须知道以下几个基本术语 1 什么是路径 给定 N 个权值作为 N 个结点 构造一棵二叉树 若该树的带权路径长度达到最小 则称该二叉树为哈夫曼树 也被称为最优二叉树 哈夫曼树的构建构建思路代码实现哈夫曼编码的生成编码生成思路代码实现完整代码展示以及代码测试

哈夫曼树的基本概念

在一棵树中,从一个结点往下可以达到的结点之间的通路,称为路径。

在这里插入图片描述
如图,从根结点A到叶子结点I的路径就是A->C->F->I

2、什么是路径长度?

某一路径所经过的“边”的数量,称为该路径的路径长度

在这里插入图片描述
如图,该路径经过了3条边,因此该路径的路径长度为3

3、什么是结点的带权路径长度?

若将树中结点赋给一个带有某种含义的数值,则该数值称为该结点的权。从根结点到该结点之间的路径长度与该结点的权的乘积,称为该结点的带权路径长度。

在这里插入图片描述
如图,叶子结点I的带权路径长度为  3 × 3 = 9 3\times3=9 3×3=9

4、什么是树的带权路径长度?

树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。

在这里插入图片描述
如图,该二叉树的带权路径长度 WPL = 2 × 2 + 2 × 6 + 3 × 1 + 3 × 3 + 2 × 2 = 32 =2\times 2 + 2 \times 6 + 3 \times 1 + 3 \times 3 + 2 \times 2 = 32 =2×2+2×6+3×1+3×3+2×2=32

5、什么是哈夫曼树?

给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,则称该二叉树为哈夫曼树,也被称为最优二叉树。

根据树的带权路径长度的计算规则,我们不难理解:树的带权路径长度与其叶子结点的分布有关。
即便是两棵结构相同的二叉树,也会因为其叶子结点的分布不同,而导致两棵二叉树的带权路径长度不同。
在这里插入图片描述
那如何才能使一棵二叉树的带权路径长度达到最小呢?
 根据树的带权路径长度的计算规则,我们应该尽可能地让权值大的叶子结点靠近根结点,让权值小的叶子结点远离根结点,这样便能使得这棵二叉树的带权路径长度达到最小。








哈夫曼树的构建

构建思路

总结一下:构建哈夫曼树就是反复选择两个最小的元素进行合并,直到只剩下一个元素为止。

代码实现

代码实现中,单个结点的类型定义如下:

typedef double DataType; //结点权值的数据类型 typedef struct HTNode //单个结点的信息 { 
    DataType weight; //权值 int parent; //父节点 int lc, rc; //左右孩子 }*HuffmanTree; 

第一阶段:
所构建的哈夫曼树的总结点个数为 2 × 4 − 1 = 7 2\times4-1=7 2×41=7,但是这里我们开辟的数组可以存储8个结点的信息,因为数组中下标为0的位置我们不存储结点信息,具体原因后面给出。
我们先将用于构建哈夫曼树的数字7、5、4、2依次赋值给数组中下标为1-4的权值位置,其余信息均初始化为0。
在这里插入图片描述
第二阶段:
从数组中下标为1-4的元素中,选取权值最小,并且父结点为0(代表其还没有父结点)的两个结点,生成它们的父结点:
 1、下标为5的结点的权值等于被选取的两个结点的权值之和。
 2、两个被选取的结点的父结点就是下标为5的结点。
 3、下标为5的结点左孩子是被选取的两个结点中权值较小的结点,另外一个是其右孩子。
在这里插入图片描述
再从数组中下标为1-5的元素中,选取权值最小,并且父结点为0的两个结点,生成它们的父结点。
在这里插入图片描述
继续从数组中下标为1-6的元素中,选取权值最小,并且父结点为0的两个结点,生成它们的父结点。
在这里插入图片描述
此时,除了下标为0的元素以外,数组中所有元素均已有了自己的结点信息,哈夫曼树已经构建完毕。
在这里插入图片描述
根据数组信息,我们可以画出所构建的哈夫曼树:
在这里插入图片描述
观察该数组中的数据,我们可以发现,权值为7、5、4、2的结点的左孩子和右孩子均为0,也就是它们没有左右孩子,因为它们是叶子结点。此外,数组中父结点为0的结点其实就是所构建的哈夫曼树的根结点。




































现在我们来说说为什么数组中下标为0的元素不存储结点信息?
 因为在数组中叶子结点的左右孩子是0,根结点的父结点是0,我们若是用数组中下标为0元素存储结点信息,那么我们将不能区分左右孩子为0的结点是叶子结点还是说该结点的左右孩子是下标为0的结点,同时也不知道哈夫曼树的根结点到底是谁。

代码如下:

//在下标为1到i-1的范围找到权值最小的两个值的下标,其中s1的权值小于s2的权值 void Select(HuffmanTree& HT, int n, int& s1, int& s2) { 
    int min; //找第一个最小值 for (int i = 1; i <= n; i++) { 
    if (HT[i].parent == 0) { 
    min = i; break; } } for (int i = min + 1; i <= n; i++) { 
    if (HT[i].parent == 0 && HT[i].weight < HT[min].weight) min = i; } s1 = min; //第一个最小值给s1 //找第二个最小值 for (int i = 1; i <= n; i++) { 
    if (HT[i].parent == 0 && i != s1) { 
    min = i; break; } } for (int i = min + 1; i <= n; i++) { 
    if (HT[i].parent == 0 && HT[i].weight < HT[min].weight&&i != s1) min = i; } s2 = min; //第二个最小值给s2 } //构建哈夫曼树 void CreateHuff(HuffmanTree& HT, DataType* w, int n) { 
    int m = 2 * n - 1; //哈夫曼树总结点数 HT = (HuffmanTree)calloc(m + 1, sizeof(HTNode)); //开m+1个HTNode,因为下标为0的HTNode不存储数据 for (int i = 1; i <= n; i++) { 
    HT[i].weight = w[i - 1]; //赋权值给n个叶子结点 } for (int i = n + 1; i <= m; i++) //构建哈夫曼树 { 
    //选择权值最小的s1和s2,生成它们的父结点 int s1, s2; Select(HT, i - 1, s1, s2); //在下标为1到i-1的范围找到权值最小的两个值的下标,其中s1的权值小于s2的权值 HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权重是s1和s2的权重之和 HT[s1].parent = i; //s1的父亲是i HT[s2].parent = i; //s2的父亲是i HT[i].lc = s1; //左孩子是s1 HT[i].rc = s2; //右孩子是s2 } //打印哈夫曼树中各结点之间的关系 printf("哈夫曼树为:>\n"); printf("下标 权值 父结点 左孩子 右孩子\n"); printf("0 \n"); for (int i = 1; i <= m; i++) { 
    printf("%-4d %-6.2lf %-6d %-6d %-6d\n", i, HT[i].weight, HT[i].parent, HT[i].lc, HT[i].rc); } printf("\n"); } 

注:为了避免使用二级指针,函数传参使用了C++中的引用传参。

哈夫曼编码的生成

编码生成思路

对于哈夫曼树上的叶子结点,根据从根结点到该叶子结点的路径所确定的一个编号,就是该叶子结点的哈夫曼编码。

代码实现

一个字符串若是想要容纳下“用n个数据生成的哈夫曼编码”中的任意一个编码,那么这个字符串的长度应该为 n n n,因为我们还需要用一个字节的位置用于存放字符串的结束标志’\0’。

我们就以数字7、5、4、2构建的哈夫曼树为例,哈夫曼编码生成的基本实现步骤如下:

第一阶段:
因为数据个数为4,所以我们开辟一个大小为4的辅助空间,并将最后一个位置赋值为’\0’,用于暂时存放正在生成的哈夫曼编码。
在这里插入图片描述
为了存放这4个数据哈夫曼编码,我们开辟一个字符指针数组,该数组中有5个元素,每个元素的类型为char,该字符指针数组的基本布局如下:
在这里插入图片描述
注意:这里为了与“构建哈夫曼树时所生成的数组”中的下标相对应,所以该字符指针数组中下标为0的元素也不存储有效数据。










第二阶段:
利用已经构建好的哈夫曼树,生成这4个数据的哈夫曼编码。单个数据生成哈夫曼编码的过程如下:
 1、判断该数据结点与其父结点之间的关系,若该数据结点是其父结点的左孩子,则将start指针前移,并将0填入start指向的位置,若是右孩子,则在该位置填1。
 2、接着用同样的方法判断其父结点与其父结点的父结点之间的关系,直到待判断的结点为哈夫曼树的根结点为止,该结点的哈夫曼编码生成完毕。
 3、将字符串中从start的位置开始的数据拷贝到字符指针数组中的相应位置。








代码如下:

typedef char **HuffmanCode; //生成哈夫曼编码 void HuffCoding(HuffmanTree& HT, HuffmanCode& HC, int n) { 
    HC = (HuffmanCode)malloc(sizeof(char*)*(n + 1)); //开n+1个空间,因为下标为0的空间不用 char* code = (char*)malloc(sizeof(char)*n); //辅助空间,编码最长为n(最长时,前n-1个用于存储数据,最后1个用于存放'\0') code[n - 1] = '\0'; //辅助空间最后一个位置为'\0' for (int i = 1; i <= n; i++) { 
    int start = n - 1; //每次生成数据的哈夫曼编码之前,先将start指针指向'\0' int c = i; //正在进行的第i个数据的编码 int p = HT[c].parent; //找到该数据的父结点 while (p) //直到父结点为0,即父结点为根结点时,停止 { 
    if (HT[p].lc == c) //如果该结点是其父结点的左孩子,则编码为0,否则为1 code[--start] = '0'; else code[--start] = '1'; c = p; //继续往上进行编码 p = HT[c].parent; //c的父结点 } HC[i] = (char*)malloc(sizeof(char)*(n - start)); //开辟用于存储编码的内存空间 strcpy(HC[i], &code[start]); //将编码拷贝到字符指针数组中的相应位置 } free(code); //释放辅助空间 } 

注:为了避免使用二级指针,函数传参使用了C++中的引用传参。

完整代码展示以及代码测试

完整源代码:

#include  
     #include  
     #include  
     typedef double DataType; //结点权值的数据类型 typedef struct HTNode //单个结点的信息 { 
    DataType weight; //权值 int parent; //父节点 int lc, rc; //左右孩子 }*HuffmanTree; typedef char **HuffmanCode; //字符指针数组中存储的元素类型 //在下标为1到i-1的范围找到权值最小的两个值的下标,其中s1的权值小于s2的权值 void Select(HuffmanTree& HT, int n, int& s1, int& s2) { 
    int min; //找第一个最小值 for (int i = 1; i <= n; i++) { 
    if (HT[i].parent == 0) { 
    min = i; break; } } for (int i = min + 1; i <= n; i++) { 
    if (HT[i].parent == 0 && HT[i].weight < HT[min].weight) min = i; } s1 = min; //第一个最小值给s1 //找第二个最小值 for (int i = 1; i <= n; i++) { 
    if (HT[i].parent == 0 && i != s1) { 
    min = i; break; } } for (int i = min + 1; i <= n; i++) { 
    if (HT[i].parent == 0 && HT[i].weight < HT[min].weight&&i != s1) min = i; } s2 = min; //第二个最小值给s2 } //构建哈夫曼树 void CreateHuff(HuffmanTree& HT, DataType* w, int n) { 
    int m = 2 * n - 1; //哈夫曼树总结点数 HT = (HuffmanTree)calloc(m + 1, sizeof(HTNode)); //开m+1个HTNode,因为下标为0的HTNode不存储数据 for (int i = 1; i <= n; i++) { 
    HT[i].weight = w[i - 1]; //赋权值给n个叶子结点 } for (int i = n + 1; i <= m; i++) //构建哈夫曼树 { 
    //选择权值最小的s1和s2,生成它们的父结点 int s1, s2; Select(HT, i - 1, s1, s2); //在下标为1到i-1的范围找到权值最小的两个值的下标,其中s1的权值小于s2的权值 HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权重是s1和s2的权重之和 HT[s1].parent = i; //s1的父亲是i HT[s2].parent = i; //s2的父亲是i HT[i].lc = s1; //左孩子是s1 HT[i].rc = s2; //右孩子是s2 } //打印哈夫曼树中各结点之间的关系 printf("哈夫曼树为:>\n"); printf("下标 权值 父结点 左孩子 右孩子\n"); printf("0 \n"); for (int i = 1; i <= m; i++) { 
    printf("%-4d %-6.2lf %-6d %-6d %-6d\n", i, HT[i].weight, HT[i].parent, HT[i].lc, HT[i].rc); } printf("\n"); } //生成哈夫曼编码 void HuffCoding(HuffmanTree& HT, HuffmanCode& HC, int n) { 
    HC = (HuffmanCode)malloc(sizeof(char*)*(n + 1)); //开n+1个空间,因为下标为0的空间不用 char* code = (char*)malloc(sizeof(char)*n); //辅助空间,编码最长为n(最长时,前n-1个用于存储数据,最后1个用于存放'\0') code[n - 1] = '\0'; //辅助空间最后一个位置为'\0' for (int i = 1; i <= n; i++) { 
    int start = n - 1; //每次生成数据的哈夫曼编码之前,先将start指针指向'\0' int c = i; //正在进行的第i个数据的编码 int p = HT[c].parent; //找到该数据的父结点 while (p) //直到父结点为0,即父结点为根结点时,停止 { 
    if (HT[p].lc == c) //如果该结点是其父结点的左孩子,则编码为0,否则为1 code[--start] = '0'; else code[--start] = '1'; c = p; //继续往上进行编码 p = HT[c].parent; //c的父结点 } HC[i] = (char*)malloc(sizeof(char)*(n - start)); //开辟用于存储编码的内存空间 strcpy(HC[i], &code[start]); //将编码拷贝到字符指针数组中的相应位置 } free(code); //释放辅助空间 } //主函数 int main() { 
    int n = 0; printf("请输入数据个数:>"); scanf("%d", &n); DataType* w = (DataType*)malloc(sizeof(DataType)*n); if (w == NULL) { 
    printf("malloc fail\n"); exit(-1); } printf("请输入数据:>"); for (int i = 0; i < n; i++) { 
    scanf("%lf", &w[i]); } HuffmanTree HT; CreateHuff(HT, w, n); //构建哈夫曼树 HuffmanCode HC; HuffCoding(HT, HC, n); //构建哈夫曼编码 for (int i = 1; i <= n; i++) //打印哈夫曼编码 { 
    printf("数据%.2lf的编码为:%s\n", HT[i].weight, HC[i]); } free(w); return 0; } 

我们就以下问题作为测试:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/209804.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 上午8:22
下一篇 2026年3月19日 上午8:23


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号