使用C语言详解霍夫曼树数据结构

1、基本概念


a、路径和路径长度

若在一棵树中存在着一个结点序列 k1,k2,……,kj, 使得 ki是ki+1 的双亲(1<=i<j),则称此结点序列是从 k1 到 kj 的路径。

从 k1 到 kj 所经过的分支数称为这两点之间的路径长度,它等于路径上的结点数减1.

b、结点的权和带权路径长度

在许多应用中,常常将树中的结点赋予一个有着某种意义的实数,我们称此实数为该结点的权,(如下面一个树中的蓝色数字表示结点的权)

结点的带权路径长度规定为从树根结点到该结点之间的路径长度与该结点上权的乘积。

c、树的带权路径长度

树的带权路径长度定义为树中所有叶子结点的带权路径长度之和,公式为:

其中,n表示叶子结点的数目,wi 和 li 分别表示叶子结点 ki 的权值和树根结点到 ki 之间的路径长度。

如下图中树的带权路径长度 WPL = 9 x 2 + 12 x 2 + 15 x 2 + 6 x 3 + 3 x 4 + 5 x 4  =  122

d、哈夫曼树

哈夫曼树又称最优二叉树。它是 n 个带权叶子结点构成的所有二叉树中,带权路径长度 WPL 最小的二叉树。

如下图为一哈夫曼树示意图。

2、构造哈夫曼树

假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:

(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);

(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;

(3)从森林中删除选取的两棵树,并将新树加入森林;

(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。

如:对 下图中的六个带权叶子结点来构造一棵哈夫曼树,步骤如下:

注意:为了使得到的哈夫曼树的结构尽量唯一,通常规定生成的哈夫曼树中每个结点的左子树根结点的权小于等于右子树根结点的权。

具体算法如下:

 //2、根据数组 a 中 n 个权值建立一棵哈夫曼树,返回树根指针
  struct BTreeNode* CreateHuffman(ElemType a[], int n)
  {
    int i, j;
    struct BTreeNode **b, *q;
    b = malloc(n*sizeof(struct BTreeNode));
    for (i = 0; i < n; i++) //初始化b指针数组,使每个指针元素指向a数组中对应的元素结点
    {
      b[i] = malloc(sizeof(struct BTreeNode));
      b[i]->data = a[i];
      b[i]->left = b[i]->right = NULL;
    }
    for (i = 1; i < n; i++)//进行 n-1 次循环建立哈夫曼树
    {
      //k1表示森林中具有最小权值的树根结点的下标,k2为次最小的下标
      int k1 = -1, k2;
      for (j = 0; j < n; j++)//让k1初始指向森林中第一棵树,k2指向第二棵
      {
        if (b[j] != NULL && k1 == -1)
        {
          k1 = j;
          continue;
        }
        if (b[j] != NULL)
        {
          k2 = j;
          break;
        }
      }
      for (j = k2; j < n; j++)//从当前森林中求出最小权值树和次最小
      {
        if (b[j] != NULL)
        {
          if (b[j]->data < b[k1]->data)
          {
            k2 = k1;
            k1 = j;
          }
          else if (b[j]->data < b[k2]->data)
            k2 = j;
        }
      }
      //由最小权值树和次最小权值树建立一棵新树,q指向树根结点
      q = malloc(sizeof(struct BTreeNode));
      q->data = b[k1]->data + b[k2]->data;
      q->left = b[k1];
      q->right = b[k2]; 

      b[k1] = q;//将指向新树的指针赋给b指针数组中k1位置
      b[k2] = NULL;//k2位置为空
    }
    free(b); //删除动态建立的数组b
    return q; //返回整个哈夫曼树的树根指针
  }

3、哈夫曼编码

在电报通信中,电文是以二进制的0、1序列传送的,每个字符对应一个二进制编码,为了缩短电文的总长度,采用不等长编码方式,构造哈夫曼树,

将每个字符的出现频率作为字符结点的权值赋予叶子结点,每个分支结点的左右分支分别用0和1编码,从树根结点到每个叶子结点的路径上

所经分支的0、1编码序列等于该叶子结点的二进制编码。如上文所示的哈夫曼编码如下:

a 的编码为:00

b 的编码为:01

c 的编码为:100

d 的编码为:1010

e 的编码为:1011

f 的编码为:11

4、哈夫曼树的操作运算

以上文的哈夫曼树作为具体实例,用详细的程序展示哈夫曼树的操作运算

 #include<stdio.h>
 #include<stdlib.h>
 typedef int ElemType;
 struct BTreeNode
 {
  ElemType data;
  struct BTreeNode* left;
  struct BTreeNode* right;
 }; 

 //1、输出二叉树,可在前序遍历的基础上修改。采用广义表格式,元素类型为int
 void PrintBTree_int(struct BTreeNode* BT)
 {
  if (BT != NULL)
  {
   printf("%d", BT->data); //输出根结点的值
   if (BT->left != NULL || BT->right != NULL)
   {
    printf("(");
    PrintBTree_int(BT->left); //输出左子树
    if (BT->right != NULL)
     printf(",");
    PrintBTree_int(BT->right); //输出右子树
    printf(")");
   }
  }
 } 

 //2、根据数组 a 中 n 个权值建立一棵哈夫曼树,返回树根指针
 struct BTreeNode* CreateHuffman(ElemType a[], int n)
 {
  int i, j;
  struct BTreeNode **b, *q;
  b = malloc(n*sizeof(struct BTreeNode));
  for (i = 0; i < n; i++) //初始化b指针数组,使每个指针元素指向a数组中对应的元素结点
  {
   b[i] = malloc(sizeof(struct BTreeNode));
   b[i]->data = a[i];
   b[i]->left = b[i]->right = NULL;
  }
  for (i = 1; i < n; i++)//进行 n-1 次循环建立哈夫曼树
  {
   //k1表示森林中具有最小权值的树根结点的下标,k2为次最小的下标
   int k1 = -1, k2;
   for (j = 0; j < n; j++)//让k1初始指向森林中第一棵树,k2指向第二棵
   {
    if (b[j] != NULL && k1 == -1)
    {
     k1 = j;
     continue;
    }
    if (b[j] != NULL)
    {
     k2 = j;
     break;
    }
   }
   for (j = k2; j < n; j++)//从当前森林中求出最小权值树和次最小
   {
    if (b[j] != NULL)
    {
     if (b[j]->data < b[k1]->data)
     {
      k2 = k1;
      k1 = j;
     }
     else if (b[j]->data < b[k2]->data)
      k2 = j;
    }
   }
   //由最小权值树和次最小权值树建立一棵新树,q指向树根结点
   q = malloc(sizeof(struct BTreeNode));
   q->data = b[k1]->data + b[k2]->data;
   q->left = b[k1];
   q->right = b[k2]; 

   b[k1] = q;//将指向新树的指针赋给b指针数组中k1位置
   b[k2] = NULL;//k2位置为空
  }
  free(b); //删除动态建立的数组b
  return q; //返回整个哈夫曼树的树根指针
 } 

 //3、求哈夫曼树的带权路径长度
 ElemType WeightPathLength(struct BTreeNode* FBT, int len)//len初始为0
 {
  if (FBT == NULL) //空树返回0
   return 0;
  else
  {
   if (FBT->left == NULL && FBT->right == NULL)//访问到叶子结点
    return FBT->data * len;
   else //访问到非叶子结点,进行递归调用,返回左右子树的带权路径长度之和,len递增
    return WeightPathLength(FBT->left,len+1)+WeightPathLength(FBT->right,len+1);
  }
 } 

 //4、哈夫曼编码(可以根据哈夫曼树带权路径长度的算法基础上进行修改)
 void HuffManCoding(struct BTreeNode* FBT, int len)//len初始值为0
 {
  static int a[10];//定义静态数组a,保存每个叶子的编码,数组长度至少是树深度减一
  if (FBT != NULL)//访问到叶子结点时输出其保存在数组a中的0和1序列编码
  {
   if (FBT->left == NULL && FBT->right == NULL)
   {
    int i;
    printf("结点权值为%d的编码:", FBT->data);
    for (i = 0; i < len; i++)
     printf("%d", a[i]);
    printf("\n");
   }
   else//访问到非叶子结点时分别向左右子树递归调用,并把分支上的0、1编码保存到数组a
   { //的对应元素中,向下深入一层时len值增1
    a[len] = 0;
    HuffManCoding(FBT->left, len + 1);
    a[len] = 1;
    HuffManCoding(FBT->right, len + 1);
   }
  }
 } 

 //主函数
 void main()
 {
  int n, i;
  ElemType* a;
  struct BTreeNode* fbt;
  printf("从键盘输入待构造的哈夫曼树中带权叶子结点数n:");
  while(1)
  {
   scanf("%d", &n);
   if (n > 1)
    break;
   else
    printf("重输n值:");
  }
  a = malloc(n*sizeof(ElemType));
  printf("从键盘输入%d个整数作为权值:", n);
  for (i = 0; i < n; i++)
   scanf(" %d", &a[i]);
  fbt = CreateHuffman(a, n);
  printf("广义表形式的哈夫曼树:");
  PrintBTree_int(fbt);
  printf("\n");
  printf("哈夫曼树的带权路径长度:");
  printf("%d\n", WeightPathLength(fbt, 0));
  printf("树中每个叶子结点的哈夫曼编码:\n");
  HuffManCoding(fbt, 0);
 }

运行结果:

下面来看一道ACM题目

题目描述: 
    哈夫曼树,第一行输入一个数n,表示叶结点的个数。需要用这些叶结点生成哈夫曼树,根据哈夫曼树的概念,这些结点有权值,即weight,题目需要输出所有结点的值与权值的乘积之和。 
    输入: 
    输入有多组数据。 
    每组第一行输入一个数n,接着输入n个叶节点(叶节点权值不超过100,2<=n<=1000)。 
    输出: 
    输出权值。 
    样例输入: 
    5   
    1 2 2 5 9 
    样例输出: 
    37

ac代码

链表构建哈夫曼树(插入排序)

 #include <stdio.h>
 #include <stdlib.h>
 #define max 1001 

 struct htree
 {
  int weight;
  struct htree *lchild;
  struct htree *rchild;
  struct htree *next;
 }; 

 void addNode(struct htree *, struct htree *);
 struct htree* createHfmtree(int *, int);
 int getWpl(struct htree *, int); 

 int main()
 {
  int w[max];
  int i, n, wpl;
  struct htree *ht; 

  while(scanf("%d", &n) != EOF)
  {
   for(i = 0; i < n; i ++)
   {
    scanf("%d", &w[i]);
   } 

   ht = createHfmtree(w, n);
   wpl = getWpl(ht, 0);
   printf("%d\n", wpl);
  }
  return 0;
 } 

 struct htree* createHfmtree(int *w, int n)
 {
  int i;
  struct htree *head, *pl, *pr, *proot;
  head = (struct htree *)malloc(sizeof(struct htree));
  head->next = NULL; 

  for(i = 0; i < n; i ++)
  {
   struct htree *pnode = malloc(sizeof(struct htree));
   pnode->weight = *(w + i);
   pnode->lchild = pnode->rchild = pnode->next = NULL;
   addNode(head, pnode);
  } 

  while(head->next)
  {
   if(head->next->next == NULL)
    break;
   pl = head->next;
   pr = pl->next;
   head->next = pr->next;
   proot = (struct htree *)malloc(sizeof(struct htree));
   proot->weight = pl->weight + pr->weight;
   proot->lchild = pl;
   proot->rchild = pr;
   addNode(head, proot);
  }
  return head->next;
 } 

 void addNode(struct htree *head, struct htree *pnode)
 {
  struct htree *t = head; 

  while(t->next && t->next->weight < pnode->weight)
   t = t->next;
  pnode->next = t->next;
  t->next = pnode;
 } 

 int getWpl(struct htree *ht, int level)
 {
  if(ht == NULL)
   return 0;
  if(!ht->lchild && !ht->rchild)
  {
   return ht->weight * level;
  } 

  return getWpl(ht->lchild, level + 1) + getWpl(ht->rchild, level + 1);
 }
(0)

相关推荐

  • 使用C语言构建基本的二叉树数据结构

    二叉树结构常用的一些初始化代码 #include #include typedef struct Node{ int data; Node *leftchild; Node *rightchild; }Node; /* 初始化一棵二叉树排序树. */ void InitBinaryTree(Node**root,int elem) { *root=(Node*)malloc(sizeof(Node)); if(!(*root)) { printf("Memory allocation for r

  • C语言中经socket接收数据的相关函数详解

    recv()函数: 头文件: #include <sys/types.h> #include <sys/socket.h> 定义函数: int recv(int s, void *buf, int len, unsigned int flags); 函数说明:recv()用来接收远端主机经指定的socket 传来的数据, 并把数据存到由参数buf 指向的内存空间, 参数len 为可接收数据的最大长度. 参数 flags 一般设0. 其他数值定义如下: 1.MSG_OOB 接收以ou

  • 用C语言操作MySQL数据库的通用方法

    在我们的web应用中,虽然PHP.JSP等脚本均提供了MySQL的接口,但是显然直接使用C语言具有更好的安全性和性能,在这篇文章中能够有所体现. 先看结构体: 以下代码块是用来连接数据库的通讯过程,要连接MYSQL,必须建立MYSQL实例,通过mysql_init初始化方能开始进行连接. typedef struct st_mysql { NET net; /* Communication parameters */ gptr connector_fd; /* ConnectorFd for S

  • C语言实现txt数据读入内存/CPU缓存实例详解

    摘要 C实现将txt数据读入内存/CPU缓存的函数,不多说,实现如下. 1. 实现代码 #include "stdafx.h" #include <stdio.h> #include <stdlib.h> int filelength(FILE *fp); char *readfile(char *path); int main(void){ char *string; string=readfile("C:/Users/Joe WANG/Deskto

  • 详解C语言中的char数据类型及其与int类型的转换

    C语言中的char变量 char是C/C++整型数据中比较古怪的一个,其它的如int/long/short等不指定signed/unsigned时都默认是signed.虽然char在标准中是unsigned(因为char类型提出的初衷是用来表示ascii码,ascii码的范围是0~127),但实际情况中究竟是signed还是unsigned取决于编译器. 可通过下面程序判断编译器的默认char类型: void char_type() { char c=0xFF; if(c==-1) printf

  • php读取二进制流(C语言结构体struct数据文件)的深入解析

    尽管php是用C语言开发的,不过令我不解的是php没有提供对结构体struct的直接支持.不过php提供了pack和unpack函数,用来进行二进制数据(binary data)和php内部数据的互转: 复制代码 代码如下: string pack ( string $format [, mixed $args [, mixed $...]] )   //Pack given arguments into binary string according to format.  array unp

  • c语言读取obj文件转换数据的小例子

    复制代码 代码如下: // hello.cpp : Defines the entry point for the console application.// #include "stdafx.h"#include "stdio.h" int _tmain(int argc, _TCHAR* argv[]){    FILE *file1,*file2;    file1=fopen("047facesmall.obj","r&quo

  • linux c语言操作数据库(连接sqlite数据库)

    复制代码 代码如下: #include<stdio.h>#include<sqlite3.h> int select_callback(void *data,int col_count,char **col_values,char **col_name){    //每条记录回调一次该函数,有多少条就回调多少次    int i;    for(i=0;i<col_count;i++)    {        printf("%s=%s\n",col_na

  • C语言读取BMP图像数据的源码

    复制代码 代码如下: /* File name:   bmpTest.c   Author:      WanChuan XianSheng    Date:        Oct 01, 2011   Description: Show all Info a bmp file has. including    FileHeader Info, InfoHeader Info and Data Part. Reference: BMP图像数据的C语言读取源码*/ #include <stdio

  • c语言连接mysql数据库的实现方法

    我这里也有一份网上找到的:/201205/other/C_link_mySql51.rar C连接MySql5.1所需文件.rar 附带一个不错的例子: #include <string.h> #include <stdlib.h> #include <stdio.h> #include <winsock2.h> #include <mysql/mysql.h>/*注意要包含这个头文件*/ #pragma comment(lib,"li

  • 深入解析C语言中常数的数据类型

    废话不多说,上代码 复制代码 代码如下: //编译环境:codeblocks+gcc#include <stdio.h>#include <stdint.h>int Fun(){    uint64_t y;    uint32_t x1, x2; //y = 3000 * 24000000 / 1000;//常数默认作为32位数据,临时运算结果也是32位,溢出错误    //y = (uint64_t)3000 * (uint64_t)24000000 / 1000;//常数强制

  • linux安装mysql和使用c语言操作数据库的方法 c语言连接mysql

    1. MySQL的安装与配置: 在Ubuntu下安装MySQL方法很简单,使用如下命令: 复制代码 代码如下: sudo apt-get install mysql-server 安装的过程中系统会提示设置root密码,此过程可以跳过,但是建议在安装时提示设置root密码的时候自行设置,免得后面设置麻烦.安装结束之后,系统会启动mysql服务,可以使用命令去查看来验证mysql服务是否已经安装成功: 复制代码 代码如下: ps -el | grep mysql 如果mysql服务没有正常的运行,

随机推荐