哈夫曼树与集合

哈夫曼树的应用：根据结点不同的查找频率构造更有效的搜索树

最优二叉树/哈夫曼树：WPL（带权路径长度）最小的二叉树

typedef struct TreeNode *HuffmanTree;

struct TreeNode {

　　int Weight;

　　HuffmanTree Left, Right;

};

哈夫曼树的构造：每次把权值最小的两科二叉树合并

HuffmanTree Huffman ( MinHeap H ) {

　　//假设H->Size个权值已经存在H->Elements[]->Weight里

　　int i;

　　HuffmanTree T;

　　BuildMinHeap(H);　　//将H->Elements[]按权值调整为最小堆

　　for (i=1; i<H->Size; i++) {　　//做H->Size-1次合并

　　　　T = malloc ( sizeof ( struct TreeNode ) );　　//建立新结点

　　　　//从最小堆中删除一个结点，作为新T的左子结点

　　　　T->Left = DeleteMin(H);

　　　　//从最小堆中删除一个结点，作为新T的右子结点

　　　　T->Right = DeleteMin(H);

　　　　//计算新权值

　　　　T->Weight = T->Left->Weight + T->Right->Weight;

　　　　Insert( H, T );　　//将新T插入最小堆

　　}

　　T = DeleteMin (H);

　　return T;

}

选取两个最小的元素，排序方法的效率不如堆

整体复杂度为O(N logN)；

哈夫曼树的特点：

　　1.没有度为1的结点；

　　2.n个叶子结点的哈夫曼树共有2n-1个结点；

　　（有2个儿子的结点总数 = 叶结点总数 - 1）

　　3.哈夫曼的任意非叶结点的左右子树交换后仍是哈夫曼树；

　　4.对同一组权值，存在不同构的两棵哈夫曼树，但最优化的值WPL是一样的；

前缀码：任何字符的编码都不是另一字符编码的前缀，可以无二义地编码

用二叉树进行编码：

　　1.左右分支：0，1

　　2.字符只在叶结点上

如何构造一颗编码代价最小的二叉树——哈夫曼树

集合的表示

集合运算：交、并、补、差，判定一个元素是否属于某一集合

并查集：集合并、查某元素属于什么集合，可以用树结构表示集合，树的每个结点代表一个集合元素

双亲表示法：孩子指向双亲

采用数组存储形式

typedef struct {

　　ElementType Data;　　//结点的值

　　int Parent;　　//每个结点父结点的下标

} SetType;

（1）查找某个元素所在的集合（用根结点表示）

int Find ( SetType S[], ElementType X ) {

　　//在数组S中查找值为X的元素所属的集合

　　//MaxSize是全局变量，为数组S的最大长度

　　int i;

　　for (i=0; i<MaxSize && S[i].Data != X; i++);　　//寻找X的下标

　　if (i>=MaxSize)　　return -1;　　//未找到X,返回-1

　　for ( ; S[i].Parent >= 0; i=S[i].Parent );

　　return i;　　//找到X所属集合，返回树根结点在数组S中的下标

}

（2）集合的并运算

　　1.分别找到X1和X2两个元素所在集合树的根节点

　　2.如果它们不同根，则将其中一个根结点的父结点指针设置成另一个根结点的数组下标。

void Union ( SetType S[], ElementType X1, ElementType X2 ) {

　　int Root1, Root2;

　　Root1 = Find(S, X1);

　　Root2 = Find(S, X2);

　　if (Root1 != Root2)

　　　　S[Root2].Parent = Root1;

}

不断union树会越来越高，为了改善合并以后的查找性能，可以采用小的集合合并到相对大的集合中。（更改union函数）可以更改Parent的值，如果集合内有n个元素，Parent改为-n。

posted @ 2020-04-20 17:22 郑NINE 阅读(459) 评论(0) 编辑收藏举报

刷新页面返回顶部

郑NINE

哈夫曼树与集合

公告