最优二叉查找树

给定一个由n个互异的关键字组成的序列K={k₁,k₂,...,k_n}，且关键字有序，对于每一个关键字k_i，一次搜索为k_i的概率是p_i。某些搜索的值可能不在K内，因此还有n+1个虚拟键d₀,d₁,...,d_n代表不再K内的值。d₀代表所有小于k₁的值，d_n代表所有大于k_n的值，对于i=1,2,...,n-1，d_i代表所有位于k_i和k_i+1之间的值。对每个虚拟键d_i，一次搜索对应于d_i的概率是q_i。定义在T内一次搜索的期望代价为E=∑(depth(k_i)+1)*p_i+∑(depth(d_i)+1)*q_i=1+∑depth(k_i)*p_i+∑depth(d_i)*q_i

一颗最优二叉查找树就是期望代价最小的BST。

如果一颗最优二叉查找树T有一颗包含关键字k_i,...,k_j的子树T'，那么这颗子树T'对于关键字k_i,...,k_j和虚拟键d_i-1,...,d_j的子问题也是最优的。

在k_i,...,k_j的子树中，假设k_r(i=<r<=j)是根，那么左子树包含k_i,...,k_r-1,d_i-1,...,d_r-1,右子树包含k_r+1,...,k_j,d_r,...,d_j。特别的，当r=i时，左子树包含k_i,...,k_i-1,d_i-1,...,d_i-1，此时左子树只包含d_i-1；当r=j时，右子树包含k_j+1,...,k_j,d_j,...d_j，此时右子树只包含dj

定义e[i][j]为搜索一颗包含关键字k_i,...,k_j的最优二叉查找树的期望代价，其中1=<i,j<=n，j>=i-1(当j=i-1时子树只有虚拟键d_i-1)，因此1=<i<=n+1,0=<j<=n.

定义w[i][j]=∑p_l+∑q_l

以r为子树的根，有公式：

e[i][j]=pr+e[i][r-1]+e[r+1][j]+w[i][r-1]+w[r+1][j]=e[i][r-1]+e[r+1][j]+w[i][j]

所以，递归公式有：

e[i][j]=q_i-1(if j=i-1) or min{e[i][r-1]+e[r+1][j]+w[i][j]}(if i<=j)

w[i][j]=q_i-1(if j=i-1) or w[i][j-1]+p_j+q_j(if i<=j)

optimal bst

 1 OPTIMAL-BST(p,q,n)
 2      for(i=1;i<=n+1;++i)
 3           e[i][i-1]=q[i-1]
 4           w[i][i-1]=q[i-1]
 5     for(l=1;l<=n;++i)
 6        for(i=1;i<=n-l+1;++i)
 7             j=i+l-1
 8             w[i][j]=w[i][j-1]+p[j]+q[j] 
 9             e[i][j]=INFINITY
10             for(r=i;r<=j;++r)
11                   if(e[i][r-1]+e[r+1][j]+w[i][j]<e[i][j])
12                          e[i][j]=e[i][r-1]+e[r+1][j]+w[i][j]
13                          root[i][j]=r

posted @ 2012-02-09 15:12 Cavia 阅读(967) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

最优二叉查找树

公告