遗忘海岸

江湖程序员 -Feiph(LM战士)

导航

算法备忘录---按权重选取数据

今天看到一段Javascirpt 代码,其功能是按数据权重(weight)来显示广告.
基本算法描述如下:
给每个数据(节点)指定一个权重.
1.将各节点的权重求和得到总数sum.
2.采用随机函数(js中为 Math.round(Math.random() *sum) )生成一个取值范围在[1~sum]之间的值ranSum.
3.接着遍历所有数据(节点),访问顺序可以随意.将当前节点的权重值加上前面访问的各节点权重值得curSum,判断curSum >= ranSum,如果条件成立则返回当前节点,如果不是则继续累加下一节点. 直到符合上面的条件,由于ranSum<=sum 因此一定存在curSum >=ranSum.

说明:
假设有这么一组数据: A4,A5,A3,A1,A2 其对应的权重为 10,20,40,20,10 现在我们要从这5个值中按他们的权重取数据,
那么每100次取值应该有10次能取到A4,40次能取到A3等等,现在根据下面的表示,并考虑上面的算法
0--A4---A5------------A3-------A1--A2>100
每次取值时的遍历操作按A4,A5,A3,A1,A2的顺序访问,按上面的条件,ranSum的范围应该在1-100,对于A4按上面的算法在ranSum取1-10时都符合条件,因此每100次取值应该有10次被取到的机会,对于A3它的范围应该是31-70(a4+a5,a4+a5+a3),那么ranSum为31到70之间数值的可能性为每100次里有40次.由上面过程我们可以看到数据被获取的概率只跟其权重有关,跟算法中数据访问顺序无关.

代码(C#伪代码)
class Node
{
  public int Weight=0;
  public string Data;
}

public Node GetNode(IList<Node> nodes){
 int sum=GetSum(nodes);
 int ranSum=GetRandom(sum); //获取1到sum之间的随机数
 int curSum=0;
 foreach(Node node in Nodes){
    curSum +=node.Weight;
    if(curSum >= ranSum) return node;
 }
 return null;
}


posted on 2007-12-14 14:36  遗忘海岸  阅读(1196)  评论(0编辑  收藏  举报