根据权重随机选取指定条数记录的简单算法实现(C#)【含源代码】

一.应用场景:

    有时我们需要从一些列数据中根据权重随机选取指定条数记录出来,这里需要权重、随机,我们根据权重越大的,出现概率越大。例如广告系统:可根据客户支付金额大小来调控客户们的广告出现概率,客户支付金额越大,其广告出现频率越频繁,例如:加入有10条广告,然后每条广告都有一个权重,我们每次要根据权重选取5条广告出来进行显示。有了需求,我们就进行解决,本文章就是利用一种简单的算法来实现根据权重来随机选取。

 

二.简单算法的实现:

   根据我们需求,上网找了不少资料,都没有找到一种比较适合的方案,就自己想了一个简单的实现方案,试了一下,效果还挺不错的,现在和大家分享分享,有不合理或者错误之处,还望各位高手纠正。废话少说,其实算法很简单,如下:

  1. 每个广告都有一个权重,用W表示。我们假设最小的权重为1,数字越大的权重越高。
  2. 计算出所有广告的权重总和,用SUM表示。
  3. 遍历每个广告,将它的权重W与从0到(SUM-1)的一个随机数(即权重总和SUM以内的随机数)相加,得到新的权重排序值,用S表示。
  4. 根据广告权重排序值S从大到小进行排序。
  5. 根据排序结果选取最前面的几条记录就是我们所需要的结果。

其简单原理如下:

1.假如我们有A、B、C、D四个广告,其权重分别为1、2、3、4,则其总权重SUM=1+2+3+4=10。

2.根据其权重值与一个小于SUM的随机值(由于SUM=10,则随机值范围是0~9)相加,得到一个权重排序值,如下:

广告 权重值 最小权重排序值 最大权重排序值
A 1 1+0=1 1+9=10
B 2 2+0=2 2+9=11
C 3 3+0=3 3+9=12
D 4 4+0=4 4+9=13


3.由此可以得出A、B、C、D的范围,由上面可以看出A是1~10之间的数,而D的范围是4~13,由此可以看出,D得出随机数大的概率比较大。所以我们只要根据其出现概率再排一下顺序,再选取排在权重排序值比较大的前几项即可,这就可以得到我们所需要的根据权重选取概率的广告。

 

三.C#代码算法的实现:

1.首先我们先声明一个权重基础类RandomObject,以后只要继承该类即可。其代码如下:

/// <summary>
/// 权重对象
/// </summary>
public class RandomObject
{
/// <summary>
/// 权重
/// </summary>
public int Weight { set; get; }
}

这个类我们只定义一个Weight属性,其它属性可由继承它的类根据具体业务来实现具体属性。

 

2.创建一个辅助类RandomHelper,新增一个实现根据权重随机选取条数的的函数,其代码如下:

 

    /// <summary>
/// 算法:
/// 1.每个广告项权重+1命名为w,防止为0情况。
/// 2.计算出总权重n。
/// 3.每个广告项权重w加上从0到(n-1)的一个随机数(即总权重以内的随机数),得到新的权重排序值s。
/// 4.根据得到新的权重排序值s进行排序,取前面s最大几个。
/// </summary>
/// <param name="list">原始列表</param>
/// <param name="count">随机抽取条数</param>
/// <returns></returns>
public static List<T> GetRandomList<T>(List<T> list, int count) where T: RandomObject
{
if (list == null || list.Count <= count || count <= 0)
{
return list;
}

//计算权重总和
int totalWeights = 0;
for (int i = 0; i < list.Count; i++)
{
totalWeights += list[i].Weight + 1; //权重+1,防止为0情况。
}

//随机赋值权重
Random ran = new Random(GetRandomSeed()); //GetRandomSeed()随机种子,防止快速频繁调用导致随机一样的问题
List<KeyValuePair<int, int>> wlist = new List<KeyValuePair<int, int>>(); //第一个int为list下标索引、第一个int为权重排序值
for (int i = 0; i < list.Count; i++)
{
int w = (list[i].Weight + 1) + ran.Next(0, totalWeights); // (权重+1) + 从0到(总权重-1)的随机数
wlist.Add(new KeyValuePair<int, int>(i, w));
}

//排序
wlist.Sort(
delegate(KeyValuePair<int, int> kvp1, KeyValuePair<int, int> kvp2)
{
return kvp2.Value - kvp1.Value;
});

//根据实际情况取排在最前面的几个
List<T> newList = new List<T>();
for (int i = 0; i < count; i++)
{
T entiy = list[wlist[i].Key];
newList.Add(entiy);
}

//随机法则
return newList;
}


 

为了适合各个场景,我们定义T是一个泛型类,该类务必继承RandomObject类,实现自己类信息。该方法有相关的注释,这里就不再详细重复描述。

 

特别注意一下GetRandomSeed()这个函数,这个是为了防止在短时间内频繁创建和调用Random时候,会出现重复的随机数(也就是随机不在是随机的问题),其函数代码如下:

 

 

    /// <summary>
/// 随机种子值
/// </summary>
/// <returns></returns>
private static int GetRandomSeed()
{
byte[] bytes = new byte[4];
System.Security.Cryptography.RNGCryptoServiceProvider rng = new System.Security.Cryptography.RNGCryptoServiceProvider();
rng.GetBytes(bytes);
return BitConverter.ToInt32(bytes, 0);
}

 

 

3.调用方法:

调用方法很简单,只需要声明一个自己的实体,集成Object,然后根据实际情况直接调用RandomHelper.GetRandomList()方法即可。

如下:

 

//1.声明一个继承RandomObject的实体类,如:*
public class AdvertEntity : RandomObject
{
/// <summary>
/// 名称
/// </summary>
public string Name { set; get; }
/// <summary>
/// 描述
/// </summary>
public string Description { set; get; }
//...其它相关的字段/属性
}

//2.初始化调用数据,如:
//初始化模拟权重数据
List<Advert> list = new List<Advert>();
list.Add(new Advert { Name = "A", Weight = 1 });
list.Add(new Advert { Name = "B", Weight = 2 });
list.Add(new Advert { Name = "C", Weight = 2 });
list.Add(new Advert { Name = "D", Weight = 3 });
list.Add(new Advert { Name = "E", Weight = 4 });
list.Add(new Advert { Name = "F", Weight = 5 });
list.Add(new Advert { Name = "G", Weight = 60 });
//根据权重随机取指定记录条数
List<Advert> newList = RandomHelper.GetRandomList<Advert>(list, 2); //这个就是用法,newList就是随机取出的记录(第二个参数就是随机取多少条)

 

 

 

 

 

四.测试运行结果如下:

 


 

 

五.附源代码下载:

 点击下载源代码

posted @ 2012-03-22 22:52  刘付灵(Foolin)  阅读(8148)  评论(6编辑  收藏  举报

邮箱:Foolin@126.Com QQ:970026999