锐推榜的平衡策略

郑昀@玩聚RT 20091116

一、锐推榜上榜阈值是否需要与Followers数目成正比？

terryxxy建议道：

『如果让我设计 @rtmeme ，被RT者的阈值应该和其follower数成正比，也就是说，名人由于容易被关注，需要更多次的RT才能上榜。就不容易出现这种了 http://is.gd/4VW9X』

terry的意思是，如果一条Twitter消息（下称Tweet）被人们转发次数大于等于某一个阈值（比如6次），那么如果能定位这条消息的原作者以及转发第一人是谁，就可以根据这两个人的Twitter账户被关注人数（或Followers数目），相应地调整上榜阈值。从而得到这样的效果：关注者越多，他的Tweet以及他转发别人的ReTweet上榜越困难。

我的回答是：

锐推榜（含@rtmeme）承担的不只是一两个角色，比如有趣的推，比如尽量早地发现好推，比如推特上热度衡量等等。为了保证有趣，有时候会特地设计一些规则。

但每种规则都会有利有弊。

锐推榜有一个考虑，是尽量在没有成为尽人皆知的热门消息前把好推送到人们面前。上榜与原作者以及转发第一人的关注者数/followers数挂钩，无论是线性还是非线性的，都意味着那些动辄关注者四千到8千乃至一万的中国Twitter用户之大量好推可能永远无法第一时间上榜甚至被忽略，@rtmeme 将把第一时间报道好推热推权拱手相让。

毕竟，锐推榜是机器自动生成的。如果是人在挑选审核，相信会好很多，但那已不是我们的本意。

二、为何有时锐推榜删除转发第一人的评论呢？

锐推榜让一条消息上榜前，通常会把RT最前面的第三方评论删除，否则当后面的人转发rtmeme的消息时连带转发了评论文字，就无法通过锐推的语义信息指纹来合并统计了。抱歉，别无他意。

放在原消息后面的评论是不会删除的。删除最前面的评论，是因为当一轮一轮转发后，机器很难判定真正的消息主体在哪里，从而无法计算信息指纹，无法合并后续锐推，造成转发票数少。这也是Twitter原发式转发统计的困境。如果是新浪微博或Yahoo!meme就不会有此问题。Twitter引入Retweet API后估计会减少此问题的发生。

当然有大量人转发包含转发第一人的包含评论的锐推时，它的语义信息指纹就有可能与上榜原推不一样。此时，机器还会判定两条上榜消息之间的语义相似度，也能阻止相似推上榜。但有时转发者的评论信息含量较大时，也无法阻止二次上榜。

举例：

第一次上榜的：

RT @riku RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦，并在奥巴马朝墙吐了几口口水后达到了高潮。（转发50余次）

第二次上榜的：

RT @duola RT @riku: 人人都有意淫的权利 RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦，并在奥巴马朝墙吐了几口口水后达到了高潮。（转发20余次）

posted @ 2009-11-16 17:39 老兵笔记阅读(1040) 评论(0) 编辑收藏举报

刷新页面返回顶部

锐推榜的平衡策略

一、锐推榜上榜阈值是否需要与Followers数目成正比？

二、为何有时锐推榜删除转发第一人的评论呢？

公告