锐推榜的平衡策略
一、锐推榜上榜阈值是否需要与Followers数目成正比?
terryxxy建议道:
『如果让我设计 @rtmeme ,被RT者的阈值应该和其follower数成正比,也就是说,名人由于容易被关注,需要更多次的RT才能上榜。就不容易出现这种了 http://is.gd/4VW9X』
terry的意思是,如果一条Twitter消息(下称Tweet)被人们转发次数大于等于某一个阈值(比如6次),那么如果能定位这条消息的原作者以及转发第一人是谁,就可以根据这两个人的Twitter账户被关注人数(或Followers数目),相应地调整上榜阈值。从而得到这样的效果:关注者越多,他的Tweet以及他转发别人的ReTweet上榜越困难。
我的回答是:
锐推榜(含@rtmeme)承担的不只是一两个角色,比如有趣的推,比如尽量早地发现好推,比如推特上热度衡量等等。为了保证有趣,有时候会特地设计一些规则。
但每种规则都会有利有弊。
锐推榜有一个考虑,是尽量在没有成为尽人皆知的热门消息前把好推送到人们面前。上榜与原作者以及转发第一人的关注者数/followers数挂钩,无论是线性还是非线性的,都意味着那些动辄关注者四千到8千乃至一万的中国Twitter用户之大量好推可能永远无法第一时间上榜甚至被忽略,@rtmeme 将把第一时间报道好推热推权拱手相让。
毕竟,锐推榜是机器自动生成的。如果是人在挑选审核,相信会好很多,但那已不是我们的本意。
二、为何有时锐推榜删除转发第一人的评论呢?
锐推榜让一条消息上榜前,通常会把RT最前面的第三方评论删除,否则当后面的人转发rtmeme的消息时连带转发了评论文字,就无法通过锐推的语义信息指纹来合并统计了。抱歉,别无他意。
放在原消息后面的评论是不会删除的。删除最前面的评论,是因为当一轮一轮转发后,机器很难判定真正的消息主体在哪里,从而无法计算信息指纹,无法合并后续锐推,造成转发票数少。这也是Twitter原发式转发统计的困境。如果是新浪微博或Yahoo!meme就不会有此问题。Twitter引入Retweet API后估计会减少此问题的发生。
当然有大量人转发包含转发第一人的包含评论的锐推时,它的语义信息指纹就有可能与上榜原推不一样。此时,机器还会判定两条上榜消息之间的语义相似度,也能阻止相似推上榜。但有时转发者的评论信息含量较大时,也无法阻止二次上榜。
举例:
第一次上榜的:
RT @riku RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦,并在奥巴马朝墙吐了几口口水后达到了高潮。(转发50余次)
第二次上榜的:
RT @duola RT @riku: 人人都有意淫的权利 RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦,并在奥巴马朝墙吐了几口口水后达到了高潮。(转发20余次)