博客园首页推荐算法
首页是博客园的精华所在,博客园一天有500篇新博文,要是按顺序罗列出来,会浪费大家的精力,如果只是挑选一下相对比较有价值的博文出来,放在首页,无疑也是最大化大家时间价值的方法。
主观推荐是不行的,我们应该用客观的算法去筛选文章,思路就如google搜索网页的原理一样。虽然,博客园的博文数量还在人力范围。
一片文章有没有价值,基于什么样的线索(前提是你没有去阅读内容,不被主观影响)?
第一,阅读点击量。因为博客园的所有博文都在博客园的管理范围内,所以博客园知道那篇文章多人点击。
点击量有个问题,就是如果这篇文章多人点击,可能是里面有一些热门的关键字,而并不是这篇文章自身的价值。
就好像很多欺骗搜索引擎的方法,这里面是填充了关键字。
第二,读者的水准。如果一片文章都是爱因斯坦等人阅读的,自然就可以合理的认为这篇文章是比较有深度的。就类似外链算法,一个页面的价值取决于引用他的人。
但是这些读者很可能是被欺骗进来的。
解决这个问题就是第三点,读者推荐,如果读者被骗进来,他绝对不会点推荐。
但是有个问题,读者可能会懒得点推荐。
重点是如何衡量读者的水平。
可以使用读者在博客园里面的排名。