02-在 Kuber SocialBadge 基础上再前进一步
郑昀 201005 隶属于《02.技术预研》小节
【注:去年的旧文了。上一篇是《01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social》】
Kuber 的 SocialBadge 能够根据给出的 Email地址、Twitter用户主页地址、Google User Profile地址等得到:
- 此人的 Google Reader Shared Items URL(如果有的话);
- 此人关注哪些人(Twitter、Google Reader等里面的Followings)。
测试连接:
1、我的google profile 链接:http://kuber.appspot.com/social/search?q=www.google.com%2Fprofiles%2Fzhengyun
2、我的twitter链接:http://kuber.appspot.com/social/search?q=twitter.com%2Fzhengyun
在此基础之上,我希望:
1、给定若干高权重的、社会化媒体重度使用者的 Twitter帐号或Google Profile地址;此用户集合我们称之为:TargetUsers。
2、分别获取每个人的关注列表(此人都关注哪些节点(Node)),此用户集合称为:FollowingNodes。合并重复后,得到一个总的节点集合,称之为:WatchList。
3、针对 WatchList 的每一个Node,遍历之:
检查它对应的Web服务我们是否支持。我们目前暂定支持 Google Reader Shared Items、Twitter、delicious(这些都有链接或短消息)。确定该数据是否有权访问。如果对方未开放权限(访问会得到403状态码),就忽略。
异步收集该Node的数据。如果是GoogleReader就收集它分享的每一篇文章。如果是Twitter,就收集它发布的RT消息和带HTTP链接的消息。如果是delicious,就收集它的收藏链接。
4、针对TargetUsers的每一个用户,逐一计算他关注的世界(FollowingNodes)中:
- 大家分享最多的文章或链接,仿照SR的算法;
- 大家转发最多的Twitter消息,仿照锐推榜的算法。
目的是:
- 观察在现有中国社会化媒体使用情况下,个性化计算是否能满足阅读需求。
- 观察对于收集到的社会化媒体重度使用者,他们所关注的世界的热文和热推是否有价值,对于一般用户来说。