摘要:
仿照Technorati的 Popular频道,电影、音乐、书籍的博客影响力榜单终于在玩聚新页面上体现了出来,以后每天都可以看到最新的榜单自动计算并展现了。
Technorati的做法是,计算过去24小时内,计算链接指向IMDB某部作品的数量,从而获知电影、音乐、博客、视频、新闻的流行程度。
而我们在中国嘛,所以没有什么人会在博文中说自己看了某部电影,竟然会贴出指向豆瓣或者VeryCD的链接,所以只能通过语义计算啦。
有人问了,那整理一个电影、音乐名列表不就完了,然后自己去做博客搜索,这需要什么语义技术啊?要是这么easy,我们还玩什么文本挖掘啊?就是要一切无风自动,文本挖掘引擎自己从每天抓取到的数以万计篇文章中自动识别出潜在的电影、音乐/歌曲、书籍,而不需要人工告诉机器哪些词语是电影,并自动统计出博客引用次数。
阅读全文
摘要:
China Web2.0 Review7月22日讲到了我们玩聚(Onejoo: Memetracker in China),从叙事逻辑上看,算是很懂memeTracker的了,我于是在下面留言说了我们的在第一阶段的第一回合构建的最新进展。我和张俊林张博士从去年9月到现在已经努力了11个月了,时间很长了,左冲右突之下,也算是积累了坚实的文本挖掘技术基础和较高的壁垒。《中国的克隆公司能够引领创新吗?》论述了善于克隆的中国公司应该如何处理用户量与技术支持比例的问题,我们过去也一直在致力于解决这些问题,当然我们考虑的还不是访问网站的用户量问题,而是如何针对数以百万计的博客甚至是数以万计的论坛、数以万计的新闻源进行实时的大规模文本挖掘计算,并且以某种方式找到万事万物之间的关系。 阅读全文
摘要:
这两天公司年会上我讲了一些东西,是我一直在Team building中强调的,也是这几年来我个人作为一个软件人的理解和执行的战术,:D,不是战略。分成两个命题:“why is each of us here”和“how about your career”,但实际上是一个层面的。
下面分享这个幻灯片,如果你发现这些图片似曾相似,那要感谢M Blogin’给我们推荐的“如何写完美的幻灯片”和Arvetica、flickr。 阅读全文
摘要:
这些日子,不单单注意到那些新锐网站,比如MyLifeBrand 、Throof、很像大众点评网的Yelp,还看到那些人们曾经认为不够酷的旧势力们卷土重来,比如AOL的一系列动作,CNN的redesigned version,USA today的三月份重构,News.com.com的Big Picture,都大量地吸收了流行的、酷的元素。
“STILL around after all these years and STILL thriving”,这句话准确描述了人们看到这些重构动作的感受。他们终于都回来了! 阅读全文
摘要:
这么说吧,创业者为坚持付出了时间成本,坚持到什么时候为止,谁来做出判断?不还是身在局中的创业者自己吗?很少有人能够为创业者指出该坚持还是该转型。即使指出了,往往又演变成了“事后推导”。及时转型干成了就是壮士断腕,干不成就是没有恒心。
这使得我们又回到创业的本原问题上:我们为什么要创业?我们为什么要做出这种选择?是什么把我们逼到墙角非要做出坚持还是放弃的选择呢?
阅读全文
摘要:
ZapTxt的提醒姗姗来迟,都已经设定了半个月了,才终于给我送过来一篇Alert。
我在上一篇《个性化阅读的过去和未来【一】》中提到:“Zaptxt,也是同样的思路,搜索范围也是非常广,从你指定的RSS Feed、新闻站点到招聘贴士,只要符合你的关键词,就可以筛选出来以某种方式投递给你。既可监视你的Feed列表,也可以专门监视特定网站。”
阅读全文
摘要:
Connections Engine,是大势所趋,无论你是用人工做,还是机器做,都必须能够揭示出不同事物之间的关系。雷鸣的酷我早已经在这方面迈出一大步了,揭示了不同明星之间的关系甚至是远近程度,是国内Topic的先行者。
我们的尝试是基于过去大半年累计下来的数以万计的热点(不是文章,而是每天各个领域的主题自动聚合,社会的、娱乐的、财经的、电影的等等),经过自动分析而展现出来的这两种关系:
热点故事与人、组织之间的关系,具体的例子:刘德华被封杀,红楼选秀法律问题;
人、组织之间的关系,具体的例子:刘德华,陈晓旭,雅虎。
我们称之为“关联点”,一个技术性很强的术语。你可以在不同关联点、热点故事之间导航,看到他们为何有关系。每一个关联点就是一个Topic,这样把历史上所有的热点做了一个自动整合,形成了Topic Engine。这种Topic Engine就有点类似于搜索引擎的整合搜索,把某一个人物的搜索结果条理化、主题聚合化,使得人们阅读的时候直接看到事件、看到热点,而不是一篇一篇一页一页的孤零零需要人脑处理的资讯文章。 阅读全文
摘要:
也希望我们在这个学习创业的过程中,能够既动手也动脑,象袁岳说的“当然如果动手者还擅长动脑,或者动脑者还擅长动手动脚则可蒙受上帝特别的祝福,但在这里最不可缺少的是行动,一切知识的真正创新和进步与行动而不只是思想本身密切相关。”
其实,我也是2005年就想做这件事了,但那时候因为移动数据领域的经验蛮多的而就是没做过互联网业务,所以瞻前顾后,呆在神州泰岳做了一年飞信。那么现在既然已经下决心动手开始做了,那就要知道“动手需要主意、勇气与行动本身,与思想相比,动手有更高的成本,也因为实际的行动要牵涉影响周围的环境,而需要与此相应的社会调适能力,动手因会引起一系列与此相应的后果而需要去面对”! 阅读全文
摘要:
那么是否可以存在一个服务,象watchmojo所说的那样(News is Still a Wide Open Game),兼容并蓄,囊括编辑模式、机器智能模式、群众智慧模式,杀入新闻聚合服务领域呢?
对此,Google黑板报有一个注脚“Larry Page说,搜索就是发现内容…,而维基百科发现了一个更好的方法来组织信息。他似乎很喜欢这种同时使用人力、流程和机器的模型。所以这是另一项证据,表明谷歌正敞开胸怀,寻求可扩展的方法来利用人的力量。”
watchmojo给出的答案是“Topix + TechMeme + Digg”。
你的呢?
阅读全文
摘要:
你是否每天经常访问许多站点,来跟踪你感兴趣的新闻或博客?
你订阅的Feed是否每天都有太多太多的文章,根本读不过来?
你需要保持敏锐的触觉,但它是不是花费了你太多时间?
阅读全文
摘要:
离开了读者的主动参与,digg仅仅是一个空中花园。
而玩聚(OneJoo)本身就有爬虫四处搜集中文博客世界和论坛世界的文章,抓回来后用文本挖掘算法计算出热点话题以及时间脉络,在没有用户参与到玩聚(OneJoo)网站内容建设之前,已经每天能够量产各个领域的成百热门话题了,以此来吸引读者。然后才来用互动手段争取那10%的参与者留下来,并刺激89%的潜水者浮出水面。
玩聚(OneJoo)已经靠自己把棍立起来了,并且涂上了蜂蜜,剩下的事情就是召唤蚂蚁们找到它们感兴趣的棍了,然后进一步允许蚂蚁们自己立棍,玩聚帮他涂上蜂蜜。而digg提供了一个场子和比赛规则,希望用户把棍立起来。在原始积累期间,玩聚(OneJoo)的做法更有竞争优势。
阅读全文
摘要:
由于以下三大原因,在中国,玩聚(OneJoo)将在信息过滤器上超越techmeme的成就:
第一点,techmeme、tailrank们一旦算出一个话题,就此“凝固”,成为历史的一部分。既不会随着事件的不断演变而话题自生长,也不会随着历史人物的不断成长而围绕着这个人物而生长出不同的话题。人们看过一个话题之后,很难再次光临这个话题页面。
而玩聚则致力于解决“时间脉络”问题。
第二点,techmeme监控的是数以万计的精英博客以及新闻媒体,而在中国,各个领域中都藏龙卧虎,玩聚则致力于监控大多数有价值的中文博客,几百万甚至未来上千万的长尾。
第叁点,互动,还是互动,围绕话题,形成社区氛围,通过暗示、激励增加人们的参与度!
阅读全文
摘要:
2006年3月,我开始寻找符合中国特色的meme engine之路,很快发现只有文本挖掘算法才能做这件事情。
博客内容的文本挖掘,在中国还有一个大问题要解决。博客比新闻要复杂得多得多。2006年9月,我和中科院软件所的张俊林张博士等一起创建了玩聚网,瞄准信息过滤器和人过滤器的未来大方向。 阅读全文
摘要:
玩聚,一直在路上,朝着成为中国的 techmeme并超越techmeme进一步成为互联网用户的信息过滤器的方向稳步前进。
我们上星期再次优化了互联网热点新发现算法,确实精度提高了很多,可以从爬虫抓取到分类到输出热点整个流程不用任何人工不用编辑审核就直接放出来给普通用户看了。
现在6月8日、10日、11、12、13日这五天的热点就是高精度算法的结果,已经非常准了,目测比以前精度高了两倍到三倍。
敬请观看玩聚实验室效果:
http://www.onejoo.com:8000/
阅读全文
摘要:
1:
Web的趋势是什么?
SecondLife又代表了什么先进文化?
那就是人。。。真实的有灵魂的人。。。而不是死气沉沉的地图、搜索(包括垂直搜索)、视频、聚合、RSS。
把地图、搜索等应用变成有灵魂的,还需要再下点功夫啊!
“这正是Web 2.0 与 1.0之间的重大差异,然而却很少被提及。 1.0试图满足的是人类的「工具性需求」,而Web 2.0 试图满足的却是「心理性需求」,一种看不见摸不透却实际存在的需求。” 阅读全文
摘要:
老师随后自己给出了答案:请大家把电磁学当成一门思想修养课。
请大家领会先哲(一连串显赫的名字,麦克斯韦、法拉第等等)在解决问题时的思路和路径选择。
在科学道路上,有三种人。有指兔子的,大手一挥,指明兔子在何处。有猎人,向着兔子的方向行进并开火。有猎犬,把兔子捡回来。老师告诫我们,我们应该争取成为猎人,甚至是指兔子的人。
对此番谈话,我记忆深刻,未敢忘记。 阅读全文
摘要:
假定发掘粒度这个词,sayonly指三种含义:
发掘出你可能感兴趣阅读的人;
发掘出你可能感兴趣的主题【可能你知道这个主题,也可能你还不知道它的存在,比如新热点,比如久远的主题】
发掘出你可能感兴趣阅读的文章。 阅读全文
摘要:
今天去东四环的百盛,5层是小吃排挡。
由于上次去过,了解历史,所以,特地观察了一下新开业的商铺的销售情况。
作为一个局外者,发现整体设计者存在很多问题,可以归纳为“产品路径”问题,导致公平问题。
问题1:
不像大多数购物天地的小吃排挡的设计,兑换消费卡的柜台本应该每一个入口各自一个。百盛错误地把收银台放在了一个入口边,导致从电梯上来的顾客总是被暗示左转进入消费区,从而导致左手的大厅生意多;
这就是常说的入口问题。
为什么51.com说首页列出的用户列表不应该有头像,就是因为如果用户张贴头像并显示在推荐列表,就会导致大量的点击流向那些头像暧昧或者美女头像的用户,从而造成不公平,从而间接驱逐不被重视的用户。 阅读全文
摘要:
作为一个工作6、7年的人,我的观点是:
刚工作1~3年的,考虑换工作的三个考虑是:第一,是否有上升空间;第二,是否有上升空间;第三,还是是否有上升空间。
钱,不是问题。公司的未来发展不是问题,当然如果他能高速发展上市,你就能提前若干年成为百万、千万富翁,但这不是主要矛盾。
有什么人带你或叫做“跟对人”,是一个较为重要的问题,但还是不如“是否有上升空间”这么重要。
即使没有跟对人,假如你有上升空间,也可以考虑。
因为跟对人很难。
但保证自己有上升空间相对容易。
可以广义地理解什么叫做“有上升空间”:
1:你是否有独当一面的机会;
2:你是否有掌控某一个有前途的业务的机会;
3:你是否有升职的机会;
4:你是否有建立人脉的机会。 阅读全文
摘要:
“这就是大略。”
“还要跟那些成天泡在中国互联网市场的“土人”们竞争?靠什么竞争?靠电子邮件?靠新闻稿?靠美金?靠什么靠?”
“精英和文盲,谁强奸谁都不对,但是大部分时间,他们和法国蜗牛的交配过程是一样的,以胜负定公母。” 阅读全文