语义,艰难旅程上你所需要知道的
郑昀 20080712
答某位网友的询问。
语义,是一条艰难的旅程。
语义,只能做到一些特定的事情而已,算法的正确率是有限的,到了某种精度后,再提高一点点就需要花费大量的时间和耐性。
但,它是一个没有天花板的空间。
这里水很深,全球高手如云,但一旦进入,就上不封顶,有极大的发展空间。
它绝对不是一个人能做成的事情,需要很多人很多钱很多机器。
每个人都有很多想法、很多思路。
但,不考虑成本是不行的。
所以,我为什么要建议你去研究还活着的语义技术应用较深入的国内外网站,看看他们做到了哪一步,用了几年时间,有多少人。
所以,基于我们团队的创业经验,我对你的建议是:
第一步,想清楚你的模型和思路。
是否符合国外的大的科技发展趋势;
是否能用较少的钱和人力先做出一个模型;
是否能够尽量符合中国用户的使用习惯。
第二步,想清楚你的方案是否对你的个人迫切需求有切实的解决。
这个很重要。如果你自己的原始需求都不能被你的方案充分满足,其他陌生用户更不会满足。
更为重要的是,你这个需求是迫切的,而不是无所谓的、可有可无的需求。
第三步,搞清楚中国或者国外有哪些团队也在做同样的事情。
这个很重要。
你要是搞科研的话,就肯定知道,如果别人不在做这方面的努力,也许说明你的方向是错误的;如果别人都在做努力,甚至是大公司在做研发,那你估计没什么戏。只有说部分的小公司小团队在探索这个方向,大公司只是在预研,才可能说明你还赶上了一个未来潮流。
如果不知道别人在做什么,那你可能总是在做无用功,做出来往往会发现自己是闭门造车。
第四步,如果技术短期内达不到需求,怎么办?
如果你前面的知识储备到位了,
同时又明白自己想要什么样的知识解决了,而不是用现在的Wiki/知识问答、UGC、SNS、Blog等工具就能搞定的,确实需要语义技术,
那么,不需要明白语义算法,只需要提前思考一点:
如果技术达不到你要的效果,你怎么办?用什么来补充、丰富和整理?
第五步,你的钱够吗?在找到能被市场认可的商业模式之前(不是你臆想的商业模式),你的钱能管多久?
语义应用,在中国,现阶段,有点像一个科研任务,更像是导师交给你的一个他也未知如何的方向。那么,用一些方法论,不妨作些调查,做些实验,更能有效率地成就你的梦想,至少比我们活得轻松些。
拉一个你需要仔细琢磨的名单:
国外的:
- Twine
- Powerset / Hakia
- Freebase
- Evri
- Kango / Circos
- techmeme / megite
- Monitor110
- healthline
- TripIt
国内的: