什么是集体智慧?

什么是集体智慧

What Is Collective Intelligence?

人们使用集体智慧这一术语已有十多年之久,随着新型通信技术的出现,这一术语也变得日趋流行和重要。尽管这样的表达也许会让人联想到群体意识或超自然现象,但当技术人员使用这一词汇时,其含义通常是指:为了创造新的想法,而将一群人的行为、偏好或思想组合在一起。

当然,集体智慧的出现可能要早于Internet。为了从全无关系的一群人中搜集、组合和分析数据,我们不一定要借助于Web。完成这项工作的一种最为基础的方法,便是使用调查问卷或普查。从一大群人中搜集的答案可以使我们得出关于群组的统计结论:组中的个体成员将会被忽视。从独立的数据提供者那里得出新的结论,是集体智慧所真正关注的。

这里有一个众所周知的例子,是关于金融市场的。在金融市场里,价格并不是由某个个体或某种协作力量所决定的,它是由许多独立个体的交易行为所共同决定的,所有人的行为都建立在这样一种信念基础之上:他们相信当前的交易会为他们带来最大的利益。尽管乍一看这似乎违背直觉,但在未来的市场上,大量的参与者都是根据他们对未来价格的信心而进行契约交易的,这样的市场在价格预测的效果方面,往往被认为要比独立进行预测的专家们表现得更好。这是因为,市场将知识、经验和成百上千人的意志组织在一起,形成了一种不依赖个人观点的预测。

尽管寻求集体智慧的方法在Internet之前就已经存在,但自从有了Internet之后,从数千甚至数百万网民中搜集信息的能力为人们提供了许多新的可能。一直以来,人们都在利用Internet来购买所需、搜索信息、寻求娱乐,以及架设自己的Web站点。所有这些行为都可以得到监控,并且不必要求用户放下手头的工作来接受询问,而可以借由监控得到的信息提取出有价值的结论。有大量的方法可以用来对这些信息进行加工和解释。这里有两个重要的例子,分别体现了两种彼此对立的做法。

l   Wikipedia是一个在线的百科全书,它完全是由用户维护的。任何人都可以新建或编辑网站上的任何一个页面,同时会有为数不多的几名管理员对一再出现的不当内容进行监控。Wikipedia拥有的词条比其他任何百科全书还要多,尽管存在一些恶意用户的操作,但是人们普遍认为,Wikipedia的大多数主题都是准确的。这便是集体智慧的一个例子:因为每一篇文章都有大量人员在维护。而其最终的结果,则形成了一个任何单一协作团队都无法企及的大型百科全书。Wikipedia软件并没有对用户贡献的内容进行特殊的智能处理,它只跟踪内容的变更情况,并显示最新的版本。

l   前文提及的Google,是世界上最为流行的Internet搜索引擎,也是第一个根据其他网页对当前网页的引用数多少来评价网页等级的搜索引擎。这种评价等级的方法,搜集了数以千计的人对某一页面的评价信息,然后利用这些信息对搜索结果进行排序。这是集体智慧的一个非同寻常的例子。Wikipedia明确邀请网站的用户提供内容,而Google则是从Web内容的创建者对自己网站的操作中提取重要的信息,并利用这些信息为Google的使用者设定各个网站的分值。

虽然Wikipedia是一个巨大的资源库,而且也是展现集体智慧的一个令人印象深刻的例子,但它的存在很大程度上要归功于提供内容的用户,而非软件中的那些智能算法。本书的焦点并不在于提供内容的用户,而在于算法,这其中就包括了GooglePageRank算法,该算法会搜集用户的数据,对数据进行计算分析,并从中创造出可以增强用户体验的新信息。在获得的这些数据当中,有一部分是明确搜集而来的,比如向用户询问与评价网页级别相关的问题。另一部分则是偶然搜集得到的,比如观察用户的购买行为。对于这两种情况,重要的不仅是搜集和显示信息,还包括以一种智能化的方式对这些信息加以处理,并产生出新的信息来。

《集体智慧编程》一书将告诉你如何利用开放的API来搜集数据,同时还会讨论到各种机器学习算法和统计方法。将二者结合起来,就可以借助集体智慧的相关方法,对由自己编写的应用程序搜集得到的数据进行分析;同时,也可以从其他地方搜集数据,并对数据进行试验。

摘自《集体智慧编程》(英文原书名:Programming Collective Intelligence: Building Smart Web 2.0 Applications

 

 

围炉取暖话“创业&升职”,请看《走出软件作坊》;

围炉取暖话“求职&面试”,请看《编程之美——微软技术面试心得

posted @ 2009-01-08 19:44  博文视点  阅读(1076)  评论(0编辑  收藏  举报