Google会思考的深度学习系统

上周五在旧金山举行的机器学习会议上,Google软件工程师Quoc V. Le讲解了Google的“深度学习”系统是如何运作的。

“深度学习”需要用到大型计算机集群来吸收数据(如图片)对其进行自动分类。Google的Android语音控制搜索、图像识别及Google翻译等均采用了这项技术。

2012年6月,纽约时报曾报道了Google如何通过向“DistBelief”提供数百万份YouTube视频来让该虚拟神经网络系统学习猫的关键特征。这套系统的创新之处在于,它可以在未事先获取“猫的特征描述”信息的情况下自行总结出猫这个概念的特征!也就是说,DistBelief具有自学习能力。当然,这套系统的运算能力也非常的庞大,由1000台机器组成,共包括16000个内核,处理的参数高达1000000000个。

这套系统采用分层机制工作,神经网络的最底层可侦测图像颜色变化,再上一层则可识别特定类型的轮廓。在增加若干后续分析层之后,系统不同的分支会为脸部、摇椅、计算机等对象生成检测方法。

不过令Quoc V. Le震惊的是机器学会了辨认连人类都很难分辨的东西—如碎纸机,我们知道那东西是碎纸机是因为我们见过,但是Google的这台怪物可没见过

Quoc V. Le解释说,学习如何归纳出碎纸机特性是件非常复杂的事情,他自己想了很久也没想出来。

甚至当Quoc向自己的许多同事展示碎纸机的照片时他们也在辨认上遇到了麻烦。反而这套系统的识别成功率更高,Quoc本人都不能确定自己能否写出程序来做到这一点。Quoc解释说,这是因为人需要靠数据而不是自己来归纳特性。

也就是说,这件事情意味着现在Google的研究人员已经无法说清楚究竟这套系统是如何识别出特定对象的了,因为程序看起来已经有了独立思考的能力,其复杂的认知过程是不可预测的,虽然这种“思考”能力仍局限在非常狭隘的范畴。

不过,Google并不指望深度学习系统会自行发展成为一套成熟的新兴人工智能系统。研究总监今年早些时候曾说过

AI(人工智能)会自己产生?我是非常实用主义的—我们得做了才会让事情发生。

不过Google负责AI的Peter Norvig相信,对于可靠语音识别及理解等棘手问题来说,Google采用的此类密集统计数据模型是最好的希望,这点与Noam Chomsky的观点不一致。

深度学习对Google很有吸引力,因为它能够解决该公司自己的研究人员无法解决的问题,还能够让Google少雇一些不称职的人。我们知道,Google以招聘人中龙凤著称。

放权给机器这件事Google以前没少干。像Google众多数据中心的资源管理就是由Brog及Omega负责的。这些集群管理系统能像“生物”一样分配工作负载。

考虑到Google的抱负是“组织全世界的信息”,当然是雇用的人越少越好。Quoc说,通过开发这些“深度学习”系统Google可以少雇一点人类专家

他补充道:

机器学习是很困难的,因为哪怕从理论上来说可以运用逻辑回归等算法,但实际上我们在数据处理挖掘特性等事情上花费了大量时间。每一个问题都得雇用领域专家。……所以Google希望机器能做那些事情。

通过努力工作,赋予机器更大的能力,以及局部的、有限的智能,Google可解决人类专家无法解决的分类问题。会不会发展成天网呢?答案是否定的。但它可以发展成专家型机器。幸运的是,机器目前还是合作的。

posted on 2013-11-20 09:17  毛小娃  阅读(153)  评论(0编辑  收藏  举报

导航