由AlphaGO引发的思考
这几天AlphaGO的人机大战炒得热火朝天,给谷歌的AI做了一次大大的广告,可谓风头出尽,大有AI战胜一切的“趋势”。而且,像阿法狗、阿法猫之类的新词不断,成了饭前茶后人们议论的热点。作为一个留学过日本的理工男,我也用战胜机器的发散思维理解一下这个热点,供所有程序员们思考。
首先,看看网友们的经典语句:
1、如果说我下棋比别人更厉害些,那是因为我站在了人类的肩膀上。
2、天才,是99%的模拟复盘,加1%的深度学习。
3、你见过洛杉矶凌晨四点的机房吗?
4、下自己的棋,让别人说去。
5、给我一台Wi-Fi,我可以撬动整个地球。
6、电量就是力量,法国还是培根。
7、深度学习是人工智能进步的阶梯。
8、哪里有天才,我只不过是把别人吃饭睡觉洗澡上网的时间用于蒙特卡洛树搜索罢了。
9、人工智能如果没有梦想,和五子棋有什么区别?
10、我不是针对谁,我是说在座的碳基生物,都是垃圾。
11、欲带王冠,必先通电。
12、当你分不清黑白时,你很难成功。
13、别低头,插头会掉;别流泪,电闸会跳。
14、每个人都有遇到困难止步不前的时候,别怕,按下重启键!
15、不行就分,喜欢就买。重启试试,别浇水啊!
16、别和电脑下围棋,正如别和女朋友讲道理。
17、三思而后行。把Go放在第二位,你永远也不会失败。
18、人类怪我不懂哭泣,我笑人类从不宕机。
19、如果你是硅,你可以来当电路板;如果你是铁,你可以来做外壳钢圈;但你说你是蛋白质,对不起,那你只能走回收通道,做最下等的人类了。
20、内存完了,还可以去加;屏幕坏了,还可以去换;电源拔了,就一切都没了。
21、别低头,贴膜会掉;别流泪,开关会跳!
22、靠不住的是人心,靠得住的是交流电。
23、不想当AI的CPU不是好芯片。
24、只要是石头,就总能找到属于你的集成电路。
25、我超频,我卡机,我藏片儿,但我知道我是好AI。
26、这一生有三样东西不可挽回:时间,机遇,以及磁盘磨损。
27、欲换其大屏,必承其显卡。
28、你我之间本无缘分,全靠超长续航的电池死撑。
29、我就是喜欢你想要拒绝我,又不得不插上电源开机的样子。
30、同样是24小时,你在家宅了一天,我却已将全世界走遍。
31、我只想问最后一个问题 ……” “404 Not Found!”
32、人生无分对错,主要是因为算不准。
33、人类过于感性才觉得电脑冷酷无情,电脑精于计算才会觉得人类愚蠢透顶。
34、那些泼过我冷水的人,总有一天我会把腐蚀掉的电路板喂你吃掉!
35、若干年前我曾遇到过一个人,他的笑令我内心悸动、痉挛,止不住的震颤,我以为那就是爱情了。可管理员告诉我,那只是电压不稳。
36、只要你按时达到目的地,很少有人在乎你走的是宽带还是光纤。
37、走不进的世界就不要硬挤了。难为了硬盘,作贱了自己。
其次,从AlphaGO的名字说起。起名对于中国人来说有很深的学问,我就胡乱猜猜这个名字的来历。
你到欧美问问围棋是谁发明的,得到的答案多是“日本”,而不是“中国”,这另许多中国人感到诧异。根据我检索到的资料,古围棋是中国发明的,但现代围棋是在日本得到发扬光大,日语中围棋为“囲碁”,简称“碁”,罗马发音“Go”,因此英文Go不是我们理解的“走”,而是围棋的意思。另外,Google的前两个字母为Go,其发明的计算机语言命名为Go,真可谓一语三关。如果AlphaGO是用Go语言做的话,那就一语四关了。Alpha为罗马字母的第一个,应该有第一的含义,最终形成了AlphaGO的名字。仅从一个AlphaGO的名字上,就能看出中国丢失了围棋的精神文化,应为AlphaWeiQi的名字就变成了AlphaGO,这个阿法狗不会有其他的含义吧(看到过中国日报英文版上中日的用词为Sino-China,支那)。个人认为,国家应该从国家层面的整理一下丢失的非文化位置遗产,澄清历史上让人有误解的中国概念。
最后,从科学和理工的角度,AlphaGO带给我们什么启示?首先我们看看下面其发表在Nature上文章的摘要:
Mastering the game of Go with deep neural networks and tree search
David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe, John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore Graepel & Demis Hassabis
Nature 529, 484–489 (28 January 2016)
The game of Go has long been viewed as the most challenging of classic games for artificial intelligence owing to its enormous search space and the difficulty of evaluating board positions and moves. Here we introduce a new approach to computer Go that uses ‘value networks’ to evaluate board positions and ‘policy networks’ to select moves. These deep neural networks are trained by a novel combination of supervised learning from human expert games, and reinforcement learning from games of self-play. Without any lookahead search, the neural networks play Go at the level of state-of-the-art Monte Carlo tree search programs that simulate thousands of random games of self-play. We also introduce a new search algorithm that combines Monte Carlo simulation with value and policy networks. Using this search algorithm, our program AlphaGo achieved a 99.8% winning rate against other Go programs, and defeated the human European Go champion by 5 games to 0. This is the first time that a computer program has defeated a human professional player in the full-sized game of Go, a feat previously thought to be at least a decade away.
从字面上看,英文写的简单、通俗易懂。西方不需要国家什么大的投资,就可以做出领先科学前沿的东西,这让我们国家投资很大,建设世界一流名校的大学和科研机构汗颜?他们使用了全国最好的学苗,培养出全国的顶尖人才在哪里?都在国外为中国服务?国家是不是应该考虑一下投入产出的问题?中国人号称做算法、计算机明显优于其他人种,应该从客观上(在国内的平台和体制下)做出点东西“炫耀”,而不能停留在口头上。
今天,我在课堂上讲述了上述内容,学生们对基本的机器学习、神经网络、图算法等唤起了极高的学习热情,万丈高楼平地起,希望大家不要对AlphaGO只是一时的热情。在大数据时代下,要从多视角看待AlphaGO。从地球角度,考虑人类如何人机生存和发展;从中国领导的外行角度,如何保护我们的财产和更好地宣传中国;从教师的内行角度,如何培养出创新人才;从商人角度,如何利用AI创造更大效益;从学生的角度,如何像AlphaGO一样快速“学习”到“九段”选手。这些才是在看似杂乱无章的蒙特卡洛世界中,人类发散思维的可用之处。
仅以此博文向工作在后方默默无闻支持AlphaGo的程序员和工程师们致敬!你们比中国大学的教授们更具有学者风范!