document.write('
')

当前位置:   金科网 > 人工智能 > 正文

【独家】阿尔法狗将走入人类生活,发明人首次复盘人机大战

【独家】阿尔法狗将走入人类生活,发明人首次复盘人机大战

金科技注:“谷李”世纪大战硝烟散尽,由此引发的机器学习与人工智能的热潮不减反增。日前,AlphaGo (中文俗称“阿尔法狗”)项目负责人,有着阿尔法狗之父之称的大卫·席尔瓦(David Silver)回到英国伦敦,在母校伦敦大学学院(UniversityCollege London,UCL)一场私密会上复盘了人工智能围棋系统AlphaGo与李世石的5番棋大战,在场的听众被禁止拍照。这也是赛后,阿尔法狗团队的首次半公开复盘。

UCL计算机系是全英计算机排名第一的学院。在UCL计算机系攻读博士学位的中国留学生张伟楠全程参与了这次分享会,并且在会后与席尔瓦进行了面对面的交流。金科技独家约稿张伟楠,根据席尔瓦的分享及会后与席尔瓦的交流,写作此文,席尔瓦也透露了AlphaGo的下一步可能动向以及应用前景。席尔瓦透露,AlphaGo的最新版本自我估分在4500左右,远远超出积分3625的柯洁,实力水平大约在13段左右,人类选手中已然无敌。

【独家】阿尔法狗将走入人类生活,发明人首次复盘人机大战

张伟楠与阿尔法狗之父席尔瓦在交流

两周前的那场人机大战,AlphaGo出人意料地获得了压倒性的胜利,4:1战胜了李世石。棋局进程激烈精彩之处,不亚于那些人类棋手创造的历史名局。

3月24日,回到UCL大学,席尔瓦在复盘中详细讲述了AlphaGo背后的技术原理以及谷李5场比赛的分析。

获得历史性的胜利之后,外界十分关心AlphaGo的下一步和未来,席尔瓦透露,在《Nature》那篇文章引发广泛关注和轰动之后,AlphaGo团队还将再写一篇论文,与外界分享AlphaGo与李世石比赛中的技术进步。

席尔瓦还表示,DeepMind一直希望能够为开发者社区做贡献,他们之前也公布了DQN项目(deep-q-network)的代码——基于深度强化学习的游戏平台。未来他们可能会公布AlphaGo的代码,只要能找到一个合适的方案,但是目前还没有找到。

投入20个人的团队,花费大量的财力去做围棋对弈,对谷歌来说意味着什么?下一步会如何延伸到其他产业领域?

席尔瓦透露,DeepMind今后的着眼点是和人们日常生活息息相关,并可以改变世界的应用,比如精准医疗、家用机器人以及智能手机助手。

AlphaGo之父十年磨一剑

似乎在一夜之间,机器选手战胜了人类最顶尖围棋选手。但是,对于席尔瓦来说,人工智能围棋耗时十几年,最终不过是水到渠成。

作为AlphaGo的幕后团队的技术主管,也是谷歌DeepMind团队最重要的科学家之一,席尔瓦还身兼UCL大学的教职,是该校计算机系的教授,教授“强化学习”的课程。

席尔瓦是在加拿大阿伯塔大学获得博士学位,师从世界上首屈一指的“强化学习”大师理查德·萨顿(Richard S.Sutton)研究强化学习算法,后来在另一座科技圣殿美国麻省理工学院从事博士后研究。

在攻读博士以及博士后工作期间,席尔瓦一直致力于强化学习在围棋人工智能上的研究。到英国UCL大学计算机系执教以后,他还经常拿围棋作为授课的应用实例。  

席尔瓦的课程开始听的人并非很多。三年前,我曾上过他的课程。有一次因故迟到了20分钟,当时的教室里仍然可以找到座位。现在,随着他加入到Deepmind团队,尤其是他掌舵AlphaGo项目名声大噪,他的课程也开始广受欢迎,迟到的人基本上只能站着听课了。 

加入DeepMind之前,席尔瓦即已开始和CEO戴密斯·哈萨比斯(Demis Hassabis)共同研究强化学习。哈萨比斯在UCL拿到了神经学博士学位。两个人都痴迷于游戏, 哈萨比斯少年时曾经是英国国际象棋队队长,在13岁便已经获得国际象棋大师的头衔,青年时自创游戏公司,而席尔瓦则长期对围棋情有独钟。

2014年初,在被谷歌收购之前,DeepMind即开始与UCL洽谈,希望能买断席尔瓦的工作时间。这样可以保留他在大学的教职的同时,还可以让他在DeepMind全心工作。

加盟DeepMind之后,席尔瓦成立了20个人的AlphaGo团队,专门研究围棋人工智能。汇集整个团队的力量,他要求在技术研发的每一个环节上都追求极致。AlphaGo团队成员就透露,有的智能模块在谷歌团队看来已经很完美了,但是席尔瓦却仍认为不及格,离完美还差很远。

长期专注于人工智能与围棋项目,在技术方面追求极致,再加上势大财雄的谷歌的团队配合,最终成就了AlphaGo的骤然爆发。

复盘谷李大战

复盘是职业围棋选手经常做的一件事,他们相信总结过去一盘棋的经验和教训,可以提高自己的棋艺。

AlphaGo团队也做了复盘,通过几张幻灯片的形式,席尔瓦复盘了这5场比赛的胜负关键处,而在场的听众被禁止拍照。