Google 人工智慧打脸 Facebook!AlphaGo 已能打败专业围棋选

收藏:339

Google 人工智慧打脸 Facebook!AlphaGo 已能打败专业围棋选

在 Facebook 创办人兼 CEO Mark Zuckerberg 发文对外宣称将让其发展的人工智慧能在围棋比赛中打败人脑之际,Google 却已经先一步达成目标,而且对外发表的时间还差没多久,看来在人工智慧这环,Google 已完全抢在前头。

训练人工智慧系统最佳的利器就是玩游戏,如此一来,系统就能发展出更聪明且弹性化的演算法,让它更贴近人类的思惟模式。然而,自人工智慧发展几十年以来,科学家所研发的人工智慧系统已能打败许多由人类操作的游戏,却没有办法突破起源于中国的古老游戏─围棋。Google 为了打破这样的迷思,研发出一套人工智慧系统 AlphaGo,期望能跨越围棋对人工智慧发展所树立的障碍。

围棋创立至今已超过 2,500 年,规则虽简单却能有超过 10 的 700 次方种的局面的变化,每一步棋都可能让盘面翻转,下棋的人需要缜密的思虑才有可能赢过敌方,连孔子都曾称讚过下棋的美学。但也因这变换多端的局面,围棋成为了科学家最头痛的桌上游戏,该怎幺研发出够细心的人工智慧系统,打败人类操控的棋局,更是研发中的难处之一。

目前为止,现有的人工智慧系统只能达到与围棋业余等级差不多的程度,专家更认为,至少要花上将近 10 年的时间,才能让人工智慧追赶上并打败专业的围棋选手。Google 更在 27 日在部落格上对外表示,他们将打败围棋专业选手视为一个不可抗拒的挑战,目前正着手研发了一套人工智慧系统 AlphaGo。

这套系统的关键,就在减少原先在搜寻时所佔用的庞大空间,转而变成较能掌握的事情。而为了要能达成这样的效果,AlphaGo 结合最新的树状搜寻技术与两种深度学习网路,其中,每一种网路都有非常多层涵盖了百万种像神经一般的连结。其一深度学习网路称为「策略网路(policy network)」,能够预测下一步并缩小搜寻範围,让接下来的每一步都能朝致胜更迈进。另一个则是「评估网路(value network)」,能减少在树状搜寻时的深度,评估赢家在每一个情况下最好的下法。

AlphaGo 突破了以往的人工智慧系统,演算法又更贴近人类的思惟,Google 不使用 Facebook 研发人工智慧时所运用的蒙地卡罗树状搜寻(MCTS),反而用了机器学习来引领 AlphaGo 的搜寻。透过上述的两种机器学习网络,AlphaGo 比其他系统更能抉择出更好的下一步,引领自己在围棋比赛中胜出。

Google 在训练 AlphaGo 时,先以人类专家下围棋的 3,000 万种步骤训练「策略网络」,直到此人工智慧系统能準确预测 57% 人类下棋的步骤。但 Google 也不以此满足,不达赢过人类玩家的目的永不罢休。为了达到目的,Google 让 AlphaGo 的「策略网络」玩好几千把的围棋,并在这过程中习得自己发现新下棋策略的能力,再搭配强化学习的方式逐渐改进下棋的方式。最后,Google 更骄傲的表示,AlphaGo 目前已能打败所有用树状搜寻所建立的人工智慧系统。

更厉害的是,这个接受过训练的「策略网络」,还能反过来训练 AlphaGo 中的「评估网络」,让它能评估所有围棋中可能出现的局面,进而评估最后的赢家会是谁,颠覆了原本被认为不可能发生的事情。

然而,要想达到这样的结果必须要有非常强大的运算能力,所以 Google 团队更运用了 Google 云端平台,让这些研究人工智慧与机器学习的学者能随时弹性的运算、储存以及取得网路容量。除此之外,有了运用数据曲线图的数字运算新开放原始码资料库,就能允许研究学者在不同的 CPU 和 GPU 上,更有效的支配其学习演算法的运算方式。

而为了证明 AlphaGo 能赢过市面上其他的人工智慧系统,Google 更用它来与其他系统玩游戏,结果证明,即使 AlphaGo 让他们四步还是能赢过所有的系统。除此之外,AlphaGo 还推出了高性能版本,其成效更可以说是无人能敌。

Google 人工智慧打脸 Facebook!AlphaGo 已能打败专业围棋选

Google 製作 AlphaGo 程度图表。

Google 并不以此满足,他们要的是能击败真人的人工智慧系统。于是,他们邀请了曾经赢得 3 届欧洲围棋盃冠军的樊麾与 AlphaGo 竞赛。樊麾自 12 岁起就开始接触围棋,生涯中赢得的奖盃已不可数,更是围棋界中的佼佼者。在 2015 年 10 月 5-9 日进行的比赛中,樊麾却以 0:5 的比数惨败给 AlphaGo,这也成为电脑程式率先赢过专业围棋选手的第一例。

AlphaGo 与樊麾竞赛的影片。

而 AlphaGo 下一个挑战就是要与在过去 10 年间最顶尖的围棋选手李世乭比赛,这场比赛将于今年 3 月在南韩首尔举行。李世乭也很兴奋的接受挑战并表示:「我很高兴我成为能与他对决的选手,但我也很有信心我能赢得这场比赛。」而这绝对将会是一场史无前例的比赛。

Google 也在最后表示,他们很开心能打造出 AlphaGo 这套系统,但他们并不想让它被定位成一个手工打造的专家系统,而是一种藉由纯粹的观赏与玩游戏的方式,运用机器学习让它能改进自己的下棋技巧的人工智慧系统。他们最终想完成的并不只是玩游戏而已,而是要能将人工智慧运用在解决真实世界的问题中,帮助人类解决烦恼。