年初,谷歌的alphago震惊全球,关于人工智能的讨论达到了顶峰,击败了最优秀的人类棋手。这个传奇事件其实让很多人高估了人工智能的威力。之后有很多消息说阿尔法狗要挑战星际争霸2,人工智能即将击败职业玩家。
今年3月,很多中国媒体甚至报道了暴雪娱乐制作总监蒂姆·莫滕(tim morten)亲自确认alphago将在wcs中国站决赛中挑战星际争霸2。
这个消息有两个疑点:一是几乎没有国外媒体报道alphago对星际争霸2的挑战;第二,也显示alphago的名称。这只是一个由deepmind为go专门培训的人工智能项目。如果挑战星际,应该不是这个名字。更准确地说,是《财富》当时报道的:deepmind首席执行官德米斯·哈萨比斯(demis hassabis)表示,《星际争霸》是一个正在考虑的有趣挑战。
现在,deepmind和星际之间的绯闻终于可以实现了。deepmind的工程师Oriol vinyals在公司博客上宣布,暴雪将与deepmind合作,使星际2成为人工智能和机器学习的研究环境,并在明年第一季度向所有人工智能研究人员开放该环境。也就是说,就连deepmind的人工智能也刚刚开始学习星际争霸2。
奥里尔·温雅斯年轻时是西班牙顶级星际争霸玩家。他坦言要打败人类职业选手,我们还有很长的路要走。
与回合制围棋不同,星际争霸是一个即时战略游戏,玩家需要从三个种族中选择一个来玩,每个种族都有不同的优缺点。对于人工智能程序来说,快速响应不同的情况并为战争情况制定长期计划是一个非常困难的挑战。
alphago在和李世石对战时,借鉴蒙特卡洛树搜索算法,对下一步可能的最优解进行评估(可以排除一些不利的可能性),以减少搜索深度。即便如此,拥有超强计算能力的alphago还是需要很长时间去思考。
另外,与围棋不同,在星际争霸中,人工智能可以从对手那里获得的信息是有限的(比如游戏中未探索区域的战争迷雾,对手看不到情况)。
你可能会想到星际争霸自带的ai,也就是电脑玩家。其实它的工作机制和现在的人工智能完全不同,因为游戏中的ai直接从游戏代码中获取信息,可以同时给所有单位下达指令,即使有些单位不在屏幕上。与人类玩家相比,就是作弊。
deepmind和暴雪的目标是训练一个遵循规则,能和人类玩家竞争的ai系统。
所以deepmind会配合暴雪改善游戏环境。新的游戏界面将星际争霸2的游戏画面简化为基本的视觉图形(如下图),便于机器学习系统更好的学习。当然,这意味着人工智能系统是基于视觉而不是直接读取游戏数据做出决策的,这和人类玩家完全一样。
此外,暴雪还会提供游戏回放,供人工智能系统学习。
暴雪和deepmind都知道AI要打败顶级职业电竞选手还很遥远。但是,就像alphago在很多人不看好的时候战胜李世石一样,这一天很可能会比大家想象的来得更早。当然,deepmind的终极目标是解决现实生活中的问题,而且相比于Go,星际争霸2是一个更接近现实世界的环境。
标题:【游戏产业】《星际争霸2》将成人工智能学习研究对象52pk新闻中心
地址:http://www.gdgzch.com/new/11770.html