《DOTA2》的AI是如何打败顶级职业选手的？

华烂漫

2017-08-19 20:34:17 浏览：0 0

　　会玩DOTA2，又看了今年Ti7比赛的玩家，肯定会对比赛其中一个环节印象深刻。《DOTA2》的N朝元老，NAVI和屠夫双重代言人Dendi作为比赛的受邀嘉宾，在Ti现场与一家人工智能公司特地打造的超级AI，来了场令人窒息的中单SF对决。

　　比赛的结局可能在不少人的意料之中，毕竟这是一场敢于在全球直播中表演的中单对决，只有足以匹敌职业选手水平的AI，才能站在这个全球DOTA2玩家共同瞩目的舞台正中；但整个比赛过程，几乎出乎了所有玩家和职业选手的意料：由人工智能操控的SF并非完全依靠绝对精准的数值计算，而是有所取舍地掌握并运用了拉扯兵线、吸引/取消仇恨、越兵线压制、打断大药，甚至骗补刀消耗这些游戏中的技巧。

这次人工智能是在云端与Dendi进行的对决

　　中单第二局，上一把输掉的Dendi在出兵后选择故意放兵，用进塔策略快速消耗第一波小兵，从而把第二波兵控制在己方坡上的策略，同时也在试探这个人工智能会如何应对。而卡兵出门的人工智能在第一波地方小兵进入一塔视野范围之后，第一时间选择放兵阻止对方进塔。虽然这一举动没能成功阻止Dendi的妙招，但人工智能依然依靠操作和意识，将第二波小兵留在了优势地形，并一步步积累优势，赢得了这场人与人工智能比赛的胜利。这个名叫OPEN AI的超级人工智能的实际表现，征服了众多玩家和职业选手。

　　几乎每个DOTA玩家都有和自带AI交手的经历，但面对这样一个人工智能，每个人都能清楚地认识到，它与以往的那些所谓“AI”完全不同。

OPEN AI

　　与国际围棋棋手对决而声名鹊起的AlphaGo，从属于谷歌DeepMind工作室。这家人工智能领域的明星，接受了业内不少科技巨头的注资，同时担任特斯拉和SpaceX首席运营官一职的著名商业人物埃隆•马斯克也是它的早期投资人之一。它击败韩国围棋冠军李世石后，埃隆•马斯克第一时间发推，赞扬人工智能的发展成果。

　　而在OPEN AI击败了Dendi之后，马斯克在推特上这样说道：“OpenAI第一次在电竞比赛上完胜世界顶级选手，这可比象棋围棋复杂多了”。OpenAI这家非盈利性质的人工智能研究公司成立于2015年，而埃隆•马斯克是正是它的联席主席之一。

　　在2016年12月，OpenAI发布了一个名叫“Universe”的AGI测试训练平台，这个平台的最终目的，是让人工智能像人一样使用计算机。在类型众多、数量庞大的测试项目中，游戏占了相当一个比重，从ATARI2600到近年的网页游戏，甚至其中还包括我们人人都熟知的《GTA》。

　　但回到Ti7上的中单SF对决，一些对这个AI的评价依然抱有争议：人工智能与职业选手获取信息的方式、量级是否相等？人工智能的反应速度、实际操作是否被限制在于人类相同的范围以内？

这些公司的很多游戏都在Universe中进行测试

　　这是个很严峻的问题。如果人工智能是依据游戏后台数据进行分析操作，并运用了远超人类的操作和反应速度优势的话，人类可以说是没有胜算的，这场对决就变得毫无意义。而这些问题，或许可以在Universe这一项目中得到解答。

　　在Universe中，人工智能通过捕捉屏幕像素捕捉信息，并模拟鼠标和键盘进行实际操作，游戏屏幕被分为1024*768个缓冲区。以ATARI2600游戏为例，人工智能在局域网云端观察每秒60帧游戏画面后，存在20毫秒的观察滞后，和10毫秒的行动滞后。而在公共互联网中，帧数降低至20帧，观察滞后80毫秒，行动滞后30毫秒。

　　而人类一般的反应速度是250毫秒，职业选手要更短一些。OpenAI在Dendi比赛结束之后有称，人工智能的实际反应和操作被限定在了人类合理范围以内。

　　可与此同时，另一个问题也接踵而至。在比赛间隙，OpenAI一侧透露人工智能仅仅训练SF中单有两周左右，如此短暂时间里OpenAI已经可以做到击败全球实力水平最高的职业选手，但与此同时，DeepMind的AlphaGo训练《星际争霸2》，却仅仅到了“学会遇到危险飞起基地”的水平。两者究竟有什么不同？

　　近几年来，人工智能得到了长足地进步和发展。现如今已经可以做到看、听、说、甚至学习生成文字、图像、声音，甚至打败围棋世界冠军。但这在人工智能领域中，依然被称作“狭义人工智能”——你可以赋予它某一个特定领域中远超于人类的能力，但它缺乏领域以外的合理执行力：即使AlphaGo学会了如何下围棋，但你无法让它陪你玩其他游戏，它无法应用现有经验带入新的尝试中，只能以不断试错的方式去学习。

　　以一个叫做《Montezuma's Revenge》的ATARI2600游戏为例，这款游戏中玩家需要控制角色，利用各种设施进行移动，并躲避移动的头骨，拿到过关钥匙。人类玩家可以从画面中瞬间识别目标和危险，但是让人工智能去尝试，它无法一眼将头骨视为阻止它过关的威胁只能通过无尽的试错，才能找到正确的通关方式。