相信玩过 DOTA 的朋友,都知道 Dendi 这号人物,Dendi 是 DOTA2 的现役职业选手,刀友们评价他“意识好,大局观强,操作犀利,手速极快”。最重要的是,顶尖级选手 Dendi 常常不按常理出牌,对手很难摸清他的路数。
不过,Denbi 再怎么厉害,还是敌不过 OpenAI 的 Bot。人机大战中,OpenAI 的 Bot 不仅取得了胜利,还让 Dendi 彻底崩溃了。Dendi 在比了两场之后就悻悻退出。
对于 DOTA2 人工智能训练的结果表明,如果计算够充分,自我对练可以将机器学习系统的性能从远低于人类的水平推向超越人类。
视频地址:https://v.qq.com/iframe/player.html?vid=j05558jt3dn&tiny=0&auto=0
从不敌高排名选手到击败顶级职业选手,一个月的时间里,人工智能系统持续提升。有监督的深度学习系统,最多达到训练数据集的程度,但在自我对练系统中,随着代理程序越来越好,可用的数据水平也自动提升。
TrueSkill 评级(类似于国际象棋中的 ELO 评级)通过模拟机器人之间的比赛和观察胜率计算,对最好的 DOTA 机器人进行了长时间的记录。从添加新特征并改进到算法到特征缩放,系统的每个部分都有改进。
最惊人的是,能力提升直线上升,随着时间的推移可以指数级地改善这个系统。
随后,OpenAI 团队还在博客中更新了更多技术细节,公开了 AI 打败另外几个人类高手的精彩视频。