经过7万小时训练后，AI学会了玩《我的世界》

更新时间：2022-06-29 12:12:38作者：佚名

AI击败末影龙指日可待。

2019年，为了研究分析AI与儿童的智力差距，一群世界顶级科研人员在卡内基梅隆大学和微软的共同资助下举办了一场名为“MineRL”的比赛，以知名游戏《我的世界》为舞台，让接受训练的AI在限定的时间内寻找游戏中的稀有物品——钻石。

考虑到一位普通儿童在观看10分钟的教学视频后便能自主游玩《我的世界》，这项挑战在外行来看似乎并不是很困难，但事实是，参赛的AI们在长达4天的限时挑战里执行了超过800万次操作之后，仍未能顺利达成目标。

在这之后，MineRL竞赛成了一年一度的科研项目，每年都会有不少探索AI前沿技术的学者带着他们精心调教的AI来《我的世界》里挖钻石。而去年的MineRL大赛更是吸引了海内外近60支队伍参赛，超过400名研究人员同台竞技，其关注度可见一斑。

而到了最近，知名AI科技公司OpenAI终于实现了技术突破，提前杀死了比赛。根据他们于6月23日发布的论文来看，由他们训练的AI已经做到了熟练游玩《我的世界》，挖钻石对他们家的AI来说早已不在话下，毕竟它目前已经掌握了只有人类才能领悟的高阶玩法：

为了让AI真正做到像人类一样“玩游戏”，OpenAI的研究人员引入了一种新颖且便捷的AI训练法：视频预训练（Video PreTraining）。他们通过从相关合作方处获取《我的世界》演示视频以及与视频配套的键盘鼠标操作记录，并根据这些操作习惯建立逆动力学模型（inverse dynamics model）以推测模拟视频内的键鼠操作逻辑，此后再反复推演全世界的《我的世界》视频以模拟人类的游玩习惯。