研究人员测试GPT-4玩《DOOM》射击准确度差、忽视环境危险
英国约克大学的研究人员Adrian de Wynter最近进行的研究探讨了GPT-4在玩经典第一人称射击游戏《DOOM》(1993年版本)的能力。 这项研究藉由测试GPT-4能否在没有事先训练的情况下玩游戏来进行探讨,该研究的结果发布于论文Will GPT-4 Run DOOM?中。

研究方法:结合 GPT-4V 与代理模型
目录
De Wynter 设计了一个系统,利用 GPT-4V 这个能够接受图像输入的多模态 GPT-4 变体,从游戏引擎捕捉截图并返回游戏状态的结构化描述。 这些信息接着被送入一个代理模型,该模型根据视觉输入和过往历史作出决策,并将其响应转换成游戏引擎可以理解的按键指令。
未能感画面以外的敌人
尽管这个系统在玩《DOOM》方面显示出了一定的潜力,但也揭示了一些限制。 其中一个主要问题是 GPT-4 缺乏物体恒存性,意味着当游戏中的敌人移出画面时,它会忘记它们的存在。 此外,GPT-4 在推理和移动欠清晰,常遇到了困难。
测试结果:未能过关
在 Adrian de Wynter 的研究中,GPT-4 在控制《DOOM》游戏的代理模型时,未能在任何情境下完成地图。 然而,该模型曾在两次测试中差点完成任务。
一次是进入房间 D 并立即被等待在那里的恶魔所杀;另一次则是到达房间 D 的门前,然后回头,打开一扇通往庭院的秘密门,最终因时间耗尽而终止。
射击准确度差、忽视环境危险
然而,代理模型经常忽略敌人,射击准确度差,并忽视环境危险。 在少数情况下,它甚至会近距离射击墙壁,或更糟的是,射击爆炸桶。 这些问题揭示了模型在理解游戏动态和战略规划方面的限制。
限制及潜力
尽管存在这些限制,De Wynter认为 GPT-4 能够在没有事先训练的情况下玩《DOOM》仍然是值得称赞的。 这表明了GPT-4在游戏和其他互动媒介中的潜在应用,开启了未来研究的新方向。
赞 (0)
打赏
微信扫一扫
