谷歌“游戏搭子”SIMA即将上线：通用AI智能体如何改变3D游戏？

Hawk Insight

2024-03-15 16:21:34

3.25W

当地时间3月16日，谷歌DeepMind宣布推出全新AI系统SIMA，号称其是首个可以在广泛的3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。

当地时间3月16日，谷歌DeepMind宣布推出“可扩展、可指导、多世界”的全新AI系统SIMA（Scalable Instructable Multiworld Agent），号称其是首个可以在广泛的3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。

据介绍，SIMA是一款训练、学习游戏技能的AI代理，可以遵从指令，在游戏里实时执行任务。对于从未玩过的游戏，甚至不具线性结束路径、开放世界的游戏，它也可以与玩家配合默契。

简单来说，SIMA在游戏中不是一个“埋头苦干”的AI，更像“另一个玩家”。谷歌DeepMind研究员兼SIMA联合负责人Tim Harley表示：“SIMA并不是为了赢得比赛而训练的；而是为了赢得比赛而训练的。”

AIGC的“拓路者”

自OpenAI 2022年11月发布ChatGPT以来，微软、Adobe、Meta和Anthropic等一众科技企业纷纷推出自家AIGC工具。近期，该领域的开发已从文本写作延伸至图像、音视频和游戏领域。

谷歌方面称，视频游戏是AI系统的绝佳训练场。视频游戏作为一个沙盒，提供了一种安全、可访问的测试方法，不仅可以让AI学会玩游戏，还能够学会将抽象语言转化为实际行动，从而在各种环境中更加实用。

目前，SIMA尚处于研究阶段。为了让SIMA接触到更多游戏环境，开发团队表示目前已与八家游戏工作室合作，在九款视频游戏上对其进行训练和测试。参与该项目的谷歌DeepMind研究工程师Frederic Besse表示：“SIMA能够利用游戏中的共享概念，学习更好的技能，并学会更好地执行指令。”

在游戏与AI领域，谷歌已算得上是“元老”级别。从早期与游戏平台Atari合作，到开发出以人类特级大师级别玩《星际争霸Ⅱ》的AlphaStar系统，SIMA的诞生标志着谷歌AI开发的全新里程碑。

它主打从适用单一游戏转向通用、可指导的游戏代理，并具备理解自然语言指令和跨多种虚拟环境执行任务的超凡能力，这对于智能机器人和交互式AI系统的开发来说意义深远。

真金不怕火炼

为使SIMA的学习和训练更为有效，DeepMind团队选择了更注重开放式游戏而非叙事的游戏，这类游戏以随机、自发为特点，可以在最大程度开发SIMA对于环境信息的获取范围。

并且，SIMA也不需要自定义API来玩游戏或访问源代码，仅凭屏幕图像和用户的简洁自然语言指令即可激活学习进度，从而提高SIMA的通用性。

开发团队还使用了4种研究环境，其中以Unity引擎创建了一个名为“Construction Lab”的新环境，代理需要在其中搭建模型，以测试其对对象操作和物理世界的理解程度。此外，研究人员还避免了具有暴力行为的游戏，以符合谷歌的AI道德准则。

数据层面，DeepMind团队收集了多种游戏操作中键盘和鼠标数据，再将该数据输入到机器人的语言模型中，通过消化庞大的文本数据库，SIMA的语言处理能力从而得到训练和强化。人类评审的评估结束后，SIMA根据人工数据对性能进行微调。

当前，SIMA已完成了对600项基本技能的评估，可实现10秒内导航、对象交互和菜单使用等操作，并适应各种场景。而即使是在未经训练过的游戏中，SIMA的表现也等同于训练过的智能体，证明了其在全新环境中的泛化能力。

OpenAI概念延续

2016年，“游戏智能体”概念出现在大众视野。OpenAI推出的首版Universe平台在问世之后便得到了微软、英伟达等多家知名公司的支持，共同致力于让其像人类一样使用计算机。

据悉，Universe能够模拟各种游戏和应用程序，并允许用户训练、测试其在多种环境中的表现。在各种各样的仿真环境（包括Flash游戏、浏览器任务等）中，智能体可以通过观察屏幕像素、模拟键鼠操作等方式，与环境进行交互。通过该平台，研究人员可以以人类为算法性能基准，并在各种仿真环境中测试智能体的算法并比较它们的性能。

相比之下，SIMA为研究人员提供了一个灵活且可定制的平台，使其可以更加深入地探索该智能体的各个方面（如虚拟现实、游戏开发、智能助手等），展示了开发新一代通用、语言驱动AI智能体的潜力，为未来智能系统的发展开辟了新的可能性。