谷歌“游戏搭子”SIMA即将上线:通用AI智能体如何改变3D游戏?
当地时间3月16日,谷歌DeepMind宣布推出全新AI系统SIMA,号称其是首个可以在广泛的3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。
当地时间3月16日,谷歌DeepMind宣布推出“可扩展、可指导、多世界”的全新AI系统SIMA(Scalable Instructable Multiworld Agent),号称其是首个可以在广泛的3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。
据介绍,SIMA是一款训练、学习游戏技能的AI代理,可以遵从指令,在游戏里实时执行任务。对于从未玩过的游戏,甚至不具线性结束路径、开放世界的游戏,它也可以与玩家配合默契。
简单来说,SIMA在游戏中不是一个“埋头苦干”的AI,更像“另一个玩家”。谷歌DeepMind研究员兼SIMA联合负责人Tim Harley表示:“SIMA并不是为了赢得比赛而训练的;而是为了赢得比赛而训练的。”
AIGC的“拓路者”
自OpenAI 2022年11月发布ChatGPT以来,微软、Adobe、Meta和Anthropic等一众科技企业纷纷推出自家AIGC工具。近期,该领域的开发已从文本写作延伸至图像、音视频和游戏领域。
谷歌方面称,视频游戏是AI系统的绝佳训练场。视频游戏作为一个沙盒,提供了一种安全、可访问的测试方法,不仅可以让AI学会玩游戏,还能够学会将抽象语言转化为实际行动,从而在各种环境中更加实用。
目前,SIMA尚处于研究阶段。为了让SIMA接触到更多游戏环境,开发团队表示目前已与八家游戏工作室合作,在九款视频游戏上对其进行训练和测试。参与该项目的谷歌DeepMind研究工程师Frederic Besse表示:“SIMA能够利用游戏中的共享概念,学习更好的技能,并学会更好地执行指令。”
在游戏与AI领域,谷歌已算得上是“元老”级别。从早期与游戏平台Atari合作,到开发出以人类特级大师级别玩《星际争霸Ⅱ》的AlphaStar系统,SIMA的诞生标志着谷歌AI开发的全新里程碑。
它主打从适用单一游戏转向通用、可指导的游戏代理,并具备理解自然语言指令和跨多种虚拟环境执行任务的超凡能力,这对于智能机器人和交互式AI系统的开发来说意义深远。
真金不怕火炼
为使SIMA的学习和训练更为有效,DeepMind团队选择了更注重开放式游戏而非叙事的游戏,这类游戏以随机、自发为特点,可以在最大程度开发SIMA对于环境信息的获取范围。
并且,SIMA也不需要自定义API来玩游戏或访问源代码,仅凭屏幕图像和用户的简洁自然语言指令即可激活学习进度,从而提高SIMA的通用性。
开发团队还使用了4种研究环境,其中以Unity引擎创建了一个名为“Construction Lab”的新环境,代理需要在其中搭建模型,以测试其对对象操作和物理世界的理解程度。此外,研究人员还避免了具有暴力行为的游戏,以符合谷歌的AI道德准则。
数据层面,DeepMind团队收集了多种游戏操作中键盘和鼠标数据,再将该数据输入到机器人的语言模型中,通过消化庞大的文本数据库,SIMA的语言处理能力从而得到训练和强化。人类评审的评估结束后,SIMA根据人工数据对性能进行微调。
当前,SIMA已完成了对600项基本技能的评估,可实现10秒内导航、对象交互和菜单使用等操作,并适应各种场景。而即使是在未经训练过的游戏中,SIMA的表现也等同于训练过的智能体,证明了其在全新环境中的泛化能力。
OpenAI概念延续
2016年,“游戏智能体”概念出现在大众视野。OpenAI推出的首版Universe平台在问世之后便得到了微软、英伟达等多家知名公司的支持,共同致力于让其像人类一样使用计算机。
据悉,Universe能够模拟各种游戏和应用程序,并允许用户训练、测试其在多种环境中的表现。在各种各样的仿真环境(包括Flash游戏、浏览器任务等)中,智能体可以通过观察屏幕像素、模拟键鼠操作等方式,与环境进行交互。通过该平台,研究人员可以以人类为算法性能基准,并在各种仿真环境中测试智能体的算法并比较它们的性能。
相比之下,SIMA为研究人员提供了一个灵活且可定制的平台,使其可以更加深入地探索该智能体的各个方面(如虚拟现实、游戏开发、智能助手等),展示了开发新一代通用、语言驱动AI智能体的潜力,为未来智能系统的发展开辟了新的可能性。
·原创文章
免责声明:本文观点来自原作者,不代表Hawk Insight的观点和立场。文章内容仅供参考、交流、学习,不构成投资建议。如涉及版权问题,请联系我们删除。