谷歌AI引争议！游戏中思考超厉害，手势操作就不行，算真正本领吗

其实，AI在游戏里玩也不算什么新鲜事了。

你见过那种在《山羊模拟器3》里不“翻车”、在《无人深空》还能认路，还愿意跟你讲讲“为啥要这么干”的AI吗？

去年11月DeepMind发布的SIMA 2，最近又传来了些新消息。

今天周叔就跟咱们聊聊，这AI到底是真“变”聪明了，还是其实也就玩了把花架子？

再说了，AI啥时候能帮咱们干点真事儿，这差距可还远着呢。

SIMA 2：AI是不是终于能“动脑子”啦？

以前看AI玩游戏，感觉它就像个“傻大个”似的——SIMA 1就是这么个模样，虽然能搞定八款不同游戏的操作。

要它找个篝火，就只能乱按键，想搞定复杂任务的几率就只有31%，基本和蒙得差不多。

SIMA 2一推出，马上就把“执行器”直接改成了“思考者”。

重点在于它把Gemini大模型融进去了。

你让它去《无人深空》里“找像成熟番茄的房子”，它就能清楚地说：“番茄成熟会变红，所以我得找到红色的房子。”

要是以前的游戏AI，根本就别谈这种明显的推理能力。

周叔觉得，这一步可真重要：以前的AI只能“做啥”，而现在能说得清“为啥这么做”，这才算沾了点“智能”的边儿。

而且，它还能“掌握”各种语言：文字、语音、手绘草图都不在话下，甚至连emoji都能轻松理解。

你要是发个斧头+树的表情，它就知道你想“砍树”。这不仅仅是几个符号对应一下，而是真懂“斧头是工具、树是可以操作的对象，两者一放，意思自然就是砍树”。

把抽象符号和动作联系起来的这个本事，远比光看文字指令要厉害得多。

最牛的地方在于它还能“自己搞明白怎么升级”。

SIMA 1 完全靠人类试玩录像来学习，SIMA 2 拿到起始数据以后，不仅能自动生成新任务，还能为自己打分，从错误中逐步学习成长。

像放到全新的3D环境里，它不用指导，自己就能尝试、犯错，逐步调整。说白了，这种“自我进步”的本事，才是真正让AI走得更远的根本秘诀。

新动态：既喜又忧的突破令人眼前一亮，同时也让人有些担心。

自去年11月一出来，SIMA 2最近又搞了点新花样，咱们得实事求是地看：有点惊喜，但那些老问题也还是老样子没藏住。

先说好消息。去年12月，DeepMind跟《我的世界》开发商Mojang联手，把SIMA 2引进了MineDojo进阶版（更接近真实的《我的世界》玩法）。

之前它在没经过训练的MineDojo里成功率不到15%，这次直接飙升到22%。

别觉得7%的提升没什么大不了的，《我的世界》里边挖矿、建房子这些步骤可不少，能让AI搞定这些任务，已经算挺厉害了。

今年一月更精彩，斯坦福大学用它测试“虚拟机器人”：在模拟的真实室内空间里找杯子、开门，就这么来弄的。

任务完成率达到了58%，这可是从“游戏世界”向“模拟现实”跨出的一大步，之前根本想都不敢想的事情。

但事情嘛，也不是没遇到点麻烦。

最先得说的就是“手笨”这个问题，阿尔伯塔大学的Matthew Guzdial提过，现在游戏的键盘鼠标操作都差不多了，AI学会一个，基本就能用到别的游戏上。

要是真碰到那种特殊输入的游戏，比如用手势控制的，AI也就难搞了，肯定会出问题。

老周也觉得，我们玩游戏得多练练手感，AI连键盘鼠标都搞不清楚，更别提那些复杂动作了。

在一个嘛，就是记忆力不太行。

为了跟上节奏，SIMA 2之前只能记住最近的几次对话，长远点的任务根本撑不住。

今年2月份，DeepMind推送了升级版的长期记忆功能，可以保存一小时的内容。

可是我们玩《塞尔达》的时候，那得记好几个任务线，1小时记忆要是遇到长线游戏，还是会“断片”。

现实和游戏之间的差距，究竟有多大呢？从虚拟世界跳到真实的工作岗位，还差多远？

不少人都在想：AI在游戏里这么厉害，那什么时候能帮咱们打扫卫生、修修家里的电器啥的？

这就离不开“模拟到现实的差距”这个事儿（sim-to-real gap），在游戏里按个键就能把门开了，可现实中得旋开把手，还得控制力度，差得可真远了。

DeepMind也琢磨出个办法，弄了个“分层架构”这玩意儿。

上面那一层是SIMA 2里的“认知层”，用来考虑“想干啥”，下面那一层则是专门操控动作的系统，负责“怎么做”。

这样的设计在业界其实挺常见的，比如英伟达的Isaac机器人平台也是用这种方式搞的。

按理说，SIMA 2学到的“找红色物体”“用工具”这些技能，确实能用到实际操作中，可关键还是得搞清楚怎么把“想法”变成“动作”。

纽约大学的Julian Togelius 道出一句挺实在的话：现实世界既难搞得要命，又挺好玩的，就是这么个情况。

主要是物理交互麻烦得很，机器人要搞清楚自己能做啥，而每个游戏世界的规则又都不一样，搞得挺费劲。

换个角度来说，在游戏中，AI只是“按规矩操作”，到现实里就变成“没规则乱摸”，这两者的难度简直不是一个档次的。

再说个现实情况吧，SIMA 2虽然开放范围变大了，可以让更多学术机构和开发者尝试，但依旧只是“有限研究预览”，普通用户还不能轻易动手用。

这也说明，DeepMind自身也明白，这玩意儿还没到真正投入使用的阶段，还得继续改进打磨。

结语

SIMA 2 真是迈出了具身AI的重要一步啊！

从机械操控变成能思考，再到不用人帮忙还能自主提升，甚至还开始模仿现实了。

不过，要从虚拟走到现实，这道鸿沟可不是几次游戏测试就能轻松跨越的。

要真让AI走进咱们日常生活帮忙，这事得靠更多技术上的突破才能实现。

这不过是个起点，将来路还很长，不过只要方向没错，总有一天能看到曙光。

#小雪民俗趣谈有哪些#

谷歌AI引争议！游戏中思考超厉害，手势操作就不行，算真正本领吗

推荐资讯

热点资讯

推荐资讯