其实,AI在游戏里玩也不算什么新鲜事了。
你见过那种在《山羊模拟器3》里不“翻车”、在《无人深空》还能认路,还愿意跟你讲讲“为啥要这么干”的AI吗?
去年11月DeepMind发布的SIMA 2,最近又传来了些新消息。
今天周叔就跟咱们聊聊,这AI到底是真“变”聪明了,还是其实也就玩了把花架子?
再说了,AI啥时候能帮咱们干点真事儿,这差距可还远着呢。
SIMA 2:AI是不是终于能“动脑子”啦?
以前看AI玩游戏,感觉它就像个“傻大个”似的——SIMA 1就是这么个模样,虽然能搞定八款不同游戏的操作。
要它找个篝火,就只能乱按键,想搞定复杂任务的几率就只有31%,基本和蒙得差不多。
SIMA 2一推出,马上就把“执行器”直接改成了“思考者”。
重点在于它把Gemini大模型融进去了。
你让它去《无人深空》里“找像成熟番茄的房子”,它就能清楚地说:“番茄成熟会变红,所以我得找到红色的房子。”
要是以前的游戏AI,根本就别谈这种明显的推理能力。
周叔觉得,这一步可真重要:以前的AI只能“做啥”,而现在能说得清“为啥这么做”,这才算沾了点“智能”的边儿。
而且,它还能“掌握”各种语言:文字、语音、手绘草图都不在话下,甚至连emoji都能轻松理解。
你要是发个斧头+树的表情,它就知道你想“砍树”。这不仅仅是几个符号对应一下,而是真懂“斧头是工具、树是可以操作的对象,两者一放,意思自然就是砍树”。
把抽象符号和动作联系起来的这个本事,远比光看文字指令要厉害得多。
最牛的地方在于它还能“自己搞明白怎么升级”。
SIMA 1 完全靠人类试玩录像来学习,SIMA 2 拿到起始数据以后,不仅能自动生成新任务,还能为自己打分,从错误中逐步学习成长。
像放到全新的3D环境里,它不用指导,自己就能尝试、犯错,逐步调整。说白了,这种“自我进步”的本事,才是真正让AI走得更远的根本秘诀。
新动态:既喜又忧的突破令人眼前一亮,同时也让人有些担心。
自去年11月一出来,SIMA 2最近又搞了点新花样,咱们得实事求是地看:有点惊喜,但那些老问题也还是老样子没藏住。
先说好消息。去年12月,DeepMind跟《我的世界》开发商Mojang联手,把SIMA 2引进了MineDojo进阶版(更接近真实的《我的世界》玩法)。
之前它在没经过训练的MineDojo里成功率不到15%,这次直接飙升到22%。
别觉得7%的提升没什么大不了的,《我的世界》里边挖矿、建房子这些步骤可不少,能让AI搞定这些任务,已经算挺厉害了。
今年一月更精彩,斯坦福大学用它测试“虚拟机器人”:在模拟的真实室内空间里找杯子、开门,就这么来弄的。
任务完成率达到了58%,这可是从“游戏世界”向“模拟现实”跨出的一大步,之前根本想都不敢想的事情。
但事情嘛,也不是没遇到点麻烦。
最先得说的就是“手笨”这个问题,阿尔伯塔大学的Matthew Guzdial提过,现在游戏的键盘鼠标操作都差不多了,AI学会一个,基本就能用到别的游戏上。
要是真碰到那种特殊输入的游戏,比如用手势控制的,AI也就难搞了,肯定会出问题。
老周也觉得,我们玩游戏得多练练手感,AI连键盘鼠标都搞不清楚,更别提那些复杂动作了。
在一个嘛,就是记忆力不太行。
为了跟上节奏,SIMA 2之前只能记住最近的几次对话,长远点的任务根本撑不住。
今年2月份,DeepMind推送了升级版的长期记忆功能,可以保存一小时的内容。
可是我们玩《塞尔达》的时候,那得记好几个任务线,1小时记忆要是遇到长线游戏,还是会“断片”。
现实和游戏之间的差距,究竟有多大呢?从虚拟世界跳到真实的工作岗位,还差多远?
不少人都在想:AI在游戏里这么厉害,那什么时候能帮咱们打扫卫生、修修家里的电器啥的?
这就离不开“模拟到现实的差距”这个事儿(sim-to-real gap),在游戏里按个键就能把门开了,可现实中得旋开把手,还得控制力度,差得可真远了。
DeepMind也琢磨出个办法,弄了个“分层架构”这玩意儿。
上面那一层是SIMA 2里的“认知层”,用来考虑“想干啥”,下面那一层则是专门操控动作的系统,负责“怎么做”。
这样的设计在业界其实挺常见的,比如英伟达的Isaac机器人平台也是用这种方式搞的。
按理说,SIMA 2学到的“找红色物体”“用工具”这些技能,确实能用到实际操作中,可关键还是得搞清楚怎么把“想法”变成“动作”。
纽约大学的Julian Togelius 道出一句挺实在的话:现实世界既难搞得要命,又挺好玩的,就是这么个情况。
主要是物理交互麻烦得很,机器人要搞清楚自己能做啥,而每个游戏世界的规则又都不一样,搞得挺费劲。
换个角度来说,在游戏中,AI只是“按规矩操作”,到现实里就变成“没规则乱摸”,这两者的难度简直不是一个档次的。
再说个现实情况吧,SIMA 2虽然开放范围变大了,可以让更多学术机构和开发者尝试,但依旧只是“有限研究预览”,普通用户还不能轻易动手用。
这也说明,DeepMind自身也明白,这玩意儿还没到真正投入使用的阶段,还得继续改进打磨。
结语
SIMA 2 真是迈出了具身AI的重要一步啊!
从机械操控变成能思考,再到不用人帮忙还能自主提升,甚至还开始模仿现实了。
不过,要从虚拟走到现实,这道鸿沟可不是几次游戏测试就能轻松跨越的。
要真让AI走进咱们日常生活帮忙,这事得靠更多技术上的突破才能实现。
这不过是个起点,将来路还很长,不过只要方向没错,总有一天能看到曙光。
#小雪民俗趣谈有哪些#
