具身智能创业公司很多,但团队构成里,拥有“全球TOP5华人计算机科学家”中两位的,可能只此一家了。
在2025年的“尾巴”上,头部AI企业商汤科技旗下的“大晓机器人”亮相,引发业内关注。
大晓机器人董事长王晓刚,此前是商汤绝影智能汽车事业群总裁。乍一听,带着些许《变形金刚》的酷炫。然而,和所有人想象的不一样,大晓机器人的“首秀”,拿出手的不是具体到任务的工业或家庭产品方案,甚至,都不是一个机器人本体,而是具身超级大脑模组。
具身智能公司的打法,难道变了?
超级大脑模组,“用法”很“简单”?
的确,和我们认知中的具身智能公司,不一样了。
大晓机器人推出具身超级大脑模组AI,本身包含摄像头、激光雷达、计算芯片,内置视觉感知、规划控制等模块。“用法”十分简单,直接和其他型号的机器人本体相连。
比如四足机器人+AI,相当于直接给机器人注入了“大脑”和“灵魂”,一方面具备物理世界的感知、规划和决策能力,另一方面系统能理解任务内容,独立完成类似巡检、消防、娱乐互动等任务。任何品牌品类的机器人本体,只要开放控制接口,AI都能适配。
光看表面,和现如今能打拳、能插花的全能机器人相比,AI似乎都没资格“上牌桌”,但这款“大脑模组”的背后,是商汤、绝影长期积累的大模型、自动驾驶经验成果——AI本地端部署和商汤绝影量产系统同源的端到端模型,完全不依赖地图信息,无论是有明显特征的道路,还是公园、仓库等场景,AI都能自主识别规划线路;单体智能之外,针对不同任务场景,AI还有“外挂”助手,比如接入了商汤城市与产业智能化视觉引擎方舟,协同轻量小模型与通用大模型,实现长尾视觉任务的渐进式推理。
那么,大晓机器人想用AI做什么呢?
纯视觉学习,让机器人习得人类智慧
王晓刚说,大量具身智能企业推出了各种不同形态的机器人,并且通过后端人工操作控制本体去采集数据,然后把数据聚合在一起,试图训练一个通用的机器人大脑,但练出来的所谓“大脑”很难用到不同的本体上,数据不能共享。
大晓机器人把这种旧的研究范式叫作“以机器为中心”。它的核心逻辑是通过视觉和语言指令,直接让机器去完成特定任务,不需要理解物理世界到底是什么样。
当前,特斯拉、Figure AI正集体放弃这条路,转而探索纯视觉学习方案,其理想是让机器人通过观看海量视频,直接习得人类的动作与智慧。
大晓机器人率先提出“以人为中心”的ACE具身研发范式。这一范式的核心技术之一环境式数据采集技术,是通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据,采用物理级建模与全场景覆盖的创新设计,为具身智能模型训练提供“人—物—场”全要素精准数据支撑。
这样来看,AI本身,就是环境式数据采集技术的终端执行设备。
形成“知其然,知其所以然”的思维链
紧跟着环境式采集数据,大晓机器人还带来了首个开源且商业化应用的世界模型——开悟世界模型3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作,使机器不仅能“理解”物理世界因果规律,还能“生成”长时动静态交互场景,进而“预测”万千可能。
除了长时动态交互场景视频,开悟3.0还能在场景内实现各元素精准可控,以及形成“知其然,知其所以然”的思维链。
最重要的,是跨不同形态机器人本体数据的一键生成、多本体泛化、预测万千演化路径。
现在,这家新成立的上海具身智能企业,“打法”逐渐清晰——率先打造一个数据入口,把机器人本体作为边缘算力,利用不同厂商、不同场景、不同形态的机器人收集高质量数据,与开悟世界模型配合形成算法模型的不断迭代。
“我们以生态协同为核心,与具身厂商、硬件、芯片、云服务、数据厂商等多领域伙伴达成战略合作,共同搭建全链路自主可控的具身智能生态,推动技术从单点突破走向场景化落地。”大晓机器人首席科学家陶大程告诉记者。
本报记者 郜阳