机器人在叠衣服
机器人模仿人类跳舞
仿真表情机器人表演昆曲《皂罗袍》
国际具身智能技能大赛比赛现场
本报记者 叶薇
一台人形机器人站在“客厅”中,用机械臂精准夹起散落的T恤,平铺、折袖、收角,一套动作行云流水,1分钟内便将衣物叠成规整的方块。今天起,来自全国各地、超百支具身智能参赛队伍将在上海参加一次重要“考试”。机器人不仅将在现场比拼“插花”“叠衣服”“冲咖啡”这些生活技能,还会像老技工一样,靠“手感”去拧一颗螺丝……
是谁帮助形态各异的机器人实现从“花架子”到“实干派”的转变?是谁让它们开始融入我们的生产生活,渐渐成长为可靠“搭子”?
一 玩“VR游戏”,让机器人学人干活
2000年出生的郑玉仪最近很忙碌,几天前她从北京飞到上海,参加今天在上海张江举办的2025全球开发者先锋大会暨国际具身智能技能大赛。
她大专毕业后在北京的互联网企业写了2年代码,做前端开发,觉得没什么成就感,去年底就“任性”辞职了。“我爱做手工,搭乐高、织毛衣都挺喜欢的。但对职业规划,其实有点迷茫。”
她去云南昆明玩了一趟,在斗南鲜花市场,被缤纷花海触动,萌生了“能否让机器人识别花材、处理花枝,甚至完成插花”的想法。“我在现场看到很多人在分拣鲜花,效率低,也很劳累,就想如果让机器人来做这些工作呢?不过,流水线很复杂,鲜花也很娇弱,当时觉得不太可能。”但正是这一闪念,将她引向了具身智能的崭新领域。今年4月,她加入了初创企业灵御智能,彼时公司才成立2个月。
她还记得面试时,招聘人员问了她两个问题,“《黑神话:悟空》游戏通关了没?戴上VR设备头晕不晕?”
入职后,她发现自己的工作就像戴着VR设备打游戏:坐在操控台前,戴上VR头部显示设备,眼前出现屏幕,里面有机器人的“眼睛”(实时画面),能看清远处的情景;有“身体数据”(电量、力量值),像游戏血条一样直观;还有“指令面板”。手上拿着手柄,以第一视角操控机器人,机器人的“胳膊”和“手”随着她的手势缓缓移动,精准地将一块块积木摞在一起,“看上去很酷”。
遥操作不仅是一个控制手段,更是一种数据采集方式,让机器人“看着你怎么做”,一步步学会自己的任务。“我可能一天记录了1000条关于拿放这个动作的数据,就能把数据‘喂’给团队自研的控制平台,让机器人学习,下次它的动作就会更精准。”
采集数据的过程往往是三四个小时重复同一个动作,跟过去写代码相比,似乎同样枯燥。但郑玉仪不这么看。“过程中我能及时得到反馈,机器人学会了我的动作,我会很有成就感。现在机器人在我的训练下,搭积木、叠衣服、倒水、套圈、拧瓶盖、分拣垃圾都会做,越来越能干了。再说了,训练它的时候,我还能聊天、听歌。”
更让小郑有收获的是,在陪伴、训练机器人的过程中,她自己也在飞速成长。“有次出差时操控机器人出现了问题,我只能到处找人远程教我,挺崩溃的。后来,我自己学会了处理这些情况,不用再麻烦别人了。每一次解决问题,都是学习的过程。不仅要机器人更能干,还要减少故障,让它更耐用。”
入行8个月,小郑亲眼见证了机器人从“笨拙”到“灵巧”的蜕变历程。她曾面对机器视觉模糊不清的困扰,如今已升级至高清4K画面;从最初设备一天重启30次,到如今连续运行30天不宕机;从操作时机械臂挥舞不协调,到如今几乎零延迟复刻她的动作。她也收获了职业生涯的高光时刻——上个月,她和团队带着机器人伙伴TeleAvatar参加了中关村具身智能机器人应用大赛,在7个细分赛项中斩获一等奖。在这次大赛中积累的信心,让她毫不犹豫报名参加此次在上海举办的具身智能技能大赛。“我们团队几乎参加了所有跟遥操作相关的赛道,很期待跟来自全国各地的队伍比拼、交流。”
“遥操作技术让机器人能应对复杂多变的场景。我们可以在远离机器人的位置,甚至跨城市、跨国家完成远程控制,特别适用于危险场景的劳动力替代。比如,在隧道爆破作业中,需将炸药精准装填至预先钻设的炮孔内。现在,我们就能在安全、明亮的控制室里,远程操控机器人完成爆破任务。”
回想起置身斗南鲜花市场的场景,她设想机器人能自己走到鲜花堆放处,挑出粉色玫瑰、白色洋桔梗、黄色小雏菊……把它们搬运到指定的位置,再根据顾客需求插到不同的花瓶中。“若要让机器人完全自主地完成这样精细灵动的任务,通常需要依赖海量的场景数据与复杂的算法推演。而遥操作技术的优势在于,它能让人工智能系统立刻投入工作——操作员远程引导机器人执行任务的同时,也在真实环境中高效采集着宝贵数据,大幅降低了后续训练与迭代的时间成本,加速推动机器人向更高阶的自主性迈进。我相信,未来让机器人自主‘动手’,在鲜花市场当分拣员、插花师,肯定能实现。”
二 从祛魅到痴迷,打磨机器人“小手”
在科幻大片中,机器人几乎无所不能。从人形机器人走进大众视野,这个赛道变得火热,不少人对机器人走进日常生活有了更急迫的期待。
工科出身的汪航却坦言,入行后,第一感觉是对机器人“祛魅”。“它不像我想象的那么厉害,很多环节都需要人来配合,更像是个刚会走路的小孩。有了AI和大模型的助力,它成长的速度正在变快。”
1998年出生的汪航,去年从上海理工大学生物医学工程专业硕士毕业。同学大多去了医院或者医疗器械公司,他却加入了以研发仿生手和灵巧手为主的上海傲意信息科技有限公司。“很幸运,也水到渠成。我在学校时就参与过研发下肢康复机器人,进公司就加入了灵巧手团队。”
何为灵巧手?它是一种模拟人类手部功能的高自由度机器人末端执行器,被称为人形机器人走向大规模商业应用的“最后一厘米”。“相当于机器人本体中的一个小脑,通过算法,让它执行不同的动作。”
对汪航来说,最大的挑战是探索人机交互的边界,而这个领域并没什么经验可借鉴。比如,要让灵巧手抓豆腐,如何让它抓得又稳又准,还要保证豆腐完好无损?“这个过程需要算法支持,算法怎么设计和调优,一开始很困难,我只能请教更有经验的工程师或者跟客户反复沟通,把他们的需求一步步反映在算法的优化过程中。通过大量的训练,调整参数,去寻找最优解。”
今年年中,傲意发布了能精准力控的新一代灵巧手,具备6个主动自由度,11个运动关节,单指最大负载达8公斤。“跟以往产品比,最大的不同在于搭载了高密度点阵触觉传感器,这使得灵巧手具有了‘神经末梢’,能实时感知细微压力变化,无论是捏取一片薯片,还是握持重型工具,都能精准适配力度。但接入传感器的过程并不容易,当时新品马上要发布,我们两三个人花了3天时间,把传感器的各个接口都摸透了,能采集到数据,打通了链路。那一刻,非常有成就感。”
今年开始,汪航的工作转到了应用开发部门,密切与客户沟通,做好技术支持。“我们研发的每一步都紧扣真实场景需求,灵巧手已在很多场景中落地应用了,比如商品分类、厨房作业辅助、精密装配等,所以实践中遇到任何问题,我们都会快速响应。”
傲意科技为具身智能技能大赛提供了30台灵巧手,作为参赛团队的核心工具,在赛事中接受工业、服务等复杂城市场景的高强度考验。这几天,汪航和团队忙着为30台灵巧手部署与调试,为保障赛事用灵巧手的稳定性与可靠性,他们每天需完成几十万次的高强度测试。
“我还参与了团队一起研制自由度更高、感知更灵敏的新一代灵巧手。我觉得机器人行业充满生机,初创企业多,年轻人多,爱好者多,挑战与乐趣并存。从医疗康复到智能机器人,我始终相信技术应当为人服务,让机器更好地辅助人类。”
三 自研模型,让机器人在“技校”越练越聪明
走进位于上海张江模力社区的人形机器人麒麟训练场,宛如来到一个机器人技校。在大厅一侧的“流水线”上,机器人井然有序地站在“工位”前,兢兢业业地“学习”着不同工种的“技能”:整理桌面、放置商品、清理核电板管……
1998年出生的算法工程师张浩然最近经常泡在这里训练机器人。两年前,他从英国谢菲尔德大学毕业后,回国求职。“我当时还觉得自己挺优秀的,想着学以致用、报效祖国,结果发现国内的就业市场不需要我。”他开玩笑说,当时投了一圈简历,发现跟自己一起参加笔试面试的国内学生都太优秀了,自己显得“平平无奇”。
机缘巧合,他加入了人形机器人(上海)有限公司。“当时我们公司刚成立,很需要做语言模型训练的人。最初条件很简陋,数据采集只能依赖主从机械臂,数据格式也不统一,我们团队五个人常常挤在一套设备前协同操作。但正是这种从零到一的过程,让我深入理解了算法与硬件结合落地的复杂性。”
张浩然连续两年参加了世界人工智能大会,感受到机器人的飞速成长。“去年,我们还主要在探索通过视觉和文本的判断来调用不同模型,构建一个‘大脑控制小脑’的简易系统;到了今年,我们已经能够在多种异构机器人上成功部署我们自研的视觉—语言—动作(VLA)模型,实现了在复杂场景下的多任务执行能力。”也就是说,机器人能先看清楚、想明白(读懂文字指令,结合看到的情况做简单思考),再调用专门的“动作程序”干活,微调一下,就能适配不同场景。
“我认为这个改变和进步是巨大的。这个领域和纯粹的大模型研究不同,我们既要应对算法的快速演进,又要直面硬件和部署中的真实挑战。但在一次次解决问题的过程中,我们也获得了更强的成就感。”
最让他崩溃的一次,他花费了很多精力训练出的模型,预想应该有很好的推理效率,但机器人执行不了。“当时真的想破脑袋,几千行代码一行一行查询、验证,最后才发现,是相机的颜色错了,相当于机器人的‘眼睛’读取的内容错了。其实只需要加一行代码就跑通了,但我们发现这个问题花了整整一个星期。看到机器人终于可以按照我们的模型准确抓取东西时,我激动得都快哭了。”
张浩然这次要参加家政赛道。“这个赛道要求机器人在居家情境下执行衣物折叠、餐具整理等多种任务,且环境较为复杂,非常考验模型的泛化性和鲁棒性。”他解释说,泛化性是指“机器人会灵活变通、举一反三”,鲁棒性是指“机器人抗造耐折腾”,两者都是衡量机器人“靠谱程度”的关键指标。
“我们让机器人熟练完成居家服务赛道的各类任务,训练中采集的数据会汇总到模型中重新训练,再部署到机器人身上,以此提升任务完成率。”
本版图片 记者 陈梦泽 叶薇 摄