2025年07月27日 星期日
AI,从工具到伙伴
第5版:2025世界人工智能大会暨人工智能全球治理高级别会议 2025-07-26
展品迭代轨迹勾勒出人工智能进化图谱

AI,从工具到伙伴

机器人敲鼓起舞本版摄影 本报记者 陈梦泽

机器手展示精细剥蛋操作

机器人小卖部

机器人现场互动

本报记者 叶薇 郜阳 易蓉

探营

从大模型、Agent智能体到形形色色的AI终端产品,从实验室里的算法模型到千行百业的“生产力引擎”,AI技术正以前所未有的速度进化,不断突破人们的想象边界。在2025世界人工智能大会展览现场,我们能深刻感知到,这场全球AI领域的“科技奥运会”不仅是一场创新秀,更是一部浓缩的AI进化史。展品的迭代轨迹勾勒出人工智能正从“工具”成长为重塑产业、赋能生活的“数字伙伴”。

抓豆腐剥鸡蛋不在话下

去年,18台人形机器人在大会现场排列“迎宾”,与观众互动,“十八罗汉”成为大会明星。今年,人形机器人真正上岗干活,展现它们的“十八般武艺”。

复旦大学可信具身智能研究院带着团队研制的“自适应视触觉AI传感器”首次公开亮相,搭载了传感器的机械臂能轻松抓取果冻、嫩豆腐,并摆出各种造型。“我们是用视触觉传感技术,将复杂触觉信息转化为高维度视觉信息,通过AI模型的算法,让机器人拥有媲美人类皮肤的触觉感知能力,可以精准抓取易碎易损物,完成高精度分拣与精密装配。”团队负责人何安莉介绍说。

擎朗双足服务机器人XMAN-F1是小卖部的主理人,无论是制作爆米花还是根据顾客需求调制各类冰镇饮料,它都能轻松完成;侍酒师XMAN-R1会准确识别订单内容,并展示精准的“调酒”技艺:从识别酒瓶、精准倾倒冰块与酒水饮料等,精准模拟服务人员动作逻辑与姿态。展台工作人员介绍,XMAN系列具身服务机器人并非独立工作,而是与其他专用机器人形成多机协作。双足机器人完成服务后,配送机器人按最优路径送到顾客手中,两者通过机器间任务调度实现无缝衔接。

云百生公司带来的全自主AI超显微手术机器人,在展会现场演示“壳剥落膜不破”的操控能力。展台负责人刘芳德介绍,它可执行医生在高倍显微镜下从事的精密手术,精度可达微米级。“做一些缝合和切除手术时,不能伤害软组织,类似的过程就如同剥鸡蛋不能破坏鸡蛋里的那层膜一样。这款机器人是在香港科技大学上海产教融合中心孵化的,核心的电机、传感器、运动控制、视觉系统都是国产的,未来上市后价格是进口产品的十分之一。现在需求很旺盛,但我们还面临着商业化的诸多挑战。”

穹彻智能在大会展区开了一家“手工”冰淇淋店。具身大脑驱动双臂机器人自主打开冰柜、精准挖舀冰淇淋球、均匀撒落小料、轻柔关闭冰柜,还不忘即时冲洗挖勺。穹彻与海尔联合研发的家庭机器人也将在展会现场自主完成收拾衣物、洗衣、烘衣、清理地面杂物、摆放拖鞋等动作。

智元机器人旗下灵犀X2、精灵G1、远征A2和远征A2-W四大机器人产品同时亮相,综合展示机器人的运动智能、作业智能和交互智能。无论是在物流场景中拆箱子,和观众一起玩冰壶游戏,还是引路讲解、表演炫酷啦啦操,从成熟商用到开源支持二次开发,智元全方位呈现具身智能机器人的魅力。

将“国宝”一键装进手机

长3.85米,宽1.71米,南京博物院的宝贝《坤舆万国全图》是目前国内现存最早、最完整、内容最丰富的中文世界地图。合合信息把《坤舆万国全图》官方文物复制件带到大会现场,展示了文保数字化的最新探索。旗下扫描全能王推出了业内首创的无限扫描技术,观众通过上下、左右滑动拍摄视频,AI便可消除大尺寸文档图像拼接常见的错位、细节模糊、色彩失真等问题,对局部视频进行“智能拼图”,将绵延的山川湖海、充满奇思妙想的游记、趣味化的动物“表情包”装进手机。当观众点击指定区域时,还能了解400多年前的人们如何认识世界,实现“让文物说话,让历史发声”的数字化体验。

据技术团队成员介绍,此次参展的“无限扫描”技术主要通过AI扫描,解决了大型图片扫描或拍摄过程中存在的“清晰完整难两全”的问题,即使拍摄过程中出现了轻微手抖、角度倾斜等问题,无限扫描也能够在全局性地理解所有“碎片”的内容和联系后,实现每一块“拼图”的精准复位。

“从识别古文到理解古文,人工智能大会一路见证了合合信息的技术跃迁。去年,我们展示了用AI古籍修复模型对敦煌遗书文字‘修旧如旧’的能力;今年展示的无限扫描黑科技,展示了如何用AI对巨型画作进行高清扫描和无痕拼接。”展台负责人徐颖介绍,利用这一技术,人们不仅可以在手机上保存工程图纸、大型手绘图等,还能在旅游、逛展时,高清记录墙绘、壁画等图像,分享专业级画质作品。

一分钟就能创作一首歌

由自由量级孵化的一站式AI音乐创作与消费平台“音潮”在大会上国内首秀,它以秒级的创作速度与易用性,极大程度降低了音乐制作的门槛。

一句话的灵感、一张图片的启发、一段随意哼唱的曲调,通过“音潮”就能带来一首带人声演唱、充满表现力的完整歌曲。依托自研音乐大模型,“音潮”能快速捕捉文字中的情绪、场景、风格;看懂画面中的色彩、氛围、构图;听懂哼唱中音高、节奏,自动生成旋律、节奏、和弦等音乐元素,而完成整个创作的过程只需要短短一分钟,甚至仅仅15秒就能听到这首歌的第一个旋律。“我们的愿景是构建一个由AI赋能的下一代音乐生态平台。”项目负责人张昆介绍,“音潮”的核心竞争力源于全链路自研的音乐大模型。该模型采用行业领先的AR+NAR架构,拥有强大的多模态表征能力,能够捕捉全局动态变化并进行高保真重建。团队依托合作的音乐领域专家,将底层语言模型的训练与专业的音乐制作过程相融入,使得音乐生成不再是一味地模仿,而是真正开展音乐创作。

陪玩伴学能力出众

在金山办公的展台,具备多轮对话和可修改能力的AI办公智能体,让不少“打工人”惊呼“太需要了”!AI办公智能体支持文字、语音、视频等多模态交互,用户通过自然语言、多轮对话即可连贯完成文档创作、演示文稿生成及视频制作全流程,无需手动操作复杂功能,即可实现高效人机协同,让用户告别熬夜赶工PPT的时代。

在商汤科技展台,你能感受到AI伴学新体验——元萝卜全棋种对弈机器人、AI随身学伴等各类多模态交互产品,打造寓教于乐的学习体验;你能体验情感交互升维:全球首款宠物喂养AI毛绒玩具、AI养成潮玩等多款智能交互玩偶,实现多模态温情陪伴。

“这款小米AI眼镜融合商汤最新音视频实时交互系统,成为用户的‘第二大脑’,不仅能帮助用户高效处理信息、记录生活,更在讲解等场景中展现强大实力。”展台工作人员介绍,“而这只桌面萌宠机器人‘小优’集成了商汤多模态交互系统的实时情绪引擎与多模态连续交互能力,实现毫秒级表情响应。”

网易推出了国内首款AI原生学习硬件——有道SpaceOne答疑笔,它深度融合了自研的子曰教育大模型与DeepSeek-R1推理模型双重能力,打造了强大的AI答疑辅导效果。基于多模态视觉模型的更新,答疑笔能“看懂、看清楚”图形题、几何题等复杂题型的细节,并进行推理、整合、检查再输出讲解。

放大

缩小

上一版

下一版

下载

读报纸首页