2025年04月24日 星期四
无人驾驶离我们还有多远
第9版:科技前沿 2025-04-23

无人驾驶离我们还有多远

图IC

话题主持:

本报记者张炯强 郜阳 王蔚

当下,智能驾驶风靡一时。车企纷纷宣扬:无人驾驶已经到来。高速公路上驾驶员熟睡的视频频频出现,与之相伴的,还有一起起严重的交通事故。智能驾驶是否意味着无人驾驶?真正的无人驾驶离我们还有多远?其中伦理问题该如何认定?法规又该如何跟进?

同济大学上海自主智能无人系统科学中心教授范睿:

技术全面成熟已不遥远但广泛普及仍面临挑战

问:无人驾驶技术的最新进展及其最新技术支撑是什么?

答:当前,无人驾驶技术正处于迅速发展阶段,涵盖了感知、定位、建图、路径规划与控制等多个核心技术模块。随着算法、硬件和算力的不断进步,这一领域在理论研究与工程实践中都取得了显著突破。

以我的研究为例,主要从事无人驾驶中的环境感知方向。近年来,无人驾驶感知技术的研究热点主要集中在以下几个方面:

一是基于BEV(鸟瞰视图)表示的感知方法。这类方法能够有效统一来自不同传感器(如摄像头、激光雷达等)的信息,在空间理解和下游任务中具有更高的鲁棒性与泛化能力。

二是多源异构数据的深度融合感知技术,旨在充分挖掘和协同利用视觉、激光雷达、毫米波雷达、GNSS(全球导航卫星系统)等传感器的信息,提升系统在复杂动态环境下的感知精度与鲁棒性。

三是面向端到端学习范式的研究也日益受到关注,该方向试图通过构建统一模型框架,直接从传感器原始输入预测驾驶控制决策,从而简化传统模块化系统的冗余流程,提高系统的整体协同与实时响应能力。

除了感知模块的发展外,大模型、强化学习、NeRF(神经辐射场)等人工智能领域的新兴技术也正逐步引入无人驾驶系统中,为其带来更强的场景理解、决策推理以及自适应学习能力。

未来,无人驾驶系统的发展将更加依赖于感知、决策与控制等各模块之间的深度融合,以及模型在开放世界中自我学习和进化的能力。

问:无人驾驶目前的主要问题何在?

答:当前无人驾驶技术在算法性能和系统集成层面已取得显著进展,尤其是在结构化环境中的感知、决策与控制方面,部分技术方案已初步具备实用化条件。然而,距离真正实现“全场景、全时段”的完全无人驾驶,仍存在多个挑战。

安全性是无人驾驶落地的前提。尽管仿真与实车测试可以覆盖大量典型场景,但仍难以穷尽现实世界中千变万化的“长尾场景”,如突发道路施工、儿童追球穿越马路等。这些少见但高风险的情况对系统的感知—决策—控制链路提出极高要求。

此外,伦理问题也是当前乃至未来无人驾驶发展中无法回避的重要议题。在复杂城市环境中,车辆需要与行人、非机动车乃至其他驾驶员进行高度动态的博弈与协同,这不仅仅是技术问题,更牵涉到用户信任、法律法规、责任界定等多维度挑战。

因此,我对无人驾驶技术本身的成熟持乐观态度,但对于其大规模普及所面临的伦理、法律、社会接受度等问题仍持审慎看法。毕竟,技术的“可实现性”并不等于现实中的“可接受性”,无人驾驶的发展需要科学、产业与社会各界的协同推进。

问:您的技术团队主要工作是什么?

答:我的团队主攻开放场景下机器人多任务联合视觉感知,借鉴人类的“双流”视觉感知系统,深入研究了空间信息获取和语义场景解析两大核心任务,攻克了多传感器外参标定、双目立体匹配、信息融合语义分割三大研究领域中的多个关键技术难题。比如,针对多相机—激光雷达系统中因传感器振荡和安装不稳等因素导致的外参变化问题,先后设计了多相机、相机—激光雷达的外参在线标定方法,为空间信息获取系统提供了精确的基准真值。同时,显著增强了道路三维重建系统的整体性能。近期还带领团队自主开发了全球首个双目立体匹配大模型,其精度与泛化能力均达到了国际领先水平。

问:无人驾驶汽车是一个类似“变形金刚”那样的机器人概念吗?

答:无人驾驶汽车本质上是一种高度复杂且形态特殊的智能机器人。它虽然在外观和功能上与传统意义上的机器人存在一定差异,但在核心技术架构上,两者有诸多共通之处。我认为它要求AI技术可信可解释,具备跨场景泛化与适应的能力,以及跨模态认知、常识推理与自我学习进化的能力。

问:无人驾驶的商业化运作是否可行?

答:从技术角度来看,无人驾驶的全面成熟已经不再遥远。然而,真正要实现无人驾驶技术在日常生活中的广泛普及,不仅需要技术的进一步精进,更需要社会层面的广泛接受与制度层面的全面配套。这包括交通法规的更新、伦理规范的建立、保险与责任机制的完善,以及公众对无人驾驶技术信任度的持续提升。

本报记者 张炯强

人机物三元融合时代的伦理挑战

之江实验室智能社会治理实验室 吕明杰

人类社会正在步入一个人机物三元融合的时代。当北京亦庄的自动驾驶出租车因突降暴雨误判道路标线,与交通信号灯系统发生数据冲突时,这场技术故障不仅暴露了算法漏洞,更揭示了人—机—物三元融合时代的深层伦理困境——在智能汽车、城市基础设施与人类行为构成的复杂网络中,技术系统的自主决策权如何分配?数据主权归属何方?生命价值能否被量化计算?

当下,自动驾驶面临着典型伦理困境:

(一)责任归属的模糊性困境 2018年,Uber自动驾驶测试车在亚利桑那州撞死一名行人,这起事故引发了强烈的责任归属争议。事故发生时,车辆处于自动驾驶模式,安全员未能及时干预。从“人”的角度,安全员可能因失职需承担责任;从“机”的方面,算法缺陷或系统漏洞也可能是事故原因;从“物”的层面,道路状况、天气因素或许影响了传感器的感知精度。最终,Uber仅承担民事赔偿,未受到刑事指控,这种结果凸显了在人—机—物交互场景下,责任界定缺乏清晰的标准和法律依据,难以对相关主体进行有效追责。

(二)隐私与数据安全的严峻威胁 数据是人工智能技术发展的关键要素,自动驾驶汽车运行过程中会收集大量数据,包括驾驶者的行程信息、生物特征,以及道路、周边物体的各类数据。黑客可通过攻击获取车辆行驶轨迹和车内人员信息。一旦泄露,不仅侵犯个人隐私,还可能影响公共安全,例如恶意篡改交通数据导致交通瘫痪。

(三)价值冲突与决策伦理的矛盾 当自动驾驶车辆面临紧急情况时,不同主体的价值诉求往往会产生冲突。

2016年,麻省理工学院开展了一项名为“道德机器”(Moral Machine)的在线实验,模拟“电车难题”场景,保护车内乘客安全可能会牺牲行人,而优先保护行人又可能损害乘客利益。这背后涉及“人”的生命权、“机”的算法价值取向以及“物”的物理限制。

实验结果显示,不同文化背景的人群在选择上存在显著差异,这充分体现了伦理决策的复杂性和多样性,这使得人工智能算法难以制定统一的决策标准。

传统伦理体系主要基于人与人之间的关系构建,在人—机—物三元融合时代,面对人、机、物之间的新型关系,传统伦理难以提供有效的指导。需要重新构建适应三元融合的伦理理论和规范体系。

人—机—物三元融合正在重塑技术伦理的底层逻辑。正如控制论创始人诺伯特·维纳(NorbertWiener)在《人有人的用处》中所说:“我们必须学会与技术系统共同进化,在承认物之能动性的基础上,重建包含人、机、物的新伦理契约。”唯有如此,三元融合才能真正成为文明进步的阶梯,自动驾驶也真正从“风险游戏”升华为“安全革命”,在敬畏生命的底色下驶向未来。

原生流式多模态大模型带来人机交互体验的变革

智能汽车可以拥有“有趣的灵魂”

AGI时代下,“未来汽车”出行会是怎么样的?在2025上海车展开幕之际,记者采访了商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚。商汤绝影是专注于汽车行业领先的AI公司,旨在推动智能汽车加速驶入通用人工智能时代。

问:AGI赋能下,会给智能汽车带来哪些主要变革?

答:我认为主要在三方面:第一是通过原生流式多模态大模型带来的人机交互体验的变革;第二是通过端到端智驾技术的升级,带来极致自动驾驶安全和效率;第三是舱驾融合驱动智能汽车往超级智能体方向演进,极大拓展了人与物理和数字世界的连接。

在智能汽车的应用部署上,绝影制定了端云协同的部署策略,通过意图分流来进行任务在端云两侧的协同,当前场景任务有80%是在端侧处理。端云协同的方式可覆盖广泛的场景交互,保证安全可靠、实时响应,并充分保障个人隐私安全。

问:在“舱—驾—云”三方面,现在有哪些被业界广泛认可的解决方案?

答:在智能驾驶领域,我们在2022年发布了行业首个感知决策一体化的辅助驾驶通用模型UniAD,这是和特斯拉FSD一样的一段式端到端方案,获得2023年国际计算机视觉与模式识别会议的最佳论文,引领行业的潮流。今年,我们又发布了行业首个与世界模型协同交互的端到端智驾技术方案R-UniAD,让世界模型和强化学习框架相结合,构建生成式智驾新范式,这也是今年行业都非常认可的技术方案。

面向智能座舱,我们打造了新一代座舱情感引擎New Member“家庭新成员”,能够察言观色、无时不在、与你心有灵犀,让每一辆车拥有“有趣的灵魂”,这个产品得到很多认可,已经在知名车企量产交付了。

我们还有更多的AI产品也都是创新性的,比如我们有一个全场景健康管家产品,3月份量产上车了星途揽月,是行业首个量产上车的医疗AI大模型产品。

问:大模型为智能汽车的发展带来了哪些助力?

答:绝影打造了世界模型“开悟”——它可以理解真实世界中的“物理法则”和“交通规则”,并在此基础上,能够生成“准确”的场景。“开悟”生产数据的效率很高,生成的场景是可控的,能细微到“元素级别”,生成场景非常精细,完全满足端到端模型训练和仿真对于数据质量的高要求。

上海车展上,“开悟”世界模型也升级到了2.0版本,结合强化学习框架,能够实现端到端算法和世界模型的协同交互,打破数据瓶颈,让辅助驾驶的安全更有确定性。

New Member“家庭新成员”背后则离不开多模态大模型的支持,绝影的原生流式多模态大模型让世间万物都可被感知、被理解、被交互。我们在端侧部署了商汤的日日新V6多模态大模型,New Member能够做到多模态识人,汽车不仅能够认识你,还可以理解你,不再是被动响应,而是成为一个懂你、会揣摩你心思的“聪明搭子”,能够真正参与座舱内的多人多轮对话,既不过度打扰,又能时刻陪伴。 本报记者 郜阳

放大

缩小

上一版

下一版

下载

读报纸首页