此顶级会议最佳论文奖首次颁给中国科研团队

本版

第5版：上海新闻

东航将开通“上海浦东至阿布扎比”航线佘薇兰健全司法环境令营商主体安心此顶级会议最佳论文奖首次颁给中国科研团队曲臂柔舞激光织影去年上海港“吞吐”汽车363万辆
目录

第1版:一版要闻

第2版:全国两会/要闻

第3版:全国两会/话题

第4版:上海新闻

第5版:上海新闻

第6版:上海新闻

第7版:上海新闻

第8版:新民印象/目击

第9版:长三角

第10版:长三角/万象

第11版:国际新闻

第12版:文体新闻

第13版:文体新闻/体育

第14版:夜光杯

第15版:夜光杯

第16版:新民旅游/广告

第5版：上海新闻 2025-03-04

此顶级会议最佳论文奖首次颁给中国科研团队

本报讯（记者郜阳）近日，国际可重构计算领域顶级会议——FPGA 2025在闭幕之际传来消息，今年的最佳论文奖颁发给了无问芯穹和上海交通大学、清华大学共同提出的视频生成大模型推理IP工作FlightVGM。

这项工作首次在FPGA上实现了视频生成模型（Video Generation Models,VGMs）的高效推理。这也是该团队继去年在FPGA上加速大语言模型FlightLLM后的最新系列工作。这是FPGA会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作，也是亚太国家团队首次获此殊荣。

论文第一作者刘军是上海交通大学博士生，共同一作曾书霖是清华大学博士后，通信作者是汪玉和戴国浩。汪玉是IEEE Fellow，清华大学电子工程系教授、系主任和无问芯穹发起人，戴国浩是上海交通大学副教授、无问芯穹联合创始人兼首席科学家。

申城AI基础设施企业无问芯穹长期坚持软硬件协同优化技术路线，以实现硬件效能的数量级提升，而非单纯依赖硬件工艺的缓慢迭代。2024年，无问芯穹的FlightLLM工作就曾作为全球首个文生文大模型推理IP被FPGA会议录用，实现推理性能和性价比的双重跃升。上个月，无问芯穹以视频生成模型稀疏化加速器ViDA拿下另一个国际顶级会议的最佳论文奖——ViDA通过稀疏化加速注意力计算，突破了VDiT（视频扩散Transformer）的计算瓶颈。

此次FlightVGM关注到视频生成模型参数量持续增长的趋势，针对线性层计算提出帧间帧内稀疏化和DSP定浮点混合精度拓展架构等技术，进一步实现全球首个文生视频大模型推理IP，在FPGA上实现性能与能效超越GPU。

据悉，FlightVGM创新了三项关键技术：“时间—空间”激活值在线稀疏化方法，“浮点—定点”混合精度DSP58拓展架构，以及“动态—静态”自适应调度策略，解决了视频生成模型（VGMs）在推理过程中表现出的时空冗余性等问题。

业内人士告诉记者，大模型部署成本的核心制约在于运行效率，该指标由算法、软件及硬件效率共同决定。在算法与软件迭代速率边际递减的产业背景下，硬件效能突破将成为降低模型推理成本的重要“胜负手”。

据了解，包括FlightVGM在内，系列研究成果已被集成到无问芯穹自研大模型推理IP LPU之中，并已与合作伙伴开展合作验证。

无问芯穹方面表示，随着VGM计算需求的增长，FlightVGM展示了如何通过FPGA的软硬件协同创新，实现更高能效的文生视频大模型推理。未来，通过探索“AIE（AI Engine）+HBM（High Bandwidth Memory）”的全新FPGA架构，FPGA有望为视频生成任务提供更高效的计算支持，成为未来计算平台的重要选择。