2025年03月31日 星期一
东航将开通“上海浦东至阿布扎比”航线 佘薇兰  健全司法环境令营商主体安心 此顶级会议最佳论文奖首次颁给中国科研团队 曲臂柔舞  激光织影 去年上海港“吞吐”汽车363万辆
第5版:上海新闻 2025-03-04

此顶级会议最佳论文奖首次颁给中国科研团队

本报讯(记者 郜阳)近日,国际可重构计算领域顶级会议——FPGA 2025在闭幕之际传来消息,今年的最佳论文奖颁发给了无问芯穹和上海交通大学、清华大学共同提出的视频生成大模型推理IP工作FlightVGM。

这项工作首次在FPGA上实现了视频生成模型(Video Generation Models,VGMs)的高效推理。这也是该团队继去年在FPGA上加速大语言模型FlightLLM后的最新系列工作。这是FPGA会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,也是亚太国家团队首次获此殊荣。

论文第一作者刘军是上海交通大学博士生,共同一作曾书霖是清华大学博士后,通信作者是汪玉和戴国浩。汪玉是IEEE Fellow,清华大学电子工程系教授、系主任和无问芯穹发起人,戴国浩是上海交通大学副教授、无问芯穹联合创始人兼首席科学家。

申城AI基础设施企业无问芯穹长期坚持软硬件协同优化技术路线,以实现硬件效能的数量级提升,而非单纯依赖硬件工艺的缓慢迭代。2024年,无问芯穹的FlightLLM工作就曾作为全球首个文生文大模型推理IP被FPGA会议录用,实现推理性能和性价比的双重跃升。上个月,无问芯穹以视频生成模型稀疏化加速器ViDA拿下另一个国际顶级会议的最佳论文奖——ViDA通过稀疏化加速注意力计算,突破了VDiT(视频扩散Transformer)的计算瓶颈。

此次FlightVGM关注到视频生成模型参数量持续增长的趋势,针对线性层计算提出帧间帧内稀疏化和DSP定浮点混合精度拓展架构等技术,进一步实现全球首个文生视频大模型推理IP,在FPGA上实现性能与能效超越GPU。

据悉,FlightVGM创新了三项关键技术:“时间—空间”激活值在线稀疏化方法,“浮点—定点”混合精度DSP58拓展架构,以及“动态—静态”自适应调度策略,解决了视频生成模型(VGMs)在推理过程中表现出的时空冗余性等问题。

业内人士告诉记者,大模型部署成本的核心制约在于运行效率,该指标由算法、软件及硬件效率共同决定。在算法与软件迭代速率边际递减的产业背景下,硬件效能突破将成为降低模型推理成本的重要“胜负手”。

据了解,包括FlightVGM在内,系列研究成果已被集成到无问芯穹自研大模型推理IP LPU之中,并已与合作伙伴开展合作验证。

无问芯穹方面表示,随着VGM计算需求的增长,FlightVGM展示了如何通过FPGA的软硬件协同创新,实现更高能效的文生视频大模型推理。未来,通过探索“AIE(AI Engine)+HBM(High Bandwidth Memory)”的全新FPGA架构,FPGA有望为视频生成任务提供更高效的计算支持,成为未来计算平台的重要选择。

放大

缩小

上一版

下一版

下载

读报纸首页