2026年01月10日 星期六
梁文锋:低调的颠覆者
第28版:封面报道 2026-01-05

梁文锋:低调的颠覆者

王煜

梁文锋 DeepSeek公司创始人

他的睿智、眼界与努力,让全球AI领域在“算力竞赛”的狂热中迎来理性转折。

记者|王煜

2025年12月9日,深度求索(DeepSeek)公司创始人梁文锋登上《自然》杂志年度十大科学人物榜单,让全球科技界的目光再次聚焦于这位来自中国的AI研究者。《自然》称他为“Tech disruptor”,即“科技颠覆者”,这可谓实至名归:2025年年初,他带领团队推出的DeepSeek-R1模型比肩国际顶尖水平,以颠覆性的低成本打破行业垄断,随后开源的决策更让技术创新惠及世界。他的睿智、眼界与努力,让全球AI领域在“算力竞赛”的狂热中迎来理性转折。

横空出世,席卷全球

2025年1月20日,DeepSeek正式发布其R1模型。这是一款“推理型”大语言模型,擅长将复杂任务分解成多个步骤解决,并可展示思维链。它在数学推理、代码编写、自然语言推理等关键任务上,性能比肩OpenAI o1正式版;更关键的是,在同等优秀的性能下,其训练成本大幅减少。

数据显示,R1模型训练仅用不到280万个GPU小时,总成本约4000万元人民币,仅为GPT-4o训练成本的二十分之一;推理成本更是低至每百万token只需1元,相当于GPT-4 Turbo的七十分之一。

DeepSeek-R1如同AI领域的平地惊雷,颠覆了行业对“算力堆料”的认知。在此之前,“显卡提供的算力”一度被认为是AI发展的决定性因素。1月27日,美国显卡厂商英伟达的股价单日下跌17%,市值蒸发超500亿美元,折射出业界对算力与算法关系的重新评估——梁文锋带领他的团队用实践证明:算法创新才是AI发展的核心驱动力。

该模型以开放权重的形式发布,这意味着它能免费下载并扩展。一时间,国内各大互联网平台纷纷接入DeepSeek,它几乎成为国民级的AI模型。

墙里开花,墙外也香。2025年2月,DeepSeek超过ChatGPT,成为苹果美国应用商店排名第一的免费应用,被海外用户称为“来自东方的神秘力量”。

2025年9月,梁文锋团队在《自然》杂志上发表了题为《DeepSeek-R1通过强化学习激励大语言模型推理》的封面论文,首次完整公开了R1模型的构建、训练全过程与惊人成本——训练R1仅花费29.4万美元,即使加上基础模型的600万美元投入,总成本也远低于同类模型动辄数千万美元的常态。R1由此成为全球首个经同行评审的主流大语言模型,获得国际学界认可。同时,DeepSeek为全球AI研究者分享的这份完整的“配方”,提供了可复现、可借鉴的推理模型训练范本。

DeepSeek-R1发布后不久,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价:“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

预见未来的抉择

尽管领衔开发的AI模型爆火,但梁文锋本人却异常低调。如果不是DeepSeek-R1发布的同一天下午他受邀参加国务院座谈会的电视新闻画面曝光,很多人都根本不知道这个1985年出生的“颠覆者”长的是什么样子。

梁文锋出生于广东湛江,父母都是教师。他的本科与硕士均就读于浙江大学信息与电子工程学系,在校时,他曾主攻机器视觉,之后又对机器学习在金融领域全自动量化交易中的应用产生兴趣。

2015年,梁文锋创立“幻方量化”公司,在市场波动中凭借先进的高频量化策略迅速崛起,2016年推出首个AI交易模型。他于2019年主导研发“萤火一号”AI超级计算机。2021年,幻方量化的资产管理规模突破千亿元,跻身国内量化私募“四大天王”之列。

在金融界崭露头角之时,梁文锋将目光投向了更具挑战性的通用人工智能(AGI)领域。他认为:“如果AI能预测股票,为什么不能预测更复杂的世界?”

他从幻方量化的利润中再投10亿元打造“萤火二号”,搭载近万张英伟达A100显卡,只为探索这些芯片在前沿研究中的可能性。

后来他这样比喻:“就像家里买钢琴,一是买得起,二是有一群迫不及待想弹奏的人。”这份看似随性的“尝试”,后来成为破解研发瓶颈的关键钥匙:当其他研究者受困于英伟达的出口限制时,梁文锋早已囤好了足够的“钢琴”。

幻方时期积累的算力建设经验与算法能力,成为DeepSeek后来崛起的重要基础。2023年7月,他正式创办DeepSeek。到2024年底,DeepSeek-V3模型已凭借逻辑推理的优异表现赢得赞誉,直到R1的发布,让梁文锋和他的探索彻底出圈。

坚持开放与原创

2025年1月,在R1模型发布的同时,梁文锋毅然决定同步开源模型权重,并公开全部训练技术细节,这一举措轰动业界。截至2025年9月,R1模型在全球最大AI开源平台Hugging Face的下载量突破1090万次,全球开发者积极参与优化与应用创新。国内的北大团队基于R1开发的“AI数学教练”,使学生解题速度提升40%;非洲开发者借助其搭建农业病害诊断系统,惠及数百万农民。

DeepSeek的开源实践促使多家企业跟进发布开源模型,形成良性竞争的行业生态。2025年4月,梁文锋入选《时代》杂志“全球最具影响力100人”;8月,入选《财富》杂志“2025年全球100位最具影响力商界人士”榜单。

谈及中美之间在AI研发上的差距,梁文锋表示:我们不需要“弯道超车”,因为根本不在同一条赛道上,真正的创新是开辟一条新路。

他说:“表面上中国AI与美国可能仅有一两年的技术代差,但真实的差距是原创和模仿之差。如果这个差距不改变,中国永远只能是追随者,所以有些探索是逃不掉的。”他带领团队,已为这种“深度探索”做出了优秀的榜样。

放大

缩小

上一版

下一版

下载

读报纸首页