梁文锋：低调的颠覆者

本版

第28版：封面报道

梁文锋：低调的颠覆者
目录

第1页:封面

第3页:新民一周

第6页:封面报道

第7页:封面报道

第8页:封面报道

第9页:封面报道

第10页:封面报道

第11页:封面报道

第12页:封面报道

第13页:封面报道

第14页:封面报道

第15页:封面报道

第16页:封面报道

第17页:封面报道

第18页:封面报道

第19页:封面报道

第20页:封面报道

第21页:封面报道

第22页:封面报道

第23页:封面报道

第24页:封面报道

第25页:封面报道

第26页:封面报道

第27页:封面报道

第28页:封面报道

第29页:封面报道

第30页:封面报道

第31页:封面报道

第32页:封面报道

第33页:封面报道

第34页:封面报道

第35页:封面报道

第36页:封面报道

第37页:封面报道

第38页:封面报道

第39页:封面报道

第40页:封面报道

第41页:封面报道

第42页:封面报道

第43页:封面报道

第44页:封面报道

第45页:封面报道

第46页:封面报道

第47页:封面报道

第48页:封面报道

第49页:封面报道

第50页:封面报道

第51页:封面报道

第52页:封面报道

第53页:封面报道

第54页:封面报道

第55页:封面报道

第56页:封面报道

第57页:封面报道

第58页:封面报道

第59页:封面报道

第60页:封面报道

第61页:封面报道

第62页:封面报道

第63页:封面报道

第64页:广域/读家

第65页:广域/读家

第66页:广域/七日谈

第67页:广域/观察家

第68页:广域/漫漫谈

第69页:广域/漫漫谈

第70页:广域/城与事

第71页:广域/城与事

第72页:何以中华/本周博物

第73页:何以中华/本周博物

第74页:专栏/人间声色

第76页:专栏/前廊众生

第77页:专栏/假装专家

第78页:艺术

第79页:读书

第80页:影视

第28版：封面报道 2026-01-05

王煜

梁文锋 DeepSeek公司创始人

他的睿智、眼界与努力，让全球AI领域在“算力竞赛”的狂热中迎来理性转折。

记者｜王煜

2025年12月9日，深度求索（DeepSeek）公司创始人梁文锋登上《自然》杂志年度十大科学人物榜单，让全球科技界的目光再次聚焦于这位来自中国的AI研究者。《自然》称他为“Tech disruptor”，即“科技颠覆者”，这可谓实至名归：2025年年初，他带领团队推出的DeepSeek-R1模型比肩国际顶尖水平，以颠覆性的低成本打破行业垄断，随后开源的决策更让技术创新惠及世界。他的睿智、眼界与努力，让全球AI领域在“算力竞赛”的狂热中迎来理性转折。

横空出世，席卷全球

2025年1月20日，DeepSeek正式发布其R1模型。这是一款“推理型”大语言模型，擅长将复杂任务分解成多个步骤解决，并可展示思维链。它在数学推理、代码编写、自然语言推理等关键任务上，性能比肩OpenAI o1正式版；更关键的是，在同等优秀的性能下，其训练成本大幅减少。

数据显示，R1模型训练仅用不到280万个GPU小时，总成本约4000万元人民币，仅为GPT-4o训练成本的二十分之一；推理成本更是低至每百万token只需1元，相当于GPT-4 Turbo的七十分之一。

DeepSeek-R1如同AI领域的平地惊雷，颠覆了行业对“算力堆料”的认知。在此之前，“显卡提供的算力”一度被认为是AI发展的决定性因素。1月27日，美国显卡厂商英伟达的股价单日下跌17%，市值蒸发超500亿美元，折射出业界对算力与算法关系的重新评估——梁文锋带领他的团队用实践证明：算法创新才是AI发展的核心驱动力。

该模型以开放权重的形式发布，这意味着它能免费下载并扩展。一时间，国内各大互联网平台纷纷接入DeepSeek，它几乎成为国民级的AI模型。

墙里开花，墙外也香。2025年2月，DeepSeek超过ChatGPT，成为苹果美国应用商店排名第一的免费应用，被海外用户称为“来自东方的神秘力量”。

2025年9月，梁文锋团队在《自然》杂志上发表了题为《DeepSeek-R1通过强化学习激励大语言模型推理》的封面论文，首次完整公开了R1模型的构建、训练全过程与惊人成本——训练R1仅花费29.4万美元，即使加上基础模型的600万美元投入，总成本也远低于同类模型动辄数千万美元的常态。R1由此成为全球首个经同行评审的主流大语言模型，获得国际学界认可。同时，DeepSeek为全球AI研究者分享的这份完整的“配方”，提供了可复现、可借鉴的推理模型训练范本。

DeepSeek-R1发布后不久，游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价：“太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”

预见未来的抉择

尽管领衔开发的AI模型爆火，但梁文锋本人却异常低调。如果不是DeepSeek-R1发布的同一天下午他受邀参加国务院座谈会的电视新闻画面曝光，很多人都根本不知道这个1985年出生的“颠覆者”长的是什么样子。

梁文锋出生于广东湛江，父母都是教师。他的本科与硕士均就读于浙江大学信息与电子工程学系，在校时，他曾主攻机器视觉，之后又对机器学习在金融领域全自动量化交易中的应用产生兴趣。

2015年，梁文锋创立“幻方量化”公司，在市场波动中凭借先进的高频量化策略迅速崛起，2016年推出首个AI交易模型。他于2019年主导研发“萤火一号”AI超级计算机。2021年，幻方量化的资产管理规模突破千亿元，跻身国内量化私募“四大天王”之列。

在金融界崭露头角之时，梁文锋将目光投向了更具挑战性的通用人工智能（AGI）领域。他认为：“如果AI能预测股票，为什么不能预测更复杂的世界？”

他从幻方量化的利润中再投10亿元打造“萤火二号”，搭载近万张英伟达A100显卡，只为探索这些芯片在前沿研究中的可能性。

后来他这样比喻：“就像家里买钢琴，一是买得起，二是有一群迫不及待想弹奏的人。”这份看似随性的“尝试”，后来成为破解研发瓶颈的关键钥匙：当其他研究者受困于英伟达的出口限制时，梁文锋早已囤好了足够的“钢琴”。

幻方时期积累的算力建设经验与算法能力，成为DeepSeek后来崛起的重要基础。2023年7月，他正式创办DeepSeek。到2024年底，DeepSeek-V3模型已凭借逻辑推理的优异表现赢得赞誉，直到R1的发布，让梁文锋和他的探索彻底出圈。

坚持开放与原创

2025年1月，在R1模型发布的同时，梁文锋毅然决定同步开源模型权重，并公开全部训练技术细节，这一举措轰动业界。截至2025年9月，R1模型在全球最大AI开源平台Hugging Face的下载量突破1090万次，全球开发者积极参与优化与应用创新。国内的北大团队基于R1开发的“AI数学教练”，使学生解题速度提升40%；非洲开发者借助其搭建农业病害诊断系统，惠及数百万农民。

DeepSeek的开源实践促使多家企业跟进发布开源模型，形成良性竞争的行业生态。2025年4月，梁文锋入选《时代》杂志“全球最具影响力100人”；8月，入选《财富》杂志“2025年全球100位最具影响力商界人士”榜单。

谈及中美之间在AI研发上的差距，梁文锋表示：我们不需要“弯道超车”，因为根本不在同一条赛道上，真正的创新是开辟一条新路。

他说：“表面上中国AI与美国可能仅有一两年的技术代差，但真实的差距是原创和模仿之差。如果这个差距不改变，中国永远只能是追随者，所以有些探索是逃不掉的。”他带领团队，已为这种“深度探索”做出了优秀的榜样。