2025年02月24日 星期一
梁文锋素描:我只是不小心成为一条鲇鱼
第17版:封面报道 2025-02-24

梁文锋素描:我只是不小心成为一条鲇鱼

吴雪

2025年1月08日,航拍中国(杭州)人工智能小镇城市建筑风景。近年来,以DeepSeek为代表的“杭州六小龙”火出了圈。

梁文锋出席了由中共中央政治局常委、国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

在内部员工看来,梁文锋则完全不像老板,更像一个极客。时至今日,他仍然延续着低调作风,和公司其他研究员一样,每天看论文,写代码,参与小组讨论。

记者|吴雪

DeepSeek,太火了。

2月16日,广东、江苏、内蒙古、江西等多地宣布,其政务服务系统接入DeepSeek系列大模型。三大电信运营商、中石油、中石化、百度、腾讯等中企巨头也纷纷宣布,与DeepSeek展开合作。无论是行业内的专家,还是普通人,都在争相使用这款AI产品。在资本市场上,多只DeepSeek“概念股”连续涨停。DeepSeek背后的人物—公司创始人、85后广东小伙梁文锋,自然也成为舆论关注焦点。

有业内专家估算,中国AI企业DeepSeek的估值可能高达1500亿美元,公司创始人梁文锋的身家有望跻身全球富豪榜前列,甚至可能超越英伟达创始人黄仁勋。在接受媒体采访时,梁文锋曾表示,“我们不是有意成为一条鲇鱼,只是不小心成了一条鲇鱼”。

如果说梁文锋的鲇鱼效应,在于证明了用低成本也能高效率训练出AI大模型,无意卷到了BAT。去年一年,黄仁勋则在制造另一种鲇鱼效应,即以每6个月为周期,更新更高性能的芯片,使得害怕抢不到最新GPU而掉队的巨头们,疯抢英伟达GPU,微软、谷歌、Meta、马斯克,都被拽进了这场GPU大作战游戏里。

一年后,DeepSeek成为硅谷眼中“神秘的东方力量”,Scale AI创始人亚历山大·王(Alexandr Wang)评价道,“过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会‘改变一切’”。

从湛江少年到震撼硅谷创新者

1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。其中,梁文锋的出席,刷屏科技圈。

从一位普通的湛江少年,到震撼硅谷的AI创新者。梁文锋的故事,是一段关于技术、勇气和坚持的传奇。梁文锋,1985年出生于广东湛江的一个普通家庭,父亲是一名小学老师,自幼,他就是大家眼中的“学霸”,对数字与逻辑的敏感性远超同龄人。

初中时,梁文锋就喜欢拆装电脑,并学完了高中的数学课程,甚至学到了大学的微积分。

2002年,17岁的梁文锋以优异成绩考入浙江大学电子信息工程专业,成为家族中第一个进入顶尖高校的孩子。当时的电子信息工程是浙大的王牌学科。

据上海艾麒信息创始人、董事长周朝恩回忆,读研期间,梁文锋以实习生身份加入艾麒,后经推荐直接担任新技术部经理,给予月薪16000元,算是高薪特别聘请。周朝恩称,“初见梁文锋时,他戴着一副眼镜,斯文有礼,身材清瘦,给人一种文静内敛的印象。入职后,他便全身心投入到人工智能视频与图像技术的研究中,常常一整天都待在办公室里,专注地钻研技术难题,甚至半天都不出来一次。”与梁文锋深入接触后,周朝恩发现“他虽不善言辞,但在技术交流中却能清晰地表达自己的观点,展现出强大的逻辑思维能力。”

梁文锋和幻方的故事始于2008年。

那一年,全球金融危机爆发。毕业后的梁文锋没有像同龄人一样进入大厂当码农,而是一个人跑到成都,蜗居在出租屋里。几番折腾下来,他决定下场做量化投资,梁文锋敏锐地察觉到技术和数据或许能打开市场突破口。但这个决定并不容易,毕竟当时量化在国内还是个新事物。很多人并不相信量化可以赚钱。

于是,他拉上几个同学,尝试着用各种算法模型来预测股市走势,没日没夜地写代码、调参数,经常熬夜到凌晨。每当遇到困难时,梁文锋总会想起量化投资之父西蒙斯的一句话:一定有办法对价格建模。股指期货推出后,他们利用模型预测股指期货的涨跌,进行高频交易,交易很快就获得了丰厚的回报。

2010年,沪深300股指期货推出,量化投资迎来了春天。乘着这股东风,梁文锋和他的团队大赚一笔,自营资金超过5亿元。同年,30岁的梁文锋与徐进正式创办幻方量化(High-Flyer)。短短一年内,幻方量化成立了20只产品,迅速成为量化投资领域的佼佼者。

2015年12月1日,水木社区转发了一则招聘启事,讲了一个创业故事:“2008年,L先生带着8万元本金,开始了自己独立的量化交易之路。2015年,经历过7年熊市牛市大轮回的L先生,以每年超过100%的复合收益率迈入了亿元富豪的队伍。‘幻方’取自于中国古代洛书《九宫图》,是一种特殊的矩阵,是科学的结晶与吉祥的象征。L先生的理想是有朝一日能够与世界级的量化交易泰斗——西蒙斯的文艺复兴公司相媲美。”

随后几年,梁文锋不断扩大AI算法研究团队,将人工智能技术深度融入量化策略。2021年8月,幻方量化的资金管理规模一度突破千亿元,与九坤投资、明汯投资、灵均投资一起,被业界称为量化私募领域的“四大天王”。这一年,梁文锋在金牛奖颁奖典礼上发表演讲,指出“量化投资的未来,是用技术让市场更有效率”。

跨界AI:DeepSeek的横空出世

“不求他人,不靠资本,就自己干,有钱了给新事业融资。”梁文锋曾断言,“中国必然需要有人站到技术的前沿”。而这一次,DeepSeek先踏上浪头。在鲇鱼的外观之下,DeepSeek在梁文锋眼中,内里则满是技术理想主义的叙事。

2023年,38岁的梁文锋在杭州投资创办了深度求索(DeepSeek),这是一家专注于AI大模型研发的公司,目标是用低成本、高性能的技术,打破国际巨头在人工智能领域的垄断。而后来故事是,DeepSeek在未有任何顶流资本加持下,仍然坚强地活了下来。

2024年5月,DeepSeek-V2凭借出色的性能和性价比,引发了一场大模型价格战,引发国内巨头纷纷降价;真正爆发点,出现在2024年12月。

梁文锋带领团队发布了新一代大模型DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。这款模型不仅在数学运算、代码生成和中文问答等方面表现出色,更令人震惊的是,它的训练成本仅为557.6万美元,而OpenAI的GPT-4o训练成本高达7800万美元。

更有网友调侃,“DeepSeek活成了真OpenAI(开放模型),而OpenAI活成了close AI(封闭模型)”。在梁文锋看来,中国要逐步成为创新贡献者,而不是一直搭便车。早在上大学时,梁文锋就笃定:AI一定会改变世界。毕业后,他在量化投资上赚了足够多的钱。这使得他有足够的资本听从内心的声音,去做自己喜欢的事情,而不是首先权衡利弊得失。

曾经有业内人士表示:梁文锋是中国AI界非常罕见的人,他拥有恐怖的学习能力,兼具强大的infra工程和模型研究能力,又能调动资源。在内部员工看来,梁文锋则完全不像老板,更像一个极客。时至今日,他仍然延续着低调作风,和公司其他研究员一样,每天看论文,写代码,参与小组讨论。

选人标准更是与主流格格不入。DeepSeek的成功并非偶然,他组建的一支本土年轻程序员团队,不依赖海归或高级技术专家。团队成员大多是应届毕业生或工作经验不超过5年的年轻人,大多是数学竞赛一等奖、拿过国际金牌的算法人才。梁文锋认为,“创新需要摆脱惯性,经验有时会成为包袱”。

在梁文锋看来,如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。

在这点上,奥尔特曼与梁文锋有着一致的想法。“OpenAI早期投资人投钱时,想的一定不是我要拿回多少回报,而是真的想做这个事。”

在采访中,梁文锋面对大模型烧钱的相关提问表示,如果一定要找一个商业上的理由,(一个商业公司去做一种无限投入的研究性探索)可能是找不到的,因为划不来。从商业角度来讲,基础研究投入回报比很低。但“一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人”。

真正的差距在于原创性不仅仅是时间

爆火之下,梁文锋还需要回答更多的新问题。

有媒体尝试让DeepSeek作为一名记者,对梁文锋提一个问题,这是DeepSeek的回答:“DeepSeek宣称其模型训练成本仅为行业1/10,但有开发者指出,这可能是通过大幅缩减模型参数规模或依赖幻方早期囤积的廉价算力实现的,而非真正的技术突破。您是否承认这种‘成本优势’本质是金融资源套利,而非算法创新?”

令人惊讶的是,这个由DeepSeek问出的问题,几乎可以概括如今围绕着DeepSeek的大部分争议。正如ChatGPT横空出世让OpenAI成为当之无愧的AI头部企业,英伟达的GPU凭借高性能成为算力基础,让黄仁勋享尽高光,现在,DeepSeek的R1模型,却只能证明梁文锋有能力做出一个和OpenAI最新模型相差无几的模型。

当有媒体提问:“为什么DeepSeek V2会让硅谷许多人感到意外?”梁文锋认为,在美国,每天都有各种创新出现,从这个角度看,我们的突破并不算特别。但他们惊讶的是,一家中国公司不仅仅是跟随者,而是以创新者的身份加入了他们的竞争。

这与大多数中国企业习惯的模式完全不同。

一方面我们不可否认,不想成为鲇鱼的理想主义者梁文锋,意外“卷到了”所有人。周朝恩说,DeepSeek不需要注册,可以免费使用,极大地降低了用户使用AI技术的门槛。DeepSeek主动向全球开发者社区分享核心技术成果,这种开放态度不仅赢得了国际认可,也推动了行业技术生态的快速发展。

另一方面,又要看到,做一个和OpenAI最新模型相差无几的模型,还远谈不上真正的超越。需要肯定的是,站在OpenAI这个巨人的肩上,梁文锋带领DeepSeek实现了一场颇为惊艳的突围,但什么时候能够赶在OpenAI前面推出未来一代模型,如GPT-5,那时才是梁文锋技术理想的AHA时刻。

在梁文锋身上,我们依稀看到了乔布斯、马斯克、黄仁勋的影子。“中国AI不可能永远处在跟随的位置!”“真正的差距不是一年或两年,而是原创与模仿之差。”

这两句从梁文锋口中喊出的话,不仅事关AI产业,也是中国企业在跟随、模仿了西方几十年后,不得不面对的突破方向。

低垂的果子都被摘完了,只有敢于突破,才能找到新的出路。梁文锋并不孤单。今天,从大疆无人机汪滔,到宇树机器人王兴兴……一大批新生代企业家,正将中国科技产业带向无人区。

读报纸首页