春节期间,DeepSeek一跃成为全球瞩目的焦点。现今全球各大芯片厂商和智算云服务厂商更是积极响应,跟进适配。半个月来,DeepSeek相关话题热度居高不下,已成为全球科技、经济乃至政治领域的重要话题。
在全球人工智能技术竞争日趋白热化的当下,中国科技企业正凭借独特的创新路径,深度参与这场意义深远的变革当中。DeepSeek的成功,也将更多优秀的中国AI企业推向世界舞台的聚光灯下。
近日,国际最权威的科技商业媒体之一,也是世界上最古老的技术杂志和影响力最大的科技商业化智库之一的《麻省理工科技评论》刊发了一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道,指出阶跃星辰(Stepfun)、面壁智能(ModelBest)、智谱AI(Zhipu)、无问芯穹(Infinigence AI)四家企业同样展现出相当不俗的技术实力与全球竞争力。
四大新锐各具特色
获得《麻省理工科技评论》点名的这四家备受瞩目的AI新锐中,首先是成立于2023年4月、由前微软高级副总裁姜大昕创立的阶跃星辰。虽然阶跃星辰起步相对较晚,但凭借着一系列基础模型的成功,迅速崭露头角。去年,阶跃星辰已经发布了11款基础AI模型,涵盖了语言、视觉、视频、音频以及多模态系统等多个领域,其大型语言模型Step-2参数超1万亿,在第三方基准测试网站LiveBench上,仅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能由清华大学知名研究团队于2022年共同创立,专注于效率提升,顺应端侧模型发展趋势,推出了MiniCPM系列模型,被形象地称为“小钢炮”。该系列模型专为智能手机、个人电脑、汽车系统、智能家居设备乃至机器人等终端设备的实时处理设计,其最新的MiniCPM 3.0仅有40亿参数,但在多个基准测试中,性能与GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板电脑上实现了GPT-4o级别的效果。
同样源于清华大学的智谱AI,已发展成为一家与政府、学术界联系紧密的企业。智谱AI既专注于基础模型研发,也基于模型开发了对话模型ChatGLM和视频生成工具清影(Ying)等一系列AI产品。最先进的大语言模型GLM-4-Plus通过高质量合成数据训练,在降低成本的同时,还实现了与GPT-4相媲美的性能表现;视觉模型GLM-4V-Plus则在赋予AI更多“智能体”能力上迈出了重要一步。
初创企业无问芯穹虽然仅成立不满2年,但却已经吸引了近10亿元(1.4亿美元)的融资,并被誉为“中国CoreWeave”。《麻省理工科技评论》指出,无问芯穹专注于AI基础设施领域而非模型开发,其核心竞争力在于通过“多元异构、软硬协同”的核心技术,打造连接“M种模型”和“N种芯片”的“MxN”AI基础设施新范式,实现多种大模型算法在多元芯片上的高效协同部署,相当于将来自不同品牌的芯片整合在一起形成“异构计算集群”来执行各类AI任务。无问芯穹推出的Infini-AI异构云平台基于多元芯片算力底座,向大模型开发者提供极致性价比的高性能算力和原生工具链,为大模型从开发到部署的全生命流程降本增效,同时其大规模模型的异构分布式混合训练系统HETHUB,可将AI模型训练时长压缩30%,进而打造具有中国特色的高效解决方案。
AI市场话语权飞速提升
记者关注到,这四大AI新锐中,阶跃星辰、面壁智能和无问芯穹均已入驻上海徐汇的模速空间,展现了上海在AI领域战略布局的前瞻性与精准性。据透露,截至2024年年底,模速空间已聚集百余家大模型创新企业;而以模速空间为核心,徐汇区已有255家大模型企业、34个备案大模型、100余家投资机构成功落地,为未来孕育更多优质AI企业、构建更为成熟完善的产业生态筑牢根基。
记者另从2025全球开发者先锋大会(GDC)媒体通气会上获悉,2024年上海人工智能产业规模突破4000亿元,同比增长超过7%;截至去年年底,上海共有60款大模型通过国家网信办备案,数量位居全国第二。“一方面,上海基座模型的技术不断创新、能力持续迭代。”上海市委网络安全和信息化委员会办公室总工程师杨海军表示,“另一方面,在‘在线新经济、文旅、金融、教育、医疗’等重点行业、关键领域,上海正在积极拥抱人工智能,激活发展动能。”
另一家申城本土人工智能科技公司MiniMax的副总裁刘华告诉记者,大模型技术目前处于飞速发展阶段,以DeepSeek开源为标志,行业迎来新机遇,希望这是中国大模型在全球AI市场话语权飞速提升的开始,也期待能吸引更多开发者加入。
业界人士指出,中国AI企业正以独特的发展路径重塑全球AI的竞争格局。凭借在原创技术和工程层面实现突破,进而以更高的创新效率,快速追赶国际巨头、构建全新商业模式,乃至树立全球人工智能发展新标准,正是这些中国创新企业的共同特质。本报记者 郜阳