还记得此前,上海AI独角兽、“北斗七星”之一的MiniMax稀宇极智的“官宣周”吗?6月那一周里,MiniMax日更重磅产品,迎来“主场时刻”。
10月的最后一周,MiniMax几乎复刻了上一次的辉煌,掀起了一场AI技术的“全家桶”发布热潮——继10月27日开源文本大模型M2震动全球AI圈,MiniMax接连发布视频模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0,向世界展示了中国AI企业在全模态技术领域的全面突破。
在MiniMax人心里,一直有着一个坚定的信念:加强原始创新和关键核心技术攻关,推动科技创新和产业创新深度融合!
跻身全球文本模型第一梯队
上周一,新一代文本大模型MiniMax M2发布并开源,这款仅有10B激活参数的轻量级模型在全球权威测评榜单Artificial Analysis(AA)上创造了历史性突破——总分冲入全球前五、开源第一,成功跻身全球文本模型第一梯队。
长期以来,全球大模型的“S级”梯队几乎被硅谷巨头们垄断,而M2的出现,首次为这一梯队注入了强劲的中国开源力量。更令人瞩目的是M2的颠覆性定价策略——该模型综合成本低至约0.53美元/百万Token,不及Claude 4.5 Sonnet(Anthropic推出的AI模型)的8%,推理速度是其近两倍。这种“高智能,更实惠”的理念正在从根本上改写AI领域的“算力游戏”规则。
“M2专为编码与智能体任务深度优化,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。”MiniMax相关负责人表示。在模型性能、推理速度、推理成本的“不可能三角”中,M2几乎做到了最佳优化。
MiniMax称,将深化技术开源开放合作,创建具有竞争力的开放创新生态。
记者还了解到,文本模型M2上线仅5天,在API整合平台OpenRouter上的实时调用Token量已经排到了全球第四、国产第一,超过DeepSeek和Qwen;并在编程场景中全球第三。目前,每天的调用量Token仍在迅速增长。
多模态“全家桶”持续更新
紧随M2的发布,上周二最新视频生成模型海螺2.3(Hailuo 2.3)发布。这款在Hailuo 02模型基础上实现全面技术升级的新版本,在动态表现力、风格化呈现以及人物表演细腻度方面取得了显著突破。新版本模型再次刷新了全球视频模型效果成本纪录,在提升性能表现的同时保持了Hailuo 02的原有定价水平,实现了加“量”不加价的承诺。
在语音技术领域,MiniMax发布的Speech 2.6模型同样引人注目。该模型专门针对声音智能体(Voice Agent)场景进行了深度优化,将首包响应时间压到了250毫秒,达到了语音赛道的绝对头部水平。与传统语音指令识别不同,Voice Agent不只是简单将语音转成文字,而是具备完整的交互能力,几乎所有需要“用说话代替打字”的场景,都依赖Voice Agent来承接需求、理解意图并给出反馈。
在音乐生成领域,MiniMax Music 2.0模型也实现了跃升。该模型不仅能够精准捕捉与还原人声的细腻情绪和器乐的动态张力,更像一位“会唱歌的制作人”,懂节奏,也懂情绪。Music 2.0音色无限接近真实人声,能够驾驭多种唱法和情感风格。中国AI展现“算法自信”
在业内人士看来,MiniMax此次“AI全家桶”发布的意义已超越了技术本身,它折射出中国AI在全球科技版图中的角色变迁。能在全模态自研层面都做到模型领先,具有综合研发积累的公司,目前有OpenAI、Google等国际巨头,而MiniMax是唯一一家亚洲公司,也是其中唯一一家创业公司。从Meta对MiniMax底层CISPO算法的“致敬”,到今天MiniMax全模态模型以顶级性能和颠覆性成本向全球开源,中国AI正在完成从应用模仿的“中国制造”到算法原创的“中国创造”的转变。
强大的基础大模型是推动AI与实体经济深度融合的关键。MiniMax的全模态“全家桶”更像是一份中国方案,用性能比肩顶尖水平、成本实现普惠、算法勇于原创的独特AI发展路径,向世界提交答卷。 本报记者 郜阳