2025年02月14日 星期五
一刷而过,别一笑而过 商汤科技突破模态融合技术 输入一张照片就能生成一部“大片”? 为孩子打造更安全的智能天地
第4版:上海新闻 2025-01-12

输入一张照片就能生成一部“大片”?

申城人工智能科技公司推出“主体参考”,助你圆“电影梦”

创作者上传油画动漫肖像为主体,所创作动画作品把观众带入了童话乐园

你的心中有一个电影梦吗?走入不同角色体验戏中人生,或作为编剧书写平行宇宙里的无限可能。新年伊始,申城人工智能科技公司MiniMax为全球用户带来新的创作帮手——主体参考。

MiniMax最新自研的S2V-01视频模型,通过单图主体参考架构,以传统方案1%以下的输入和计算成本,只需输入一张图片,即可实现视觉细节的精确还原,同时具备高自由度和组合性。

在AI视频生成领域,如何在动态视频中保持人物面部多角度的真实度和稳定性;如何在使用连续片段拼接创作时,使人物角色保持高度一致,始终是困扰业界的难题。MiniMax通过自研的S2V-01视频模型,给用户提供一个新选项。

用户在“海螺AI”中选择“主体参考”功能后,仅需上传一张图片即可识别并锁定主体角色。文本框内输入提示词(Prompt),即可生成富有创意且主体保持一致的高质量视频。

目前,“海螺AI”开放对单个人物进行参考的能力,需要上传可识别的面部信息,作为视频主体生成的面部参考。

由于MiniMax的“主体参考”方案只需要一张图片作为输入,没有额外的训练计算成本和等待时间,生成成本和常规文生视频、图生视频接近。

相较于目前主流方案,“主体参考”既降低了用户的输入成本,也将计算成本降低至百分之一以下,用户的等待时间大幅减少。

为了让视频中只保有主体自身的必要视觉信息(如人的面部特征),而不受姿态、表情、光照等其他信息干扰,MiniMax在数据构造、模型架构和训练策略上做了大量优化——已上线的S2V-01模型实现了两方面的关键效果:视觉细节的精准还原、高自由度+组合性。

记者获悉,AI技术已为微电影、广告、动画等内容制作行业带来了便利,但视频主体在生成过程中容易崩坏是最大的问题,呈现内容往往缺乏灵活性且存在割裂感。

“主体参考”功能的推出为专业创作者提供高度一致的视觉呈现和创作灵活性,将为短视频、广告等多个视频生产行业带来创新,让一致性和连贯性不再是难题。

2024年12月,MiniMax所推出的图生视频模型I2V-01-Live受到广泛好评,“海螺AI”海外访问量超2700万,荣登12月全球AI视频产品榜首位。本报记者 郜阳

放大

缩小

上一版

下一版

下载

读报纸首页