2024年05月19日 星期日
女子跑步后出现血尿 竟是“滞留”支架惹祸 “日日新”再上新 争当全能“学霸” 文明实践绘就虹口 美好生活新画卷
第7版:上海新闻/专题 2024-04-24
实现多模态能力 文生视频获突破

“日日新”再上新 争当全能“学霸”

“日日新5.0”在应用产品层面已支持高清长图的解析、理解以及文生图交互式生成,图中画面为商汤秒画AI生成 本报记者 陈炅玮 摄

昨天,商汤科技举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。同时,“日日新”大模型体系升级至5.0版本,综合能力全面对标GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示,在人工智能发展的最基本法则——尺度定律的准则下,商汤持续寻求最优数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

“文理双修”能力大提升

自去年4月问世以来,“日日新”大模型体系已推出五个大版本迭代。徐立介绍,“日日新5.0”的更新,主要增强了知识、数学、推理及代码能力,全面对标GPT-4Turbo,主流客观评测上达到或超越GPT-4 Turbo。

升级后的“日日新”是不偏科的“学霸”——文科能力方面,“日日新5.0”的创意写作能力、推理能力、总结能力均大幅提升。相同的中文知识注入后,可以获得更好的理解、总结及问答,有望为教育、内容产业等垂直应用场景提供有力辅助;理科能力方面,“日日新5.0”的数理能力、代码能力及推理能力达到业内领先水平,或为金融、数据分析等场景落地提供坚实基础。

“‘日日新5.0’的另一大核心突破,是多模态能力。”徐立表示,“其图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位。”

值得一提的是,“日日新5.0”在应用产品层面也实现了多模态能力:支持高清长图的解析和理解及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示。

完成“云、端、边”全栈布局

“我们观察到了中心化算力需求向端侧扩展的未来趋势,以及企业在边缘侧的AI需求。”徐立指出。此次,商汤于业内首次推出“云、端、边”全栈大模型产品矩阵,包括应用于终端设备的“端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“企业级大模型一体机”。

据介绍,日日新·端侧大模型性能实现同等尺度最优,跨级尺度全面领先。“端侧大语言模型实现了业内最快的推理速度。”徐立介绍,人眼最快阅读速度是20字/秒,端侧大语言模型可在中端平台实现18.3字/秒的平均生成速度,旗舰平台更是达到了78.3字/秒。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤在技术交流日上推出了企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

“文生视频”已在路上

在技术交流日最后环节,徐立带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。

记者获悉,商汤科技在文生视频平台方面已取得了技术突破。未来,用户通过输入一段文字或一个完整的描述,就可生成一段视频,而且人物的服饰、发型、场景都可根据要求预先设定,以保持视频内容的连贯性和一致性。

“一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环。”徐立分析,“另一方面,‘尺度定律’路径逐渐清晰,‘涌现’时刻不断出现,前瞻探索最先进的大模型技术亦是重中之重。”本报记者 郜阳

放大

缩小

上一版

下一版

下载

读报纸首页