2024年12月22日 星期日
趋势  涌现和融合是大模型时代重要的趋势 突破  以“云+AI”探测2颗快速射电暴 新品  可单手举起一台钢琴的人形机器人 窥见美好未来时  更该多一份思考 引导AI向善  性别话题是重要一环 掌握大模型世界的“魔咒”后,两秒钟就能将想象变成“现实” 冰与火之争:大模型的“下一站”是通用智能吗?
第4/5版:2023世界人工智能大会 2023-07-08

掌握大模型世界的“魔咒”后,两秒钟就能将想象变成“现实”

商汤“秒画”可以结合输入的图片或文本智能创作出与输入相关的图像内容 本报记者 刘歆 摄

在“描述词”框里输入“上海,未来场景,人工智能,智慧城市”,选择生成数量“4”,点开“描述词优化”,等待一会儿,几幅酷炫的图案就呈现在了眼前。

修改,输入“上海,智慧城市,未来感,充满活力的画面感,鲜艳的色彩运用,清晰的笔触”,呈现的图片更令人欢喜。

在2023世界人工智能大会召开前夕,新民晚报联合商汤科技,发起大模型世界“魔咒”招募令,邀请市民朋友利用“商汤秒画”创作一幅主题为“生成未来 申城未来”的图画。在官微后台,我们收到了不少有意思的作品。

两秒钟,就能将你的想象变成“现实”。“商汤秒画”基于商汤自研生成式人工智能模型的作画能力,并基于商汤大装置的GPU算力支撑,可帮助用户免除本地化部署流程,既能使用商汤自研作画模型高效地生成高质量内容,也可以将本地模型及其他第三方开源模型一键导入,生成更多样的内容。

“‘秒画’支持二次元、三次元等多种生成风格。用户无需复杂的编程知识,只需给定提示词,即可生成相应图像,最高可实现6K高清图。”目前负责商汤超大模型研发体系和决策智能算法与分布式平台的刘宇博士介绍,“无论是写实照片、脑洞大开的艺术画作,还是未来科幻场景,模型生成的图像都能根据用户需求,带来真实的光影效果以及丰富的细节内容。”

值得一提的是,“秒画”还支持用户上传本地图像,结合商汤自研作画模型或者开源模型来训练定制化LoRA(用于通过小数据继续训练,将大模型的能力适应到某个垂类领域)模型,来高效地生成个性化内容。

在大模型的世界里,提示词是一种用于与人工智能模型交互的语言。它可以用来告诉模型需要生成什么样的内容,大多数模型师也会称呼提示词为“魔咒”,不同的“魔咒”内容可以召唤出指定的“神奇魔法”。据介绍,一条出色的“魔咒”通常会由三个部分组成:绘画对象、对象描述词和风格修饰词。当然了,生成图像的质量与美感与“魔咒”的精确度和质量十分相关。

在7日的“大爱无疆·日日新”人工智能论坛上,商汤科技董事长兼CEO徐立宣布,自研生成式大模型商汤秒画3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。

本报记者 郜阳

读报纸首页