让AI听话

本版

第6版：上海新闻

静安寺站轨交2号、14号线换乘通道连通口开通让AI听话申城入春又有变数？“春捂”也有讲究上海今举办海葬公祭活动 “对对碰”激活孩子“创新素养”
目录

第1版:一版要闻

第2版:要闻

第3版:要闻

第4/5版:要闻

第6版:上海新闻

第7版:公告

第8/9版:特稿

第10版:文体汇

第11版:文体汇/动态

第12版:夜光杯

第13版:夜光杯

第14版:国家艺术杂志

第15版:创见

第16版:新民健康专题/广告

第6版：上海新闻 2024-03-16

曹刚

文生视频大模型Sora横空出世，令人惊艳。从写作、绘图到做视频，AIGC（生成式人工智能）正在改变我们与世界互动的方式。由此引发担忧，生怕行业受冲击，人们擅长的写、画、拍等技能将不再重要。

惊叹、敬畏、惶恐之余，你可曾想过，那些生动逼真的画面，源自怎样的文字？完整表达需求，精确编辑指令，人机有效沟通，比以往任何时候更重要。

和AI对话，要清晰精准。例如Sora自动生成的“摩登女郎漫步东京街头”视频，输入指令就包括衣着、配饰、妆容、步态。“她穿着黑色皮夹克、红色长裙和黑色靴子；戴墨镜、涂红色口红、拎黑色手袋，走路自信又随意。”

要提供足够细节，让AI充分理解和执行。以假乱真的Sora视频“雪原象群”，源于以下指令：“几只巨大的猛犸象穿过白雪覆盖的草地，长而软的毛发在风中轻轻飘动。远处，树上银装素裹，壮观的雪山若隐若现。午后阳光穿过稀薄云层，营造出温暖辉光。低角度摄像机捕捉到这些毛茸茸的大家伙，摄影技术精湛，景深效果迷人。”摩登女郎视频，还描写了环境：“充满温暖霓虹灯和动感城市标牌的东京街道，潮湿反光，在彩灯照射下形成镜面效果。行人们走来走去。”

即便搭配深厚文字功底，AI也非万能，比如面对人类情感时。《繁花》里的爷叔，从西装笔挺的宝总身上看到年轻的自己，那几秒表情，诉尽一生悲喜。输入再细腻高超的指令，恐怕也很难输出如此动人的表演。老戏骨一个复杂深邃的眼神，AI便俯首称臣。看到局限，有助于我们更好地理解AI，讲它听得懂的话。

有没有听到Sora的提醒？在视频为王的今天，仍不能轻视文字。否则，AI只是迷人的玩具，而非提高生产力的工具。科技再发展，终究要为人类服务。多了解、多尝试，人机沟通才会更顺畅；不害怕、不轻视，巧用善用，才能让AI听话。首先，不妨从提升文字表达能力开始。