曹刚
文生视频大模型Sora横空出世,令人惊艳。从写作、绘图到做视频,AIGC(生成式人工智能)正在改变我们与世界互动的方式。由此引发担忧,生怕行业受冲击,人们擅长的写、画、拍等技能将不再重要。
惊叹、敬畏、惶恐之余,你可曾想过,那些生动逼真的画面,源自怎样的文字?完整表达需求,精确编辑指令,人机有效沟通,比以往任何时候更重要。
和AI对话,要清晰精准。例如Sora自动生成的“摩登女郎漫步东京街头”视频,输入指令就包括衣着、配饰、妆容、步态。“她穿着黑色皮夹克、红色长裙和黑色靴子;戴墨镜、涂红色口红、拎黑色手袋,走路自信又随意。”
要提供足够细节,让AI充分理解和执行。以假乱真的Sora视频“雪原象群”,源于以下指令:“几只巨大的猛犸象穿过白雪覆盖的草地,长而软的毛发在风中轻轻飘动。远处,树上银装素裹,壮观的雪山若隐若现。午后阳光穿过稀薄云层,营造出温暖辉光。低角度摄像机捕捉到这些毛茸茸的大家伙,摄影技术精湛,景深效果迷人。”摩登女郎视频,还描写了环境:“充满温暖霓虹灯和动感城市标牌的东京街道,潮湿反光,在彩灯照射下形成镜面效果。行人们走来走去。”
即便搭配深厚文字功底,AI也非万能,比如面对人类情感时。《繁花》里的爷叔,从西装笔挺的宝总身上看到年轻的自己,那几秒表情,诉尽一生悲喜。输入再细腻高超的指令,恐怕也很难输出如此动人的表演。老戏骨一个复杂深邃的眼神,AI便俯首称臣。看到局限,有助于我们更好地理解AI,讲它听得懂的话。
有没有听到Sora的提醒?在视频为王的今天,仍不能轻视文字。否则,AI只是迷人的玩具,而非提高生产力的工具。科技再发展,终究要为人类服务。多了解、多尝试,人机沟通才会更顺畅;不害怕、不轻视,巧用善用,才能让AI听话。首先,不妨从提升文字表达能力开始。