2025年04月05日 星期六
广告 多模态多任务通用大模型“书生2.5”发布 GPT-4:能读图解题讲冷笑话
第4版:要闻 2023-03-16

GPT-4:能读图解题讲冷笑话

比上一代更准确安全但仍存在偏见性和“幻觉”

中国版的ChatGPT“文心一言”今天就要问世了,但大洋彼岸又先出招——人工智能初创公司OpenAI公布新一代人工智能语言模型GPT-4。

与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,而且在回答的细节和表述方面更有价值和人情味。OpenAI称“它是迄今为止功能最强大的模型”;亦有评论认为它是硅谷在人工智能竞赛中“竞争下一代领导者”的重大赌注……全世界的人都在津津乐道它高达2.5万字的文字输入上限、强大的图像识别能力、更高的答题准确性、创造性文本的生成能力……

比上一代强大在哪里

先来解释一下GPT,这是一种预训练语言模型,这种模型读得越多,就懂得越多。ChatGPT的核心即为GPT,只不过加上了能与人聊天的对话框。前阵子大火的ChatGPT用的是GPT-3.5,现在更新到了GPT-4。

GPT-4跟GPT-3.5具有相同的API接口和交互界面,但在文本总结和加工能力上,GPT-4有明显提升,表现在提出指令后,模型能更好地遵循指令给出答案。例如让一篇文章变成一个句子,每个单词都以字母“G”开头,GPT-3.5还未尝试就放弃了任务,而GPT-4可以很好地完成。

事实上,在许多方面,GPT-4能做到GPT-3.5力不能及的事情——

OpenAI让GPT-4参加了许多项人类通用考试,结果证明,它在许多测试和基准测试中的表现比前一代大为提高:GPT-4在俗称“美国高考”的SAT里分数增加了150分,能拿到1600分中的1410分;

它还能通过模拟律师考试,分数在应试者的前10%左右,相比之下,它的“前任”得分在倒数10%左右……

此外,GPT-4有一个质的飞跃——可以开始处理图像。不过,图像输入的权限尚未公开,所以目前还没看到更多例子来证明GPT-4在图像方面的处理能力。

有趣的是,GPT-4已经开始具备一点点的幽默感——它可以讲出一些模式化的、质量欠佳的冷笑话。换句话说,它已经开始理解“幽默”这一人类特质。

令人期待但仍存缺陷

OpenAI表示GPT-4是其“最先进的人工智能系统”,并声称花费了6个月时间让它比上一代更安全。该公司通过改进监控框架、与敏感领域专家合作,来确保GPT-4所给出的答案的准确性和安全性。

与旧版本一样,GPT-4由深度学习技术开发而来,是在公开可用和已被许可数据上进行的训练,并使用强化学习和人工反馈进行微调。不过,GPT-4是在全新的深度学习堆栈上训练的,并较上一代模型接受了更多数据训练和计算训练。

OpenAI还指出,GPT-4“离经叛道”的可能性要小得多——对于不被允许的内容请求,GPT-4的响应可能性降低了82%。在OpenAI的内部对抗性真实性评估中,GPT-4得分比GPT-3.5高40%。

另外,当任务复杂性达到足够阈值时,两代模型之间的差异就会出现。整体来看,GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

在GPT-4推出后,其合作伙伴兼投资股东微软立即回应称“新的Bing正在GPT-4上运行,这是我们为搜索定制的”。事实上,随着OpenAI对GPT-4及更高版本的更新,Bing也从中受益,Bing搜索引擎业已用上GPT-4,用户可以使用Bing编写文本、回复消息等。

不过,OpenAI并没有公布有关具体模型大小和训练GPT-4的硬件详细信息。OpenAI创始人山姆·阿尔特曼表示,尽管GPT-4的未来非常令人期待,但是仍然存在缺陷,所生成的内容仍然存在一定的偏见性,也存在一定的“幻觉”,也就是GPT-4会创建“不正确但听起来似是而非”的虚构信息。

生成式AI时代到来

当元宇宙的酷炫残影还停留在人们的视网膜上,“ChatGPT”上知天文、下知地理的表现再次突破人类对AI能力上限的认知。但对大多数“吃瓜群众”来说,GPT热潮的背后,也藏着一份隐忧——在已经到来的AIGC(人工智能生成内容)时代,我们要如何应对?

在中国科学院院士鄂维南看来,GPT的火热是OpenAI逐步验证、集中投入的结果。其中,“集中投入”这点非常重要。因为OpenAI的成功表明,以往那种“小作坊、项目制”的AI赋能方式正在成为历史,而“AI工程化、平台化”正成为释放人工智能技术红利的重要支撑。如果能够适应这种变化,AI在自然语言领域所取得的成功,有望在基础科学研究领域被复制。

“人工智能对于开发者来说是一种模式的变化,下一步对很多内容创作者来说,一样会面临工作模式的巨大变化。”商汤科技董事长兼CEO徐立指出,“人类正站在AI临界点上,其推动力就是生成式AI。生成式AI将来完全可以大幅降低软件开发门槛,将开发从‘特权’变成普惠行为。”

百度智能云主任架构师、百度AI中台总架构师谢永康分析,无论是ChatGPT还是之后产生出来的更多具备AGI(通用人工智能)能力的AI技术,更多应该是辅助人,与人找到共存的平衡点。

本报记者 郜阳

放大

缩小

上一版

下一版

下载

读报纸首页