GPT-4：能读图解题讲冷笑话

本版

第4版：要闻

广告多模态多任务通用大模型“书生2.5”发布 GPT-4：能读图解题讲冷笑话
目录

第1版:一般要闻

第2版:要闻

第3版:要闻

第4版:要闻

第5版:综合新闻

第6版:帮侬忙

第7版:国际新闻

第8/9版:专版

第10版:广告

第11版:文体新闻

第12版:文体新闻/体育

第13版:夜光杯

第14版:夜光杯

第15版:新民健康

第16版:新民健康/医技/专版

第4版：要闻 2023-03-16

GPT-4：能读图解题讲冷笑话

比上一代更准确安全但仍存在偏见性和“幻觉”

中国版的ChatGPT“文心一言”今天就要问世了，但大洋彼岸又先出招——人工智能初创公司OpenAI公布新一代人工智能语言模型GPT-4。

与ChatGPT所用的模型相比，GPT-4不仅能够处理图像内容，而且在回答的细节和表述方面更有价值和人情味。OpenAI称“它是迄今为止功能最强大的模型”；亦有评论认为它是硅谷在人工智能竞赛中“竞争下一代领导者”的重大赌注……全世界的人都在津津乐道它高达2.5万字的文字输入上限、强大的图像识别能力、更高的答题准确性、创造性文本的生成能力……

比上一代强大在哪里

先来解释一下GPT，这是一种预训练语言模型，这种模型读得越多，就懂得越多。ChatGPT的核心即为GPT，只不过加上了能与人聊天的对话框。前阵子大火的ChatGPT用的是GPT-3.5，现在更新到了GPT-4。

GPT-4跟GPT-3.5具有相同的API接口和交互界面，但在文本总结和加工能力上，GPT-4有明显提升，表现在提出指令后，模型能更好地遵循指令给出答案。例如让一篇文章变成一个句子，每个单词都以字母“G”开头，GPT-3.5还未尝试就放弃了任务，而GPT-4可以很好地完成。

事实上，在许多方面，GPT-4能做到GPT-3.5力不能及的事情——

OpenAI让GPT-4参加了许多项人类通用考试，结果证明，它在许多测试和基准测试中的表现比前一代大为提高：GPT-4在俗称“美国高考”的SAT里分数增加了150分，能拿到1600分中的1410分；

它还能通过模拟律师考试，分数在应试者的前10%左右，相比之下，它的“前任”得分在倒数10%左右……

此外，GPT-4有一个质的飞跃——可以开始处理图像。不过，图像输入的权限尚未公开，所以目前还没看到更多例子来证明GPT-4在图像方面的处理能力。

有趣的是，GPT-4已经开始具备一点点的幽默感——它可以讲出一些模式化的、质量欠佳的冷笑话。换句话说，它已经开始理解“幽默”这一人类特质。

令人期待但仍存缺陷

OpenAI表示GPT-4是其“最先进的人工智能系统”，并声称花费了6个月时间让它比上一代更安全。该公司通过改进监控框架、与敏感领域专家合作，来确保GPT-4所给出的答案的准确性和安全性。

与旧版本一样，GPT-4由深度学习技术开发而来，是在公开可用和已被许可数据上进行的训练，并使用强化学习和人工反馈进行微调。不过，GPT-4是在全新的深度学习堆栈上训练的，并较上一代模型接受了更多数据训练和计算训练。

OpenAI还指出，GPT-4“离经叛道”的可能性要小得多——对于不被允许的内容请求，GPT-4的响应可能性降低了82%。在OpenAI的内部对抗性真实性评估中，GPT-4得分比GPT-3.5高40%。

另外，当任务复杂性达到足够阈值时，两代模型之间的差异就会出现。整体来看，GPT-4比GPT-3.5更可靠、更有创意，并且能够处理更细微的指令。

在GPT-4推出后，其合作伙伴兼投资股东微软立即回应称“新的Bing正在GPT-4上运行，这是我们为搜索定制的”。事实上，随着OpenAI对GPT-4及更高版本的更新，Bing也从中受益，Bing搜索引擎业已用上GPT-4，用户可以使用Bing编写文本、回复消息等。

不过，OpenAI并没有公布有关具体模型大小和训练GPT-4的硬件详细信息。OpenAI创始人山姆·阿尔特曼表示，尽管GPT-4的未来非常令人期待，但是仍然存在缺陷，所生成的内容仍然存在一定的偏见性，也存在一定的“幻觉”，也就是GPT-4会创建“不正确但听起来似是而非”的虚构信息。

生成式AI时代到来

当元宇宙的酷炫残影还停留在人们的视网膜上，“ChatGPT”上知天文、下知地理的表现再次突破人类对AI能力上限的认知。但对大多数“吃瓜群众”来说，GPT热潮的背后，也藏着一份隐忧——在已经到来的AIGC（人工智能生成内容）时代，我们要如何应对？

在中国科学院院士鄂维南看来，GPT的火热是OpenAI逐步验证、集中投入的结果。其中，“集中投入”这点非常重要。因为OpenAI的成功表明，以往那种“小作坊、项目制”的AI赋能方式正在成为历史，而“AI工程化、平台化”正成为释放人工智能技术红利的重要支撑。如果能够适应这种变化，AI在自然语言领域所取得的成功，有望在基础科学研究领域被复制。

“人工智能对于开发者来说是一种模式的变化，下一步对很多内容创作者来说，一样会面临工作模式的巨大变化。”商汤科技董事长兼CEO徐立指出，“人类正站在AI临界点上，其推动力就是生成式AI。生成式AI将来完全可以大幅降低软件开发门槛，将开发从‘特权’变成普惠行为。”

百度智能云主任架构师、百度AI中台总架构师谢永康分析，无论是ChatGPT还是之后产生出来的更多具备AGI（通用人工智能）能力的AI技术，更多应该是辅助人，与人找到共存的平衡点。

本报记者郜阳