GPT-4发布:OpenAI的“王炸”产品引领AI新高度

GPT-4发布:OpenAI的“王炸”产品引领AI新高度

ChatGPT热度还未散去,OpenAI发布了更强大的GPT-4,堪称“王炸”产品。与之前的模型相比,GPT-4不仅能够处理图像内容,还显著提高了回复的准确性。目前,GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。

OpenAI称,GPT-4是其在深度学习领域的最新里程碑。该模型在专业和学术领域表现出近似于人类的水平。例如,它在模拟律师考试中的得分可以排进前10%左右,而GPT-3.5的得分则只能排在倒数10%左右。

与之前的GPT系列模型相比,GPT-4的最大突破之一是在文本之外还能处理图像内容。OpenAI表示,用户在同时输入文本和图像时,GPT-4可以生成自然语言和代码等文本。虽然图像处理功能尚未公开,但官网展示了一系列案例。例如,输入一张图片并询问“这张图片有什么不寻常之处”,GPT-4可以回答“这张照片的不寻常之处在于,一名男子正在行驶中的出租车车顶上熨衣服”。

在官方演示中,GPT-4几乎只花了1-2秒就识别了手绘网站图片,并根据要求实时生成了网页代码,制作出了几乎与手绘版一样的网站。除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等。例如,它可以根据专业论文直接生成论文摘要和要点。

与之前的模型相比,GPT-4的准确性有所提高。OpenAI称,该公司花费6个月时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。“GPT-4的训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”

在内部的对抗性真实性评估中,GPT-4的得分比GPT-3.5高40%,不允许内容请求的倾向降低了82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。不仅是英语,该模型在多种语言方面均表现出优越性。在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型。其中,GPT-4的中文准确性达到80.1%,而GPT-3.5的英文准确性仅为70.1%,GPT-4的英文准确性提高到了85.5%。

然而,GPT-4仍存在一定的局限性。OpenAI称,它并不完全可靠,可能会出现推理错误,“GPT-4缺乏对2021年9月之后发生事件的了解,并且无法从中吸取经验教训。它有时会出现简单的推理错误,轻信用户明显的虚假陈述,有时它会在难题上失败,例如在生成的代码中引入安全漏洞。”

基于此,OpenAI提醒用户在使用语言模型时应格外小心,最好辅以人工审查、附加上下文或避免在高风险情况下使用它。

值得注意的是,尽管GPT-4,但早在一个月前,微软的新版必应(Bing)搜索引擎已经在运行GPT-4。微软表示,“如果您在过去五周内使用过新版必应,那么您已经体验过GPT-4的早期版本。”

与免费的ChatGPT不同,GPT-4目前仅向ChatGPT Plus的付费用户开放,同时也将作为API提供给企业及开发者,开发者需进入等候名单,将该模型集成到他们的应用程序中。OpenAI表示,已经有多家公司将GPT-4搭载到他们的产品中,包括语言学习工具软件多邻国(Duolingo)、移动支付公司Stripe和可汗学院(Khan Academy)。