GPT-4.5 正式发布!OpenAI 推出史上最强大模型:比DeepSeek 强大不是一点半点

在全球开发者忙于开源周的热烈氛围时,OpenAI 选择在2月最后一天悄然发布了 GPT-4.5——一个改变格局的重磅模型。对比 DeepSeek 的开源进展,OpenAI 似乎并不把对手放在眼里,直接抛出了这个“强力杀器”。

Sam Altman 在 X 平台上分享了自己的亲身体验,并表示:
“这是我第一次觉得 AI 能像一个深思熟虑的人在与我对话,甚至有几次让我靠在椅背上,惊讶于它的表现竟如此出色。”


然而,他也特别提到,GPT-4.5 并非一个专注于推理的模型,因此不会在标准基准测试中大获全胜。至于为什么没有出席发布会,Altman 解释说自己正在医院陪伴孩子。

从今天开始,ChatGPT Pro 用户已经可以体验 GPT-4.5 的研究预览版;接下来几周,它会逐步开放给 Plus 和 Team 用户,最后将对 Enterprise 和 Edu 用户开放。体验方式很简单,只需在模型选择器中切换即可。

GPT-4.5 支持联网搜索,能够处理文件和图片上传,还可以利用 Canvas 进行写作和编程。然而,目前它还不支持多模态功能,如语音模式、视频或屏幕共享。

与其竞争对手 DeepSeek 侧重推理能力不同,GPT-4.5 通过「无监督学习」在更广泛的知识面上展现了优势。简单来说,GPT-4.5 知道的更多,而像 DeepSeek 的 o1 系列则更擅长思考和推理。

GPT-4.5 的亮点概览:

  • 更广泛的知识: 它比之前的版本懂得更多,涵盖了更广泛的领域。
  • 减少“幻觉”现象: 在避免 AI 编造事实方面有了显著提升。
  • 更高的情商: 能够更好地理解用户的情感和意图。
  • 更自然的对话: 对话风格更加贴近人类沟通,不再显得那么机械。
  • 创意更丰富: 在写作和设计等创意任务中表现优异。

更懂你、更温暖的 GPT-4.5

GPT-4.5 在与人类的互动中展现出前所未有的情感理解。测试结果显示,相较于 GPT-4,GPT-4.5 在自然语言交流中更符合人类的习惯,测试人员偏好其回答的频率也更高,尤其在创造性和情感智能上有了明显改进。

OpenAI 的研究人员表示,GPT-4.5 在与人类测试者的对比中,尤其在专业领域和日常对话中显示出更强的表现(创造性智能:56.8%,专业问题:63.2%,日常问题:57.0%)。

这得益于 GPT-4.5 的无监督学习。通过这种方式,模型自己从大量数据中学习,而非依赖人工标注数据,这让它在知识上更广泛、更深入。

技术进步:无监督学习与推理能力

无监督学习让 GPT-4.5 在知识获取上突破了以往的局限。它像一个孩子通过观察世界来构建自己的认知,而不是仅仅依赖大人告诉它什么是对的。这种学习方式赋予了它更广泛的知识和更强的理解能力。

同时,GPT-4.5 也在推理方面有所提升,尤其是在 SimpleQA 测试中表现突出,准确率达到了 62.5%,远超 OpenAI 其它模型。

在幻觉率(即模型生成不准确或不真实信息的频率)方面,GPT-4.5 的表现也相对更好,幻觉率为 37.1%,在 OpenAI 模型中领先。

跨语言、跨领域表现更加卓越

GPT-4.5 在多语言支持方面也有显著提升,特别是在处理一些不常见语言(如斯瓦希里语、约鲁巴语)时,它的表现要远超之前的版本。此外,它在编程和软件工程方面的能力也得到了增强,特别是在代码生成和修复任务中展现出更高的准确性。

开发者的福音:全新 API 开放

OpenAI 同时发布了 GPT-4.5 的 API,支持 Chat Completions API、Assistants API 和 Batch API。开发者现在可以通过 API 将 GPT-4.5 集成到自己的应用中,创造出更多的创新产品。GPT-4.5 还支持函数调用、结构化输出、流式响应等高级功能,进一步提升了它在实际应用中的灵活性。

然而,由于 GPT-4.5 的计算需求巨大,运行成本相对较高,因此 OpenAI 并不计划立即用 GPT-4.5 取代 GPT-4。而且,目前 OpenAI 也在评估是否会长期提供 GPT-4.5 的 API 服务。

AI 进入“情商时代”?

在本次发布中,GPT-4.5 特别展现了对人类情感的理解能力。例如,当被要求写一封愤怒短信给频繁取消约会的朋友时,GPT-4.5 能够敏锐捕捉到用户的情绪,并给出一个既理性又建设性的回应。此外,GPT-4.5 还在解释复杂问题时表现得更为简洁、流畅,给出了更加自然且富有趣味的答案。

开放 AI 的未来:逐步完善与创新

OpenAI 在 GPT-4.5 的研发过程中,结合了低精度训练和强化学习等多种技术,使得模型能够在计算资源紧张的情况下仍然表现出色。这种优化不仅提升了模型的理解能力,还使得 GPT-4.5 在应对多任务时更加高效。

OpenAI 的首席研究官 Mark Chen 在接受采访时指出,模型运行效率的提升并非单纯依赖推理能力的增强,而是通过更加高效的计算架构和算法优化来实现的。

至于未来的发展方向,Chen 也提到,GPT-4.5 展示了无监督学习在 AI 领域的巨大潜力,但与推理能力相比,两者实际上是相辅相成的。而随着技术的发展,OpenAI 希望通过不断优化无监督学习和推理能力之间的协作,推动 AI 在更多领域的应用。

GPT-4.5 是“过渡”还是“突破”?

尽管 GPT-4.5 在各方面都有了显著进步,但从整体来看,它更像是为下一代技术做好铺垫的过渡版本。它总结了过去几代模型的经验,也为未来更大规模的突破奠定了基础。

很多人期待的是 GPT-5,它将可能带来更具革命性的创新。幸运的是,随着技术进步,模型的更新速度似乎不再像过去那样漫长,GPT-4.5 之后,GPT-4.6、GPT-4.7 等可能会更快地登场。

在 AI 的发展道路上,GPT-4.5 无疑是一个重要的里程碑,但真正的突破或许依然属于未来。