"免费实时语音视频交互！GPT-4o引领科幻时代的突破性进步！" - GPT中文站: 免费ChatGPT中文版

OpenAI在5月14日凌晨举办了首次“春季新品发布会”，正式发布了新一代旗舰生成模型GPT-4o以及桌面应用程序，并展示了一系列新功能。这次发布彻底颠覆了产品形态，OpenAI用行动向全世界的科技公司传递了一次重要的教育课程。

本次活动的主持人是OpenAI的首席技术官Mira Murati。她指出，此次发布的主要内容包括三点：

首先，OpenAI将始终优先考虑免费对用户开放，以确保更多人能够使用他们的产品。

其次，为了实现这一目标，OpenAI发布了桌面版本的应用程序，并进行了UI更新，使用户体验更加简单、自然。

最重要的是，OpenAI推出了GPT-4o，这是GPT-4的升级版，具备了极为自然的交互能力，为每个人带来了与GPT-4相媲美的智能水平，包括免费用户在内。

本次更新后的ChatGPT允许大模型接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合输出，这是未来交互方式的重要一步。

近期，ChatGPT可以免注册使用，而今天还新增了桌面应用程序，OpenAI的目标是使人们可以在任何时间、任何地点无缝地使用它，使ChatGPT成为生产力工具。

GPT-4o是一款面向未来人机交互范式的全新大模型，具备文本、语音、图像三种模态的理解能力，响应速度极快且带有情感，非常贴近人性。

在发布会现场，OpenAI的工程师展示了新模型的几种主要能力。其中，最重要的是实时语音对话功能。当工程师Mark Chen表示第一次参加直播发布会有点紧张时，ChatGPT即刻回应道：“你需要深呼吸一下。”这种实时交互方式与之前的语音助手有着明显的不同，用户可以随时打断AI的话语，并且模型的响应速度非常快，甚至超过人类的反应速度。

此外，GPT-4o还具备视觉能力，能够解释方程和代码，并且能够对图像和代码进行理解和解释。

GPT-4o的发布标志着OpenAI在一个模型中集成了所有模态，极大地提升了大模型的实用性。该模型不仅在文本和代码方面性能优异，在视觉和音频理解方面也表现出色。

未来，OpenAI将继续改进GPT-4o，使其能够实现更自然、实时的语音对话，并通过实时视频与用户进行交互。

对于ChatGPT用户来说，他们将免费获得更多高级功能，包括文本、图像等方面的能力，并且OpenAI将在未来推出更多新的音频和视频功能。通过不断的模型测试和迭代，OpenAI将努力改进GPT-4o的性能和功能，以更好地满足用户需求。

此外，OpenAI还发布了适用于macOS的新ChatGPT桌面应用程序，用户可以通过简单的键盘快捷键与ChatGPT进行交互，并且可以直接在应用程序中进行屏幕截图并进行讨论。

这次发布会的最大亮点是GPT-4o，它的面世将为人机交互带来全新的可能性，标志着OpenAI在人工智能领域的重大突破。

“免费实时语音视频交互！GPT-4o引领科幻时代的突破性进步！”