“免费实时语音视频交互!GPT-4o引领科幻时代的突破性进步!”

OpenAI在5月14日凌晨举办了首次“春季新品发布会”,正式发布了新一代旗舰生成模型GPT-4o以及桌面应用程序,并展示了一系列新功能。这次发布彻底颠覆了产品形态,OpenAI用行动向全世界的科技公司传递了一次重要的教育课程。

本次活动的主持人是OpenAI的首席技术官Mira Murati。她指出,此次发布的主要内容包括三点:

首先,OpenAI将始终优先考虑免费对用户开放,以确保更多人能够使用他们的产品。

其次,为了实现这一目标,OpenAI发布了桌面版本的应用程序,并进行了UI更新,使用户体验更加简单、自然。

最重要的是,OpenAI推出了GPT-4o,这是GPT-4的升级版,具备了极为自然的交互能力,为每个人带来了与GPT-4相媲美的智能水平,包括免费用户在内。

本次更新后的ChatGPT允许大模型接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出,这是未来交互方式的重要一步。

近期,ChatGPT可以免注册使用,而今天还新增了桌面应用程序,OpenAI的目标是使人们可以在任何时间、任何地点无缝地使用它,使ChatGPT成为生产力工具。

GPT-4o是一款面向未来人机交互范式的全新大模型,具备文本、语音、图像三种模态的理解能力,响应速度极快且带有情感,非常贴近人性。

在发布会现场,OpenAI的工程师展示了新模型的几种主要能力。其中,最重要的是实时语音对话功能。当工程师Mark Chen表示第一次参加直播发布会有点紧张时,ChatGPT即刻回应道:“你需要深呼吸一下。”这种实时交互方式与之前的语音助手有着明显的不同,用户可以随时打断AI的话语,并且模型的响应速度非常快,甚至超过人类的反应速度。

此外,GPT-4o还具备视觉能力,能够解释方程和代码,并且能够对图像和代码进行理解和解释。

GPT-4o的发布标志着OpenAI在一个模型中集成了所有模态,极大地提升了大模型的实用性。该模型不仅在文本和代码方面性能优异,在视觉和音频理解方面也表现出色。

未来,OpenAI将继续改进GPT-4o,使其能够实现更自然、实时的语音对话,并通过实时视频与用户进行交互。

对于ChatGPT用户来说,他们将免费获得更多高级功能,包括文本、图像等方面的能力,并且OpenAI将在未来推出更多新的音频和视频功能。通过不断的模型测试和迭代,OpenAI将努力改进GPT-4o的性能和功能,以更好地满足用户需求。

此外,OpenAI还发布了适用于macOS的新ChatGPT桌面应用程序,用户可以通过简单的键盘快捷键与ChatGPT进行交互,并且可以直接在应用程序中进行屏幕截图并进行讨论。

这次发布会的最大亮点是GPT-4o,它的面世将为人机交互带来全新的可能性,标志着OpenAI在人工智能领域的重大突破。