OpenAI发布GPT-4o:语音助手升级至实现屏幕视觉,引发现实版《Her》热议
顶尖AI产品的对决在近日即将上演,OpenAI和谷歌在AI技术领域展开了一场激烈的竞争。在OpenAI的春季线上发布会上,他们宣布推出了全新的旗舰AI模型——GPT-4o,并且将其免费开放给所有用户。GPT-4o被称为“全能”模型,具备了跨文本、音频和视觉的实时推理能力,同时改进了对非英语文本的处理能力。这一模型不仅在文本和视觉理解上表现优异,还新增了语音交互和视频理解的能力,能够根据人的表情和语调理解情绪,并实时进行语音翻译和视频交互。
OpenAI还宣布推出了桌面版ChatGPT,方便用户集成到自己的工作流程中。付费用户将获得更多的调用额度和早期访问权限,可以体验新功能,如全新的macOS桌面应用和下一代语音及视频功能。这次发布会由OpenAI的CTO Mira Murati主持,而非常见的联合创始人兼CEO Sam Altman。
GPT-4o的推出意味着OpenAI在大模型易用性方面迈出了重要一步,力求改变人机交互的方式。该模型通过端到端训练,显著降低了交互延迟,能够实现更自然、更高效的对话和处理。此外,OpenAI强调他们的使命是将先进的AI工具免费提供给每个人,对50多种语言进行了质量和速度的提升,API定价也大幅下降,速度提升了两倍。
在发布会上,OpenAI的团队进行了多个实时演示,展示了GPT-4o在多个领域的应用能力。包括实时语音对话、数学问题的解答、代码分析和图表解读等。GPT-4o不仅可以准确理解语音指令,还能根据场景做出情感化的回应,表现出对人类语言和情感的感知能力。这些功能不仅仅提高了用户体验,还拓展了AI在实际应用中的广泛适用性。
总体来看,OpenAI的GPT-4o发布引起了广泛关注,尤其是其全面的功能升级和免费开放政策,与谷歌等竞争对手形成了明显的对比。未来OpenAI计划进一步扩展这些功能,预示着AI技术在用户生活和工作中的更广泛应用。