OpenAI推出了其新的人工智能模型“GPT-4o”,这代表了熟悉的ChatGPT的显著改进。该模型拥有三个关键功能改进和更快的响应时间。
OpenAI的新模型“GPT-4o”是什么?对它的三个主要功能和即时翻译能力的全面了解。
美国人工智能研究实验室OpenAI于5月13日举行了一次在线演示会,由公司的技术总监Mira Murati主持,推出了新模型“GPT-4o”。GPT-4o中的“o”代表“Omnimodel”,表示它能够接受文本、语音和图像三种格式的输入。GPT-4o可以在232毫秒内响应,相当于人类的反应时间。最重要的是,Murati还宣布GPT-4o将免费提供给所有用户。
GPT-4o的关键特性:
- 逼真的对话和数学解决问题:GPT-4o的平均响应时间是320毫秒,最快可在232毫秒内响应,这减少了响应时间,使得对话更加自然、人性化。GPT-4o可以模仿人类的声音或机器人语调,甚至可以模仿讲故事或唱歌。该模型还增强了视觉化技术,通过摄像头引导用户逐步解开数学问题。
- 情感感知:之前的模型GPT-3.5和GPT-4使用三个独立的模型进行对话输入和输出,这使得它们难以观察语调和情绪等。GPT-4o已经调整,输入和输出都由同一个神经网络处理,能够感知用户的“情绪”。即使在对话过程中打断GPT-4o,它也能迅速接上。
- 即时语言翻译:GPT-4o语音技术的提升不仅增强了响应速度和情绪感知,还能提供实时语言翻译。在演示会上,Murati与多模态和尖端研究部门主管Mark Chen分别用意大利语和英语交谈,GPT-4o迅速将内容翻译成双方各自的语言,展示了强大的即时翻译能力。
- 可用性和扩展所有用户,无论是否订阅,现在都可以免费访问GPT-4o。付费用户将享受比标准版本大五倍的容量。即将推出的GPT-4o alpha版本将包含一个新的语音模式,最初仅供ChatGPT Plus用户使用。之前只有ChatGPT Plus用户才能使用的“GPT Store”,现在也将对所有人免费开放,使用GPT-4o的免费版本。
对于Mac用户
已经有了桌面版的ChatGPT应用。Windows用户则可期待今年晚些时候的专用应用程序发布,这将进一步扩大平台的覆盖范围。
GPT-4o的推出标志着人工智能访问性的重大飞跃,使得高级语言理解和沟通工具对广大用户群体变得触手可及。随着技术的不断发展,GPT-4o有望彻底改变多个行业,如教育和客户服务,通过提供即时、直观且响应迅速的协助。凭借增强的情感智能和多语言功能,GPT-4o正成为一种理想的平台,为无缝且引人入胜的互动提供支持。
总结来说,GPT-4o的出现不仅提升了人工智能的性能,而且通过免费策略降低了技术门槛,让更多人有机会体验到其带来的便利和创新。随着技术的不断优化和应用范围的扩大,GPT-4o无疑将推动人工智能领域进入一个全新的