今天起,ChatGPT 进入全新的「4」时代。
刚刚,OpenAI 正式推出了 GPT-4o mini,作为 GPT-3.5 Turbo 的替代品。这一简化版的 GPT-4o 拥有更小的参数量。
从今日起,所有ChatGPT的免费用户、Plus用户和Team用户都可以使用GPT-4o mini。下周,企业版客户也将获得这一版本的使用权限。
OpenAI 官方表示,这一变化旨在确保所有用户都能享受到AI技术带来的好处。
GPT-4o mini是一款主打低成本和快速响应能力的模型,适用于多种应用场景。
举例来说,它能够支持需要同时调用多个模型的应用程序(例如同时调用多个API),处理大量上下文信息(如完整的代码库或对话记录),并且能够通过快速实时的文本回复与客户进行互动(如客服聊天机器人)。
具体而言,GPT-4o mini目前在API中提供文本和图像处理功能,并计划逐步增加对视频和音频的支持。
该模型能够处理长达128K个token的上下文,知识库截止日期为2023年10月,并且对非英文内容的支持更加友好。
根据OpenAI分享的基准测试结果显示,GPT-4o mini在推理基准测试MMLU上达到了82%的得分,远超过Gemini Flash的77.9%,以及之前备受瞩目的Claude Haiku的73.8%。
在数学推理和编程任务方面,GPT-4o mini同样表现出色,明显领先市场上的其他小型模型。
在MGSM的数学推理能力基准测试中,GPT-4o mini获得了87.0%的得分,远高于Gemini Flash的75.5%和Claude Haiku的71.7%。
在HumanEval基准测试中,GPT-4o mini再次展现出优异的表现,达到了87.2%的得分,远超Gemini Flash的71.5%和Claude Haiku的75.9%。
在多模态推理MMMU基准测试中,GPT-4o mini同样表现优异,达到了59.4%的得分,明显高于Gemini Flash的56.1%和Claude Haiku的50.2%。
特别值得注意的是,GPT-4o mini在所有这些基准测试中的表现都远超过了GPT-3.5 Turbo,可以说是全面压倒。此外,GPT-4o mini在大模型盲测竞技场LMSYS中的表现也优于GPT-4T 01-25。
除了性能上的显著提升,GPT-4o mini在价格上也极具竞争力,预计将给API市场带来不小的冲击。@ArtificialAnlys在X平台上发布了一些模型价格的对比,显示出其价格水平的优势。
OpenAI宣布,GPT-4o mini现在可以通过Assistant API、Chat Completions API和Batch API作为文本和视觉模型使用。
GPT-4o mini的价格为每100万个输入token为15美分,每100万个输出token为60美分,比GPT-3.5 Turbo便宜超过60%。
换句话说,使用GPT-4o mini生成一本2500页的书籍,仅需60美分。
对于GPT-4o mini的发布,OpenAI CEO Sam Altman在X平台上发文感慨道:
回顾2022年,当时世界上最先进的模型是text-davinci-003。与现在的新模型相比,它的性能远远不及。而且,它的使用成本比现在的新模型高出100倍。
另外,考虑到模型安全性的重要性,OpenAI邀请了70多位专家,涵盖社会心理学和错误信息研究等领域,对GPT-4o的潜在风险进行测试,并根据反馈进行了改进。
同时,基于这些经验,OpenAI还引入了一些新技术来增强GPT-4o mini的防御能力,包括防止越狱攻击,使其在大规模应用中更加安全和稳定可靠。
今年以来,全球范围内掀起了新一轮大模型价格战。然而,OpenAI以其响应速度更快、成本更低的GPT-4o mini模型加入了这场已经十分混乱的竞争格局。
Altman甚至将其形容为“朝着智力无需计量的方向”。
作为GPT-3.5 Turbo的免费替代品,GPT-4o mini在性能方面表现出色,甚至超越了同类产品Claude 3 Haiku和Gemini 1.5 Flash。许多网友在体验后也给予了一致的好评。
值得一提的是,关于人们翘首以待的GPT-4o语音模式,Altman也透露将在本月晚些时候推出,APPSO将第一时间跟进。
“特别声明:以上内容作品(包括视频、图片或音频