OpenAI的新产品GPT-4o Mini不仅成本比之前的GPT-3.5 Turbo便宜了超过60%,而且在聊天表现上优于Google的Gemini Flash和Anthropic的Claude Haiku。周四起,该模型向ChatGPT的免费用户、ChatGPT Plus和团队订阅用户开放,并计划在下周向ChatGPT企业用户开放。OpenAI还计划在今后的发展中将图像、视频和音频整合到这个模型中。
OpenAI在美东时间周四推出了名为“GPT-4o mini”的新产品,进军“小而精”AI模型竞争市场。该公司宣称,这款新模型是“功能最强、成本最低”的选择,计划未来还将整合图像、视频和音频功能。
据报道,GPT-4o mini的成本较之前的GPT-3.5 Turbo降低超过60%,同时在聊天表现上优于竞品。从周四起,OpenAI开始向ChatGPT的免费用户、ChatGPT Plus和团队订阅用户开放该模型,并计划在下周扩展至ChatGPT企业用户。GPT-4o mini将替代ChatGPT中的旧模型GPT-3.5 Turbo。
OpenAI指出,GPT-4o mini的成本为每百万输入标记(token)15美分,每百万输出标记60美分,性能优异且经济实惠。该模型在大规模多任务语言理解(MMLU)测试中获得82%的高分,超过了Google的Gemini Flash(77.9%)和Anthropic的Claude Haiku(73.8%)。
分析认为,这种较小的语言模型需要更少的计算资源,使其成为资源受限的企业部署生成式AI的理想选择。此外,GPT-4o mini还计划在API中支持文本和视觉功能,并未来将快速扩展到处理视频和音频等多模态输入和输出。这些功能有望使其在实际应用中更加智能和实用,如处理旅行行程并提供个性化建议,不过目前主要用于简单任务。
OpenAI最近推出了名为“GPT-4o Mini”的新产品,进入了激烈竞争的“小而精”AI模型市场。尽管OpenAI在生成式AI领域仍占据领先地位,但其面临的竞争压力日益加剧。据媒体报道,OpenAI目前的估值已超过800亿美元,但也面临着对处理器和基础设施巨额投资的挑战。
随着许多公司无法负担高成本的大型AI模型,因此轻量且经济实惠的模型可能更受市场欢迎。以往,开发人员可能更倾向于选择Claude 3 Haiku或Gemini 1.5 Flash这样的较小模型,而不是承担昂贵的计算成本。
OpenAI的API产品负责人Olivier Godement在接受媒体采访时解释说,为何公司过去未推出类似“小而精”的AI模型。他表示,这主要是出于公司的优先级考虑,OpenAI一直致力于创建更大、更强大的模型,如GPT-4,这需要大量的资源和人力投入。然而,随着市场需求的变化,公司意识到开发人员对小型模型的需求增加,因此决定现在是推出GPT-4o Mini的时机。
“我们的使命是推动前沿技术,构建最强大、最实用的应用程序。当然,我们继续致力于推动技术进步,但同时也希望提供最好的小型模型,因为我们相信它们会受到市场的欢迎,”Olivier Godement在采访中表示。
他补充道:“我认为GPT-4o Mini真正体现了OpenAI让AI技术更普及的使命。如果我们希望AI技术可以广泛应用于世界各个角落、各个行业和各种应用,我们必须确保这些技术变得更加实惠。”
总之,随着OpenAI推出GPT-4o Mini,它不仅进一步巩固了其在AI领域的领先地位,同时也展示了其对市场需求的灵活响应和技术创新的承诺。
GPT-4o mini被证明是一个实用工具,有助于提高员工效率。Godement透露,自推出以来的一周内,开发人员已经开始积极尝试这款新型AI。Ramp,一家金融科技初创公司,利用GPT-4o Mini开发了一款功能,能自动从收据图片中提取费用数据,简化了数据录入过程。Superhuman电子邮件客户端也利用了这一技术,通过GPT-4o Mini实现邮件自动回复,减轻了用户的日常任务负担。
GPT-4o mini初始设计支持文本和图像处理,但OpenAI计划在未来将其扩展到处理更多内容类型。作为OpenAI安全策略的一部分,GPT-4o mini采用了“指令层级”机制,确保AI优先执行来自公司或其他特定来源的命令,以防止不当使用。
OpenAI的愿景是推动多模态AI,即将文本、图像、音频和视频等多种形式的生成媒体集成到一个统一的工具,如ChatGPT中。Lightcap曾强调,人类体验世界是多元化的,因此单一的文本或代码界面无法充分展现AI的潜力,GPT-4o mini正是朝着这个目标