OpenAI推出GPT-4o mini：功能强大、成本低廉 - GPT中文站: 免费ChatGPT中文版

OpenAI的新产品GPT-4o Mini不仅成本比之前的GPT-3.5 Turbo便宜了超过60%，而且在聊天表现上优于Google的Gemini Flash和Anthropic的Claude Haiku。周四起，该模型向ChatGPT的免费用户、ChatGPT Plus和团队订阅用户开放，并计划在下周向ChatGPT企业用户开放。OpenAI还计划在今后的发展中将图像、视频和音频整合到这个模型中。

OpenAI在美东时间周四推出了名为“GPT-4o mini”的新产品，进军“小而精”AI模型竞争市场。该公司宣称，这款新模型是“功能最强、成本最低”的选择，计划未来还将整合图像、视频和音频功能。

据报道，GPT-4o mini的成本较之前的GPT-3.5 Turbo降低超过60%，同时在聊天表现上优于竞品。从周四起，OpenAI开始向ChatGPT的免费用户、ChatGPT Plus和团队订阅用户开放该模型，并计划在下周扩展至ChatGPT企业用户。GPT-4o mini将替代ChatGPT中的旧模型GPT-3.5 Turbo。

OpenAI指出，GPT-4o mini的成本为每百万输入标记（token）15美分，每百万输出标记60美分，性能优异且经济实惠。该模型在大规模多任务语言理解（MMLU）测试中获得82%的高分，超过了Google的Gemini Flash（77.9%）和Anthropic的Claude Haiku（73.8%）。

分析认为，这种较小的语言模型需要更少的计算资源，使其成为资源受限的企业部署生成式AI的理想选择。此外，GPT-4o mini还计划在API中支持文本和视觉功能，并未来将快速扩展到处理视频和音频等多模态输入和输出。这些功能有望使其在实际应用中更加智能和实用，如处理旅行行程并提供个性化建议，不过目前主要用于简单任务。

OpenAI最近推出了名为“GPT-4o Mini”的新产品，进入了激烈竞争的“小而精”AI模型市场。尽管OpenAI在生成式AI领域仍占据领先地位，但其面临的竞争压力日益加剧。据媒体报道，OpenAI目前的估值已超过800亿美元，但也面临着对处理器和基础设施巨额投资的挑战。

随着许多公司无法负担高成本的大型AI模型，因此轻量且经济实惠的模型可能更受市场欢迎。以往，开发人员可能更倾向于选择Claude 3 Haiku或Gemini 1.5 Flash这样的较小模型，而不是承担昂贵的计算成本。

OpenAI的API产品负责人Olivier Godement在接受媒体采访时解释说，为何公司过去未推出类似“小而精”的AI模型。他表示，这主要是出于公司的优先级考虑，OpenAI一直致力于创建更大、更强大的模型，如GPT-4，这需要大量的资源和人力投入。然而，随着市场需求的变化，公司意识到开发人员对小型模型的需求增加，因此决定现在是推出GPT-4o Mini的时机。

“我们的使命是推动前沿技术，构建最强大、最实用的应用程序。当然，我们继续致力于推动技术进步，但同时也希望提供最好的小型模型，因为我们相信它们会受到市场的欢迎，”Olivier Godement在采访中表示。

他补充道：“我认为GPT-4o Mini真正体现了OpenAI让AI技术更普及的使命。如果我们希望AI技术可以广泛应用于世界各个角落、各个行业和各种应用，我们必须确保这些技术变得更加实惠。”

总之，随着OpenAI推出GPT-4o Mini，它不仅进一步巩固了其在AI领域的领先地位，同时也展示了其对市场需求的灵活响应和技术创新的承诺。

GPT-4o mini被证明是一个实用工具，有助于提高员工效率。Godement透露，自推出以来的一周内，开发人员已经开始积极尝试这款新型AI。Ramp，一家金融科技初创公司，利用GPT-4o Mini开发了一款功能，能自动从收据图片中提取费用数据，简化了数据录入过程。Superhuman电子邮件客户端也利用了这一技术，通过GPT-4o Mini实现邮件自动回复，减轻了用户的日常任务负担。

GPT-4o mini初始设计支持文本和图像处理，但OpenAI计划在未来将其扩展到处理更多内容类型。作为OpenAI安全策略的一部分，GPT-4o mini采用了“指令层级”机制，确保AI优先执行来自公司或其他特定来源的命令，以防止不当使用。

OpenAI的愿景是推动多模态AI，即将文本、图像、音频和视频等多种形式的生成媒体集成到一个统一的工具，如ChatGPT中。Lightcap曾强调，人类体验世界是多元化的，因此单一的文本或代码界面无法充分展现AI的潜力，GPT-4o mini正是朝着这个目标