OpenAI 公开 o3-mini 思维链引发热议,实测对比 DeepSeek R1 表现差异显著

今天凌晨,OpenAI 宣布公开其最新模型 o3-mini 系列的思维链,用户现在可以观察到 o3-mini 及 o3-mini(high) 的推理过程,从而更清晰地理解模型如何得出结论。OpenAI 研究科学家 Noam Brown 在 X 平台表示,这一功能让用户能够体验到模型的“顿悟”时刻,并强调 o3-mini 是首个能持续准确解答井字棋问题的大语言模型。

然而,OpenAI 并未完全公开 o3-mini 的完整推理步骤,而是提供了一个经过整理的推理摘要。这一做法旨在平衡透明度与竞争保护,同时引入后处理步骤以确保内容的安全性和清晰度,特别是对非英语用户的支持。

在 AI 领域,推理透明度正成为竞争的关键点。OpenAI 首席产品官 Kevin Weil 在 Reddit 的 AMA 活动中提到,公司正在努力展示更多推理过程,但如何平衡用户需求与竞争保护仍是一个挑战。

与此同时,DeepSeek R1 的思维链则是无条件公开透明的,其深度思考过程获得了广泛好评。X 网友 @thegenioo 实测了两者的表现,发现 DeepSeek R1 的推理过程更为细致和可靠,而 o3-mini(high) 则更为简洁快速。

尽管 OpenAI 的 o3-mini 在公开思维链方面迈出了一步,但其“阉割版”的透明度仍引发了质疑。OpenAI CEO Sam Altman 解释称,公司尝试整理思维链以增强可读性,并尽量保持原始风格。然而,有网友指出,如果没有 DeepSeek 等竞争对手的推动,o3-mini 的思维链可能不会如此公开。

总的来说,OpenAI 的 o3-mini 和 DeepSeek R1 在思维链的展示上各有特点,前者追求简洁与速度,后者则注重细节与透明度。随着 AI 技术的不断进步,用户对模型推理过程的需求也将日益增长。