Anthropic发布Claude 3.5 Sonnet：多模态能力超越GPT-4o的新模型 - GPT中文站: 免费ChatGPT中文版

Anthropic发布Claude 3.5 Sonnet：多模态能力超越GPT-4o的新模型。在OpenAI推出GPT-4o一个月后，其主要竞争对手Anthropic现已发布了一款极具竞争力的新模型。

北京时间6月21日，Anthropic正式发布了Claude 3.5 Sonnet，这是其Claude系列的最新AI模型。根据Anthropic透露的信息，新模型在阅读理解、编码、数学和视觉等几个关键的AI基准测试中表现优于Claude 3 Sonnet，甚至超过了Anthropic之前的旗舰模型Claude 3 Opus。

作为惯例，Anthropic发布了一系列与行业竞争对手的测试结果，显著优于OpenAI、Google和Meta等公司的旗舰模型，包括最近推出的GPT-4o。

具体来说，Claude 3.5 Sonnet在研究生水平推理（GPQA）、编码能力（HumanEval）和文本推理（DROP）等方面的表现均优于GPT-4o，尽管在数学问题解决能力上略逊一筹。

Anthropic强调了Claude 3.5 Sonnet在创意写作方面的突出表现，突出了其更好地理解提示之间微妙差异和更强的幽默能力。

作为一款多模态模型，Claude 3.5 Sonnet目前优化了图像处理能力，而非实时音频交互能力，这与GPT-4o的侧重点有所不同。

Claude 3.5 Sonnet在大多数视觉基准测试中平均比Claude 3 Opus提高了10%。Anthropic表示，该模型能够准确解释图表和图形，并能够在具有扭曲和视觉伪像的“不完美”图像中成功完成文本转录任务。

据TechCrunch报道，Anthropic的产品总监Michael Gerstenhaber表示，这些技术进步归因于架构调整和新的训练数据，包括人工智能生成的数据，尽管具体数据细节尚未披露。

反映了性能提升和成本降低的趋势，Claude 3.5 Sonnet的运行速度比Opus快（例如在聊天机器人方面大约快两倍），但成本仅为后者的五分之一。

在定价方面，该模型的输入价格为每百万tokens 3美元，输出价格为每百万tokens 15美元，上下文窗口长度可达200K tokens。

除了大模型产品，Anthropic还推出了Artifacts的预览版，这是一个允许用户添加和编辑其模型生成内容的应用程序，如代码、文档、图像和网站设计。

该产品将集成到Claude的Web客户端中，类似于将大模型纳入工作流的工作空间。Anthropic计划通过Artifacts进行未来合作，引入新功能。

此外，Anthropic透露，他们计划在今年晚些时候更新其另外两款大模型Claude 3.5 Haiku和Claude 3.5 Opus。

作为支持Anthropic背后的科技巨头，AWS迅速宣布Claude 3.5 Sonnet已正式接入其Amazon Bedrock平台。