Anthropic发布Claude 3.5 Sonnet:多模态能力超越GPT-4o的新模型。在OpenAI推出GPT-4o一个月后,其主要竞争对手Anthropic现已发布了一款极具竞争力的新模型。
北京时间6月21日,Anthropic正式发布了Claude 3.5 Sonnet,这是其Claude系列的最新AI模型。根据Anthropic透露的信息,新模型在阅读理解、编码、数学和视觉等几个关键的AI基准测试中表现优于Claude 3 Sonnet,甚至超过了Anthropic之前的旗舰模型Claude 3 Opus。
作为惯例,Anthropic发布了一系列与行业竞争对手的测试结果,显著优于OpenAI、Google和Meta等公司的旗舰模型,包括最近推出的GPT-4o。
具体来说,Claude 3.5 Sonnet在研究生水平推理(GPQA)、编码能力(HumanEval)和文本推理(DROP)等方面的表现均优于GPT-4o,尽管在数学问题解决能力上略逊一筹。
Anthropic强调了Claude 3.5 Sonnet在创意写作方面的突出表现,突出了其更好地理解提示之间微妙差异和更强的幽默能力。
作为一款多模态模型,Claude 3.5 Sonnet目前优化了图像处理能力,而非实时音频交互能力,这与GPT-4o的侧重点有所不同。
Claude 3.5 Sonnet在大多数视觉基准测试中平均比Claude 3 Opus提高了10%。Anthropic表示,该模型能够准确解释图表和图形,并能够在具有扭曲和视觉伪像的“不完美”图像中成功完成文本转录任务。
据TechCrunch报道,Anthropic的产品总监Michael Gerstenhaber表示,这些技术进步归因于架构调整和新的训练数据,包括人工智能生成的数据,尽管具体数据细节尚未披露。
反映了性能提升和成本降低的趋势,Claude 3.5 Sonnet的运行速度比Opus快(例如在聊天机器人方面大约快两倍),但成本仅为后者的五分之一。
在定价方面,该模型的输入价格为每百万tokens 3美元,输出价格为每百万tokens 15美元,上下文窗口长度可达200K tokens。
除了大模型产品,Anthropic还推出了Artifacts的预览版,这是一个允许用户添加和编辑其模型生成内容的应用程序,如代码、文档、图像和网站设计。
该产品将集成到Claude的Web客户端中,类似于将大模型纳入工作流的工作空间。Anthropic计划通过Artifacts进行未来合作,引入新功能。
此外,Anthropic透露,他们计划在今年晚些时候更新其另外两款大模型Claude 3.5 Haiku和Claude 3.5 Opus。
作为支持Anthropic背后的科技巨头,AWS迅速宣布Claude 3.5 Sonnet已正式接入其Amazon Bedrock平台。