Anthropic推出Claude 3.5,超越GPT-4o和Gemini 1.5 Pro

Anthropic公司发布了最新的Claude 3.5 Sonnet模型,标志着大模型领域再次取得重要进展。

据Anthropic介绍,Claude 3.5 Sonnet是他们Claude 3.5系列中的首款版本,被称为迄今为止发布的“最强大、最智能”的模型。该模型不仅在性能上超越了竞争对手和自家此前的Claude 3 Opus模型,还注重提供高性价比。

Anthropic联合创始人丹妮拉·阿莫迪(Daniela Amodei)在接受采访时表示:“Claude 3.5 Sonnet在市场上是功能最强大、最智能、最经济实惠的模型。在七项标准的智能和能力指标中,它在六项中击败了所有竞争对手,并且在第七项上也非常接近领先者。”

chatgpt中文认为这一新模型的发布标志着Anthropic公司在大模型研发领域的持续领先地位,并且为未来的人工智能技术发展开辟了新的可能性。

目前,所有用户可以在Claude.ai的网页端和Claude iOS应用上免费使用Claude 3.5 Sonnet模型。付费和企业用户则可以享受更高的速度和更少的使用限制。

chatgpt中文认为除此之外,用户还可以通过Anthropic API、亚马逊的Bedrock服务以及谷歌云的Vertex AI等平台调用这一模型。这些服务提供了更灵活的使用方式,使用户能够根据自身需求高效地使用Claude 3.5 Sonnet的强大功能。

Anthropic公司的Claude 3.5 Sonnet模型在成本和市场定位上有明显特点。每百万输入token收费3美元,每百万输出token收费15美元,上下文窗口为20万token。

chatgpt中文认为与竞争对手如OpenAI专注于消费者市场不同,Anthropic专注于企业市场。这种专注使得他们能够根据企业特定的需求定制产品,从而开辟了一个独特的利基市场。

尽管OpenAI在推动大模型能力方面取得了重大进展,Anthropic通过提供Claude 3.5 Sonnet模型,旨在在性能上有显著提升的同时,保持了与Claude 3 Sonnet相同的价格水平。

在安全评估方面,尽管Claude 3.5 Sonnet的智能水平有所提升,但其人工智能安全水平(ASL)仍保持在ASL-2水平,与目前主流的大模型相似。

Anthropic在其博客中介绍,Claude 3.5 Sonnet为研究生水平推理(GPQA)、本科生水平知识(MMLU)和编码能力(HumanEval)设定了新的行业标准。

chatgpt中文认为该模型在掌握细微差别、幽默和复杂指令方面展现出显著进步,并能以自然、亲切的语气撰写高质量的内容。

Claude 3.5 Sonnet的运行速度是其前代旗舰模型Claude 3 Opus的两倍,这对于需要快速响应的应用场景(如客户服务聊天机器人)尤为重要。

在内部代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,显著超过了解决问题数量仅为38%的Claude 3 Opus。

这项评估测试了模型修复错误或向开源代码库添加功能的能力,并通过人类测试员提供了改进自然语言描述的反馈。

借助提示和相关工具,Claude 3.5 Sonnet能够独立编写、修改和执行代码,并具备强大的推理和故障排除能力。

在视觉分析领域,Anthropic公司的Claude 3.5 Sonnet取得了显著的进展。

Anthropic表示,Claude 3.5 Sonnet是他们迄今为止最强大的视觉模型,超越了之前的Claude 3 Opus在标准视觉基准上的表现。

据介绍,这一新模型能够更准确地解读图表和图形,甚至能够从“不完美”的图像中提取文本,包括存在失真和视觉伪影的图片。这些增强的能力使得Claude 3.5 Sonnet在处理复杂的视觉任务时更加高效,能够获取比单纯文本更丰富的信息和见解。

Anthropic的联合创始人阿莫迪告诉媒体:“在标准视觉指标方面,我们在五项指标中的四项名列前茅,而剩下的一项也表现出色。”

chatgpt中文认为这些创新突破显示了Claude 3.5 Sonnet在视觉分析能力上的巨大潜力,为企业和研究机构提供了更强大的工具来处理和理解复杂的视觉数据。

Anthropic公司的Claude 3.5 Sonnet在多项视觉测试中超越了竞争对手如GPT-4o和Gemini 1.5 Pro。

chatgpt中文认为除了新的模型,Anthropic还推出了名为Artifacts的新功能。通过Artifacts,用户能够查看并与Claude模型生成的结果进行交互。例如,如果用户要求模型设计某个物品,它可以展示设计的外观,并允许用户直接在应用程序中进行编辑。

这一功能的推出进一步增强了Claude 3.5 Sonnet的实用性和用户体验,为用户提供了更直观和互动性的方式来利用模型的创造性和设计能力。

Anthropic公司推出了一项新功能,允许用户在Claude应用中直接编辑由Claude生成的电子邮件,而无需将其复制到文本编辑工具中。

这一小而实用的功能展示了人工智能工具的进步,不仅局限于简单的聊天机器人。像Artifacts这样的功能使应用程序具备了更多协作的可能性,为用户带来更便捷的体验。

Anthropic在其官方声明中写道:“这项新功能标志着Claude从对话式人工智能进化为协作式工作环境。这只是Claude.ai更广阔愿景的一部分,未来将进一步支持更大规模的团队协作。”

Anthropic还表示,他们的目标是每隔几个月显著改善智能、速度和成本之间的平衡曲线。为了完善Claude 3.5模型系列,他们计划在今年晚些时候发布Claude 3.5 Haiku(低端型号)和Claude 3.5 Opus(高端型号)。

除了开发下一代模型系列,Anthropic还在开发新的模式和功能,以支持更多的企业用例,包括与企业应用程序的集成。

chatgpt中文认为他们的团队正在探索诸如“Memory”之类的功能,这一功能将使Claude模型能够记住用户的偏好和交互历史记录,从而提升用户体验的个性化和效率。

Anthropic强调,他们在指导人工智能模型开发时的核心原则之一是保护用户的隐私。他们承诺除非得到用户的明确允许,否则不会使用用户提交的数据来训练他们的生成式模型。截至目前,他们还未使用任何客户或用户提交的数据来训练模型。

这些举措体现了Anthropic在人工智能技术发展中对隐私保护和用户数据安全的重视,旨在建立信任并确保用户数据的安全使用。