领先的人工智能初创公司 Anthropic 今天宣布推出 Claude Opus 4.1,这是一款新的旗舰机型,与 Opus 4 机型相比略有改进。Anthropic 声称,Opus 4.1 在代理任务、真实世界编码和推理方面的表现优于 Opus 4。

Anthropic 在其发布的博文中提到,Opus 4.1 在 SWE-bench 验证中的编码性能达到了最先进的 74.5%。在代理终端编码方面,它的得分从 Opus 4 的 39.2% 上升到 43.3%。在 AIME 2025 上,该升级版的得分率为 78%,高于 Opus 4 的 75.5%。
Anthropic 团队就 Claude Opus 4.1 的可用性撰文如下:

Claude Opus 4.1 是 Opus 4 的直接替代版本,可为实际编码和代理任务提供卓越的性能和精度。它能更严谨、更注重细节地处理复杂的多步骤问题。传小米为自研 Xring 芯片成立了 1000 名员工的公司
开发人员现在可以通过 Claude 付费计划和 Claude Code 以相同的价格访问 Opus 4.1。它还可以通过 Anthropic 的开发者 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。Anthropic 建议大家在价格不变的情况下改用 Opus 4.1,以获得更好的性能。

GitHub 宣布,Opus 4.1 现已在 GitHub Copilot 的 Enterprise 和 Pro+ 计划中提供。开发人员可以在 GitHub.com、Visual Studio Code 和 GitHub Mobile 上的 GitHub Copilot Chat 中选择该模式。
值得注意的是,Opus 4.1 仅在询问模式下可用,旧版 Opus 4 模式将在 15 天后被淘汰。GitHub 提到,与旧版 Opus 4 模式相比,Opus 4.1 在多文件代码重构方面实现了显著的性能提升。
虽然 Opus 4.1 的改进不大,但它能立即集成到 GitHub Copilot 等主要开发者工具中,为开发者带来了实实在在的好处,而且无需额外成本。Anthropic 还宣布计划在未来几周内对其人工智能模型进行更大规模的改进。
0 留言