Claude Opus 4.7 发布：进阶软件工程能力的新里程碑

原文来源：Anthropic 官方公告 — Anthropic 于 2026 年 4 月 16 日发布 Claude Opus 4.7。

2026 年 4 月 16 日，Anthropic 正式发布了 Claude Opus 4.7。这是 Opus 系列的又一次重要升级，在进阶软件工程能力上尤其突出，同时发布了 Claude Mythos Preview——目前 Anthropic 最强大的模型——但仅限有限范围使用。

核心升级

Opus 4.7 是 Opus 4.6 的显著改进，专注于提升复杂软件工程任务的表现。用户报告称，之前需要密切监督的最难编码工作，现在可以放心交给 Opus 4.7。

具体改进包括：

Opus 4.7 在多个关键基准上相比 Opus 4.6 有明显提升：

在 SWE-bench Verified 上，Opus 4.7 达到 80.8%，这是一个非常亮眼的成绩。MCP-Atlas 基准（评估多轮工具调用能力）达到 77.3%，在所有模型中也名列前茅。

Opus 4.7 的定价与 Opus 4.6 保持一致：

通过提示缓存可节省高达 90% 的成本，批处理可节省 50%。

目前已在以下平台可用：

开发者使用 claude-opus-4-7 模型 ID 即可调用。

Anthropic 同时公布了 Claude Mythos Preview，这是他们当前最强大的 AI 模型，在识别软件安全漏洞方面能力突出。但由于其强大的网络能力，Anthropic 决定限制其发布范围，仅在 Project Glasswing 框架下供安全研究人员和网络安全专家使用。

Opus 4.7 的网络安全能力不如 Mythos Preview，Anthropic 在训练过程中实验性地降低了这些能力。同时，模型内置了新的安全防护措施，能自动检测并阻止高风险网络安全的请求。

Opus 4.7 的发布有两个值得关注的点：

1. 软件工程能力的质变 — 从 72% 到 80.8% 的 SWE-bench 提升，意味着 AI 编码能力已经进入了"能做最难那部分工作"的阶段。结合 Claude Code 等 Agent 工具，开发者可以越来越多地把复杂任务交给 AI 自主完成。

2. 安全与能力的平衡 — Anthropic 对待模型安全的策略值得关注。他们不是简单的不发布强大模型，而是通过安全项目（Cyber Verification Program）让合格的安全研究人员使用，这种分级放行的思路可能是未来前沿模型的安全范式。

3. 模型竞争格局 — Opus 4.7 的发布紧接 DeepSeek V4 和 GPT-5.5，前沿模型的迭代速度已经缩短到按月计算。对开发者来说，这是一个好消息——更多的选择、更快的进步、更有竞争力的价格。