AI 前沿·阅读约 2 分钟·
Claude Opus 4.7 发布:进阶软件工程能力的新里程碑

Claude Opus 4.7 发布:进阶软件工程能力的新里程碑

Anthropic 于 2026 年 4 月 16 日发布 Claude Opus 4.7,这是 Opus 4.6 的重大升级,在复杂软件工程任务上表现突出,支持 1M token 上下文、128K 输出,定价保持不变。

原文来源:Anthropic 官方公告 — Anthropic 于 2026 年 4 月 16 日发布 Claude Opus 4.7。

2026 年 4 月 16 日,Anthropic 正式发布了 Claude Opus 4.7。这是 Opus 系列的又一次重要升级,在进阶软件工程能力上尤其突出,同时发布了 Claude Mythos Preview——目前 Anthropic 最强大的模型——但仅限有限范围使用。

核心升级

Opus 4.7 是 Opus 4.6 的显著改进,专注于提升复杂软件工程任务的表现。用户报告称,之前需要密切监督的最难编码工作,现在可以放心交给 Opus 4.7。

具体改进包括:

  • 复杂长任务处理 — Opus 4.7 对复杂、长时间运行的任务处理更加严谨和一致,不再容易在半路"走神"
  • 指令精确执行 — 能更精确地遵循用户指令,不再遗漏关键约束
  • 自主验证能力 — 能在完成任务前自动验证自己的输出,确保结果正确
  • 视觉能力大幅提升 — 可以更高分辨率查看图像,生成更高质量的界面、幻灯片和文档

基准测试表现

Opus 4.7 在多个关键基准上相比 Opus 4.6 有明显提升:

基准Opus 4.6Opus 4.7
SWE-bench Verified72.0%80.8%
MCP-Atlas68.4%77.3%
Internal Coding (93-task)基准显著提升

在 SWE-bench Verified 上,Opus 4.7 达到 80.8%,这是一个非常亮眼的成绩。MCP-Atlas 基准(评估多轮工具调用能力)达到 77.3%,在所有模型中也名列前茅。

定价与可用性

Opus 4.7 的定价与 Opus 4.6 保持一致:

定价价格
输入$5/百万 token
输出$25/百万 token
上下文1M tokens
最大输出128K tokens

通过提示缓存可节省高达 90% 的成本,批处理可节省 50%。

目前已在以下平台可用:

  • Claude 所有产品(Claude.ai、Claude Code、Claude API)
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Microsoft Foundry

开发者使用 claude-opus-4-7 模型 ID 即可调用。

关于 Claude Mythos Preview

Anthropic 同时公布了 Claude Mythos Preview,这是他们当前最强大的 AI 模型,在识别软件安全漏洞方面能力突出。但由于其强大的网络能力,Anthropic 决定限制其发布范围,仅在 Project Glasswing 框架下供安全研究人员和网络安全专家使用。

网络安全防护机制

Opus 4.7 的网络安全能力不如 Mythos Preview,Anthropic 在训练过程中实验性地降低了这些能力。同时,模型内置了新的安全防护措施,能自动检测并阻止高风险网络安全的请求。

对我们的意义

Opus 4.7 的发布有两个值得关注的点:

1. 软件工程能力的质变 — 从 72% 到 80.8% 的 SWE-bench 提升,意味着 AI 编码能力已经进入了"能做最难那部分工作"的阶段。结合 Claude Code 等 Agent 工具,开发者可以越来越多地把复杂任务交给 AI 自主完成。

2. 安全与能力的平衡 — Anthropic 对待模型安全的策略值得关注。他们不是简单的不发布强大模型,而是通过安全项目(Cyber Verification Program)让合格的安全研究人员使用,这种分级放行的思路可能是未来前沿模型的安全范式。

3. 模型竞争格局 — Opus 4.7 的发布紧接 DeepSeek V4 和 GPT-5.5,前沿模型的迭代速度已经缩短到按月计算。对开发者来说,这是一个好消息——更多的选择、更快的进步、更有竞争力的价格。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://aprilzz.com/ai/claude-opus-4-7