Code with Claude 2026 大会亲历记：AI 原生的工程组织长什么样

原文来源：Chris Ebert's Blog — 作者亲赴 Anthropic 第二届 Code with Claude 开发者大会，记录关键发布、核心议程和七条改变工作方式的思考。

2026 年 5 月 6 日，Anthropic 在旧金山举办了第二届 Code with Claude 开发者大会。需求远超预期——Anthropic 甚至为没能抢到首日票的独立开发者和早期创业者加开了第二天专场。

这是一场信息密度极高的大会。从 AI 原生的工程组织方式，到上下文窗口管理的实战技巧，每场分享都在指向同一个结论：AI 已经不再是辅助工具，它正在重塑软件开发的全流程。

大会概况

Code with Claude 2026 的目标受众是正在用 AI 构建产品的软件开发者、产品经理和技术领导者。大会在旧金山启动后，还会巡回到伦敦（5 月 19 日）和东京（6 月 10 日）。议程包括主题演讲、工作坊、专题分享和一对一交流。

大会在 SVN West 举办，三层场地容纳了数千名参会者。Startup 和中小企业是主力，但也有不少大型企业和咨询公司的人。"这是第一次参加开发者大会，全场没有一个人在焦虑 AI 会取代自己，"一位参会者如此评价——取而代之的是一种务实的好奇：怎么把这些工具用好。

一个值得注意的细节是：Anthropic 在技术和领导岗位上的女性比例显著高于行业平均水平。 主题演讲由首席产品官 Ami Vora 开场，随后上台的研发产品主管 Dianne Na Penn、平台工程主管 Katelyn Lesse、Claude 平台产品主管 Angela Jiang 以及 Claude Code 产品主管 Cat Wu——几乎全部主题演讲者都是女性。Claude Code 负责人 Boris Cherny 压轴登场。CEO Dario Amodei 并没有出现在主题演讲中，这在以"创始人明星"为营销点的 AI 公司中显得有些反常，但也传递出一个信号：AI 原生公司将产品置于叙事中心。

重要发布

Anthropic 没有在这次大会上发布全新模型或重磅产品（Mythos 的访问权限仍然只能通过邀请获得）。相反，大会议程集中在已有能力的提升上。

最引人注目的消息是与 SpaceX 达成算力合作。 这一合作不仅给 Anthropic 带来了额外的算力，也直接提升了用户的 Claude 订阅使用上限和 API 速率限制。Anthropic 一直面临算力瓶颈，这次合作显著缓解了这个制约。Dario Amodei 在后续交流中透露：2026 年以来，需求增长了惊人的 80 倍。

Claude Managed Agents 进入了快速发展阶段。 大会公布了三个新能力：Multiagent Orchestration（多智能体编排，可安排一组 agent 协作处理复杂任务）、Outcomes（结果定义，让 agent 根据成功标准自我迭代和改进）以及 Dreaming（记忆复用，允许 Claude 回顾之前的会话并在此基础上继续工作）。

Dianne Penn 在主题演讲中暗示 Anthropic 正在研发"让人感觉无限大的上下文窗口"，引发了不小的讨论。但后续的技术分享很快给出了更现实的画面——上下文窗口的限制在过去一年多里保持在大约 100 万 tokens，没有出现指数级增长。 主题演讲的宏大愿景和工程实践之间的反差，成了当天最有趣的张力。

核心主题一：上下文窗口还是一个盒子

Daisy Hollman（Anthropic 技术专家）在"Beyond the Basics with Claude Code"工作坊中花了大量时间阐述一个观点：构建 agent 最难的问题之一是决定把什么信息放进一个固定大小的盒子。 其他模型能力（推理、速度）在飞速增长，但上下文窗口在过去一年多里几乎没有变化，而且她认为短期内也不会根本性改变。

这意味着盲目地把 CLAUDE.md 塞满规则和约定，并不是一个好的策略。你的模型在每个回合都要为这些内容付费——不仅是经济上的，还是效果上的。

Claude Code 有几种主要的抽象机制：CLAUDE.md、MCP、技能、hooks 和子 agent。MCP 是通用标准，但完整的工具描述会消耗大量上下文。二十个 MCP 服务器，每个暴露十五个工具——你的 prompt 里全是工具定义，Claude 还没读到一行代码或任务说明。Daisy 建议：如果你已经有能做这件事的 CLI，让 Claude 直接调用它，比包装成 MCP 服务器更高效。

Hooks 值得特别关注。Hooks 是唯一一种"不触发就不耗上下文"的抽象机制。 它像是 agent 的"红色波浪线"——在错误发生的那一刻注入修正，而不是事后再做代码审查。

Brad Abrams（Claude 平台产品负责人）给出了一个具体建议：在生产 agent 中，先追求至少 80% 的 prompt 缓存命中率。 Cursor、Replit、Perplexity 和 Claude Code 自身的缓存命中率都在 90% 以上。缓存 tokens 更便宜、更快、不计入速率限制。三个简单规则：把不用的工具 schema 移出上下文；把原始工具输出移出上下文；用程序化工具调用让模型写代码检查结果，只提取需要的内容。

数据的形状也很重要。在"Build a Proactive Agent Workflow with Claude Code"分享中，Noah Zweben 举了一个例子：一家体育公司将工具输出从 JSON 改为 markdown、删除不需要的字段和时间戳后，token 消耗减少了 66%——不仅成本降低，效果还好了。

核心主题二：瓶颈已经转移

多位演讲者从不同角度论证了同一个事实：写代码不再是开发流程中的瓶颈。 验证、审查、协调、搞清楚要做什么——这些才是新的慢速环节。

Fiona Fung 在关于 AI 原生工程组织的分享中一针见血："瓶颈已经从编码转移到了编码周围的一切。" 旧的制约是带宽——写代码的时间、写测试的时间、重构的时间。这个制约已经消失或正在消失。新的制约是审查能力、验证能力、跨职能协调能力和安全意识。

Noah Zweben 的分享给出了具体数据。他展示了自己团队每周合并到主分支的 PR 数量变化：三个月内，周 PR 吞吐量增长了 300%——从一月的 500 个增加到三月的 1,150 个。 这带来了新问题：团队只有一个人专门负责文档。为了避免文档成为瓶颈，他们必须重新思考效率——让 Claude 和 agentic 工作流在夜间异步更新文档。

Boris Cherny 和 Jarred Sumner（Bun 创始人）的现场编程环节从另一个角度印证了这一点。Jarred 展示了 Robobun——一个他构建的、在 Bun 代码库上工作的自主 Claude Code agent。Robobun 现在对 Bun 的提交次数已经超过了 Jarred 本人。 作为项目的创建者和主要维护者，Jarred 的更多 PR 是由 AI agent 关闭的，新功能的添加速度也大大加快。

Jarred 还描述了一个很有意思的工作流：让 CodeRabbit 和 Claude Code 审查同一个 PR，让它们"辩论"。CodeRabbit 检查风格和约定问题，Claude 推理代码链和下游影响。他让 agent 在后台工作，经过几轮迭代后再审查最终输出。

这些例子的共同模式是：工程工作的形态在变化——从写代码和审查代码，变成分配工作、调度一个或多个 agent、然后审查和评估返回的结果。 Daisy Hollman 说得更直白："你应该夜间运行 agent。"六个月前听起来像是天方夜谭，但现在 Opus 4.7 已经可以自主运行数小时。

核心主题三：为下一个模型而构建

Anthropic 的所有演讲者都坚信模型将在可预见的未来继续指数级增长。每场分享都在传递同一个建议：上个月不行的方案，这个月可能就行得通了。 每当新模型发布，都应该重新尝试之前失败的用例。

Dario Amodei 认为模型还有很长的路要走，并且焦点正从个人效率转向团队和组织效率。他预见到未来的模型能够代表整个团队、业务单元甚至整个组织执行任务。 软件工程师之所以成为最早的采用者，部分原因在于代码是异常可验证的。Anthropic 正大力投资研究，让模型在更难以验证的领域也能检查和改进自己的工作。

核心主题四：AI 原生团队长什么样

Fiona Fung 关于 AI 原生工程组织的分享，展示了 Anthropic 内部已经发生的变化：

代码审查不再是全覆盖，而是基于人类判断——哪些真正需要深度审查。入职流程变得不同——提问"愚蠢问题"的成本已经降为零。技术讨论中，代码说了算——当团队成员在设计或方向上存在分歧时，最快的方式是让 Claude 把两种方案都做个原型出来。争论或冗长的规划文书的成本，远高于快速构建和验证。

"构建东西远比争论更便宜。" 规划前置的仪式已经基本消失。另一方面，验证被加倍重视——将验证左移是随着吞吐量提升保持质量的唯一方法。

Fiona 鼓励员工"Claudify everything you can"（把能做的事都交给 Claude），同时给予 AI 原生团队明确的授权：消灭旧的流程。 不讨论，不搁置，直接淘汰。新的流程先跑起来再优化。

重要收获

作者在会议结束后整理了自己的七条行动清单：

1. 在评估上投入更多

对 agentic 工作流的评估投入还不够。这是最具体、最可执行的改进方向。

2. 探索 Claude Managed Agents

多智能体编排和 Dreaming 等概念让构建更强大的 agent 变得更简单，同时减少对基础设施细节的担忧。

3. 用 Routines 替代重复劳动

无论是 claude.ai 还是 Claude Code 的 /schedule 命令，状态检查、文档漂移修复、CVE 补丁、依赖更新这类重复任务应该按计划运行，而不是占用心理待办列表。

4. 在 Claude Code 中启用 flicker-free 模式

Boris 提到的实验性模式，将成为不久的将来默认设置。它改善了性能、滚动和渲染，同时减少了内存消耗。

5. 用 agentic 思维重新评估业务流程

Fiona 的分享提醒我们：Claudify 单个任务是不够的。更高杠杆的问题是：在 agentic 世界里，这个业务流程本身还合理吗？ 大多数团队仍然围绕着 AI 出现之前的假设来组织工作。

6. 多用 Hooks

Hooks 是不触发就不耗上下文的唯一抽象机制。在未来，这会是管理 context 的重要工具。

7. 尝试长时间运行的 agent harness

作者在展台看到一个用多 agent 架构（planner/generator/evaluator）自主构建项目管理工具的 demo——agent 可以在数天甚至数周内持续工作，验证、部署，几乎不需要人工干预。这是软件工程演进的方向。

总结

这场大会让一个事实变得无比清晰：软件工程师的角色正在从"写代码的人"演变为"管理一支异步 agent 团队的产品经理"。

编码不再是瓶颈，真正的瓶颈在编码之外——验证、协调、判断做什么。那些能够把 agent 当作团队来管理、而非当作自动补全使用的工程师，将在这场变革中胜出。即使直接编码的时间减少了，软件工程的工作量并不会减少——构建有用的软件仍然困难，维护、迭代和胶水代码工作依然存在。

只不过，这些工作的形态会变得完全不同。