Context Gateway：AI Agent 上下文优化的开源解决方案

原文来源：Compresr-ai/Context-Gateway — 一个开源的 Agent 上下文代理，在 AI Agent 与 LLM API 之间实时压缩对话历史，让上下文 compaction 瞬间完成。

用 AI Agent 写代码时，你一定遇到过这种情况：对话进行到一半，Agent 突然停下来，告诉你它正在压缩上下文历史。有时候一等就是几十秒，甚至几分钟——特别是在用了像 Caveman 这样的 Token 节省工具之后，长 session 的上下文管理变成了新的瓶颈。

Context Gateway 就是解决这个问题的。

它解决什么问题

AI Agent（Claude Code、Cursor、OpenClaw 等）的每一次对话都会累积历史。到达上下文窗口上限时，Agent 必须停下来压缩历史才能继续。这个过程通常需要几秒到几十秒，而且你什么都做不了，只能等着。

Context Gateway 的思路很简单：在 Agent 和 LLM API 之间加一个代理层，持续在后台预计算压缩结果。 这样当上下文需要 compaction 时，结果已经准备好了——不需要等待。

安装非常简单：

code

# 安装 gateway 二进制
curl -fsSL https://compresr.ai/api/install | sh
 
# 启动交互式配置向导
context-gateway

运行后会打开一个 TUI 配置向导，一步步帮你完成设置：

配置完成后，Context Gateway 会在后台运行，持续监控你的对话上下文。当检测到上下文接近限制时，它已经在后台完成了历史压缩，你完全感知不到这个过程。

Context Gateway 的工作流程可以概括为三步：

整个过程中，Agent 和开发者的体验是零中断的。你唯一会注意到的是，当别人抱怨 Agent 卡住时，你的 Agent 已经在继续工作了。

目前官方支持四种配置模式：

Context Gateway 会把所有压缩记录写入 logs/history_compaction.jsonl 文件中。你可以随时查看压缩了什么、压缩了多少、花了多长时间。

这个 JSONL 文件对于理解你的 Token 消耗模式也很有帮助——能直观地看到哪些对话最耗 Token，哪些 Agent 产生的上下文最多。

Compresr 是 YC 孵化的公司，专门做 LLM 提示压缩和上下文优化。Context Gateway 的核心优势在于：

Context Gateway 和 Caveman 是两种互补的 Token 优化方案。Caveman 在输入端减少 Token，Context Gateway 在运行中管理上下文——两者配合使用，能让长 session 的 Agent 体验流畅很多。

如果你经常使用 AI Agent 处理复杂任务、会话动辄几百条消息，Context Gateway 值得放进你的工具箱。