
Context Gateway:AI Agent 上下文优化的开源解决方案
Context Gateway 是 Compresr 团队开源的 Agent 上下文代理,在后台预压缩对话历史,让 AI Agent 永远不会因为上下文超限而卡住等你。
原文来源:Compresr-ai/Context-Gateway — 一个开源的 Agent 上下文代理,在 AI Agent 与 LLM API 之间实时压缩对话历史,让上下文 compaction 瞬间完成。
用 AI Agent 写代码时,你一定遇到过这种情况:对话进行到一半,Agent 突然停下来,告诉你它正在压缩上下文历史。有时候一等就是几十秒,甚至几分钟——特别是在用了像 Caveman 这样的 Token 节省工具之后,长 session 的上下文管理变成了新的瓶颈。
Context Gateway 就是解决这个问题的。
它解决什么问题
AI Agent(Claude Code、Cursor、OpenClaw 等)的每一次对话都会累积历史。到达上下文窗口上限时,Agent 必须停下来压缩历史才能继续。这个过程通常需要几秒到几十秒,而且你什么都做不了,只能等着。
Context Gateway 的思路很简单:在 Agent 和 LLM API 之间加一个代理层,持续在后台预计算压缩结果。 这样当上下文需要 compaction 时,结果已经准备好了——不需要等待。
快速上手
安装非常简单:
# 安装 gateway 二进制
curl -fsSL https://compresr.ai/api/install | sh
# 启动交互式配置向导
context-gateway运行后会打开一个 TUI 配置向导,一步步帮你完成设置:
- 选择你的 Agent(
claude_code、cursor、openclaw或自定义) - 配置摘要模型和 API 密钥
- 设置压缩触发阈值(默认 75%)
- 可选:启用 Slack 通知
配置完成后,Context Gateway 会在后台运行,持续监控你的对话上下文。当检测到上下文接近限制时,它已经在后台完成了历史压缩,你完全感知不到这个过程。
工作原理
Context Gateway 的工作流程可以概括为三步:
- 代理拦截——它作为一个本地代理,拦截 Agent 发送到 LLM API 的请求
- 后台预计算——在 Agent 正常对话的同时,持续对历史进行摘要压缩
- 瞬间切换——当上下文达到阈值时,直接使用预计算的压缩结果替换原始历史
整个过程中,Agent 和开发者的体验是零中断的。你唯一会注意到的是,当别人抱怨 Agent 卡住时,你的 Agent 已经在继续工作了。
支持的 Agent
目前官方支持四种配置模式:
| Agent | 配置名 | 说明 |
|---|---|---|
| Claude Code | claude_code | 官方 Claude Code IDE 集成 |
| Cursor | cursor | Cursor IDE 集成 |
| OpenClaw | openclaw | 开源 Claude Code 替代品 |
| 自定义 | custom | 支持你自己配置的 Agent |
日志与调试
Context Gateway 会把所有压缩记录写入 logs/history_compaction.jsonl 文件中。你可以随时查看压缩了什么、压缩了多少、花了多长时间。
这个 JSONL 文件对于理解你的 Token 消耗模式也很有帮助——能直观地看到哪些对话最耗 Token,哪些 Agent 产生的上下文最多。
性能表现
Compresr 是 YC 孵化的公司,专门做 LLM 提示压缩和上下文优化。Context Gateway 的核心优势在于:
- 零等待——压缩在后台完成,用户感知不到延迟
- 可配置阈值——默认 75% 上下文占用时触发预压缩,也可自定义
- 多 Agent 支持——同一个代理可以同时服务多个 Agent
- Docker 部署——也提供了 Docker 镜像,适合服务器端运行
总结
Context Gateway 和 Caveman 是两种互补的 Token 优化方案。Caveman 在输入端减少 Token,Context Gateway 在运行中管理上下文——两者配合使用,能让长 session 的 Agent 体验流畅很多。
如果你经常使用 AI Agent 处理复杂任务、会话动辄几百条消息,Context Gateway 值得放进你的工具箱。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://aprilzz.com/tools/context-gateway-agent-proxy
相关文章
2026 年 AI 编程工具全景:开发者实际上在用什么?
基于 Pragmatic Engineer 2026 调查(906 名开发者)和多个行业基准,全面对比 Claude Code、Codex、Cursor、Copilot 等主流 AI 编程工具的优劣势和使用场景。
Understand Anything:把你的代码库变成互动知识图谱
一个开源的 Claude Code 插件,用多 Agent 管道扫描你的项目,构建包含每个文件、函数、类和依赖的结构化知识图谱,并提供一个可供搜索和提问的交互式可视化仪表盘。15k+ GitHub Stars。
Reasonix:专为 DeepSeek 设计的开源 AI 编程 Agent,缓存命中率达 99.82%
一个 DeepSeek 原生的开源 AI 编程 Agent,通过缓存优先循环架构实现惊人的 99.82% 缓存命中率,大幅降低 API 成本。支持 MCP、计划模式,完全 MIT 许可。