Semble — 为 AI Agent 量身打造的高效代码搜索工具

原文来源：GitHub - MinishLab/semble — Semble 是一个专为 AI 编码 Agent 设计的代码搜索工具，使用语义搜索代替传统 grep，平均节省 98% 的 token 消耗。

一个让 Agent 更聪明的搜索工具

如果你用过 AI 编码 Agent（如 Claude Code、Cursor 的 Agent 模式），你一定遇到过这个问题：Agent 需要理解你的代码库才能完成任务，但全量读取代码的 token 成本高得离谱。

传统的方案是 grep + read：先用 grep 搜索关键词，再读取匹配文件。这种方式有两个问题：

Semble 就是为了解决这个问题而生的。

根据开发者的基准测试：

方案	Token 消耗	召回率
grep+read（全文）	100k tokens	85%
Semble	2k tokens	94%

Semble 平均使用 98% 更少的 token，同时召回率从 85% 提升到了 94%。

在性能方面，索引一个仓库只需要约 250ms，回答查询只需要 1.5ms，而且这一切都在 CPU 上完成——不需要 GPU。

Semble 的核心思路是语义代码搜索。它不像 grep 那样逐行匹配字符串，而是理解代码的语义——知道「创建用户」和「注册新账户」是同一个意思。

具体来说，它：

Semble 最大的亮点是它可以作为一个 MCP（Model Context Protocol）Server 运行，这意味着任何支持 MCP 的 AI 工具都可以直接使用它。

code

# 安装
npm install -g @minishlab/semble
 
# 以 MCP Server 方式启动
semble mcp --index ./my-project

然后 Claude Code、Cursor 等工具就可以通过 MCP 协议调用 Semble 的搜索能力，而不是每次都暴力读取整个代码库。

对于 Cursor 用户，还可以直接在 .cursor/mcp.json 中配置：

code

{
  "mcpServers": {
    "semble": {
      "command": "npx",
      "args": ["-y", "@minishlab/semble", "mcp", "--index", "."]
    }
  }
}

AI Agent 重度用户——如果 Claude Code 或 Cursor 是你日常开发的主力工具，Semble 能大幅降低 token 消耗，直接省 API 费用
大型代码库维护者——仓库越大，grep 的召回率越低，Semble 的语义搜索优势越明显
关心隐私的开发者——所有索引和搜索都在本地完成，代码不需要发送到云端
自托管 Agent 用户——如果你自己在运行 OpenClaw 或其他开源 Agent，Semble 是一个理想的代码搜索后端

Semble 代表了 AI 工具链中的一个明确趋势：为 Agent 量身定制的底层工具正在快速涌现。

2026 年，我们已经看到：

这些工具的共性是将 Agent 的「感知」和「行动」效率提升到实用水平。Semble 解决的是感知问题——让 Agent 更快地「读懂」你的代码库。

如果你在寻找一个能直接降低 AI 编码成本的开源工具，Semble 值得一试。

项目地址：github.com/MinishLab/semble 许可证：MIT