
Gemini CLI:Google 开源的终端 AI Agent
Gemini CLI 是 Google 推出的开源终端 AI Agent,将 Gemini 3 的强大能力直接带入命令行。支持 60 请求/分钟的免费额度、Google Search 联网搜索、MCP 扩展和代码库级理解。
原文来源:Gemini CLI GitHub — Google 开源的终端 AI Agent,103k Stars,13.5k Forks,将 Gemini 3 的强大能力直接带入命令行。
Gemini CLI 是 Google 推出的开源 AI Agent,核心理念是"把 Gemini 直接放进你的终端"。它不是又一个需要打开浏览器的聊天界面,而是为活在命令行里的开发者设计的轻量级工具。项目采用 Apache 2.0 协议,GitHub 上已获得 103k Stars 和 13.5k Forks,代码库包含 1014 个分支和 505 个标签,提交历史共 6088 次。
核心定位
Gemini CLI 最大的特点是终端优先。它不提供 GUI,不需要浏览器标签页,直接在熟悉的命令行环境中工作。这种设计哲学与 Claude Code、Codex CLI 等工具一致:开发者的时间在终端里,AI 应该来到开发者所在的地方,而不是让开发者去适应 AI 的界面。
这种终端原生设计带来了几个实际好处。首先是上下文连续性,你在哪个目录、哪个分支、什么环境变量,Agent 都能直接感知,不需要像 Web 界面那样手动上传文件或复制粘贴代码。其次是低切换成本,不需要在 IDE 和浏览器之间来回跳转,保持心流状态。最后是脚本化能力,所有交互都可以被管道化、自动化,融入现有的开发工作流。
免费额度与模型能力
Google 为个人用户提供了相当慷慨的免费额度:
- 60 请求/分钟
- 1,000 请求/天
- Gemini 3 模型:改进的推理能力和 100 万 Token 上下文窗口
对于个人开发者和小团队来说,这个额度足以覆盖日常编码辅助需求。不需要管理 API Key,直接用 Google 账号登录即可使用。这种零配置上手的设计降低了尝试门槛,你可以在一分钟内从"听说这个工具"到"用它查询代码库"。
Gemini 3 的 100 万 Token 上下文窗口是一个关键优势。这意味着你可以一次性向 Agent 提供大量代码上下文,比如整个模块、多个相关文件,甚至小型项目的完整代码库。Agent 能够理解跨文件的依赖关系、架构模式和设计意图,而不是只能看到当前文件的局部片段。
内置工具集
Gemini CLI 不是简单的文本生成器,它配备了一套实用的内置工具:
Google Search 联网搜索
可以获取实时信息,查询最新文档、API 变更、技术动态。这让 Gemini CLI 能够回答训练数据截止日期之后的问题,比如"昨天发布的 React 19 有什么新特性"。联网搜索能力对于开发者来说尤为重要,因为技术栈的更新速度远超模型训练数据的刷新频率。
文件操作
读取、写入、修改本地文件。结合代码库理解能力,可以跨文件分析依赖关系、重构代码结构。Agent 可以主动探索项目结构,找到相关文件,提出修改建议,并在你确认后直接应用。
Shell 命令执行
在终端中直接运行命令,比如编译项目、运行测试、查看 Git 状态。AI 可以根据任务需要主动执行命令并分析输出结果。比如当你说"测试失败了,帮我看看",Agent 会自动运行测试命令,分析错误输出,定位问题文件,提出修复方案。
Web 内容获取
抓取网页内容进行分析,适合快速了解文档、博客文章或 issue 讨论。你可以让 Agent "读一下这个 RFC 文档,给我总结一下关键设计决策"。
MCP 扩展支持
通过 Model Context Protocol 连接自定义能力,比如接入内部 API、数据库查询、CI/CD 流水线控制等。MCP 是一个开放的协议,让第三方可以为 Gemini CLI 开发扩展,类似 VS Code 的插件生态。
安装方式
Gemini CLI 提供多种安装途径,覆盖不同用户习惯:
npx 免安装运行
npx @google/gemini-cli适合想快速体验、不想全局安装的用户。运行完即走,不会在系统留下任何痕迹。
npm 全局安装
npm install -g @google/gemini-cli最常用的安装方式,安装后可以在任何目录直接运行 gemini-cli。
Homebrew(macOS/Linux)
brew install gemini-cli适合习惯包管理器安装的开发者,Homebrew 会自动处理依赖和更新。
MacPorts
sudo port install gemini-cli为 MacPorts 用户提供原生支持。
Anaconda 环境
conda create -y -n gemini_env -c conda-forge nodejs
conda activate gemini_env
npm install -g @google/gemini-cli适合在受限环境(如企业内网、学术集群)中使用,通过 conda 隔离依赖。
发布渠道
项目提供三个发布渠道,满足不同稳定性需求:
- Stable:每周二 UTC 20:00 发布,经过完整验证,适合生产环境使用
- Preview:每周二 UTC 23:59 发布,包含最新功能但可能有回归问题,适合想尝鲜的用户
- Nightly:每天 UTC 00:00 发布,包含当天所有变更,稳定性最低,适合贡献者测试
这种多频道发布策略让用户可以根据自己的风险偏好选择合适的版本,同时也为项目提供了广泛的测试覆盖。
GitHub 集成
Gemini CLI 提供 GitHub Action,可以集成到工作流中:
- Pull Request Review:自动代码审查,提供上下文感知的反馈和建议。Agent 会读取 PR 的变更,分析代码质量、潜在问题和改进建议,以评论形式提交。
- Issue Triage:基于内容分析自动标记和优先级排序。新提交的 issue 会被自动分类、打标签、分配给合适的维护者。
- On-demand Assistance:在 issue 和 PR 中 @gemini-cli 获取调试帮助。维护者可以召唤 Agent 来分析复杂问题,获取诊断建议。
- 自定义工作流:构建自动化、定时和按需工作流,比如每日自动生成变更日志、每周扫描依赖漏洞。
这种集成让 Gemini CLI 不仅是个人开发工具,还可以成为团队协作的基础设施。
认证方式
支持三种认证方式:
Google 账号登录(推荐)
适合个人开发者和 Gemini Code Assist 许可证用户。免费额度为 60 请求/分钟、1000 请求/天,使用 Gemini 3 模型和 100 万 Token 上下文窗口。无需 API Key 管理,登录流程使用标准 OAuth。
API Key
适合需要特定模型控制或付费额度访问的开发者。免费额度同样为 1000 请求/天(Gemini 3 Flash 和 Pro 混合),支持按量计费升级。需要自行管理 API Key。
Vertex AI
适合企业团队和生产工作负载。提供高级安全合规、更高额度限制,与现有 Google Cloud 基础设施集成。需要设置 GOOGLE_API_KEY 和 GOOGLE_GENAI_USE_VERTEXAI=true 环境变量。
适用场景
- 需要快速查询代码库、生成代码片段的开发者
- 希望用自然语言执行 Git 工作流、查询 PR 状态的团队
- 需要在 CI/CD 中集成 AI 审查的工程项目
- 追求终端原生体验、不喜欢浏览器界面的用户
- 想要开源免费替代方案、避免 vendor lock-in 的团队
与同类工具对比
| 特性 | Gemini CLI | Claude Code | Codex CLI |
|---|---|---|---|
| 开源 | ✅ | ❌ | ❌ |
| 免费额度 | 1000/天 | 有限试用 | 有限试用 |
| 联网搜索 | ❌ | ❌ | |
| MCP 支持 | ✅ | ❌ | ❌ |
| 模型 | Gemini 3 | Claude 4 | GPT-4o |
| 安装方式 | npm/brew | 专用安装器 | npm |
| 上下文窗口 | 100万 Token | 20万 Token | 12.8万 Token |
Gemini CLI 的优势在于开源免费、Google Search 联网能力和 MCP 扩展性。100 万 Token 的上下文窗口在处理大型代码库时尤为实用。对于已经习惯终端工作流的开发者,这是一个值得认真评估的选择。
项目的发展速度也值得关注。6088 次提交、每周两次发布(Preview + Stable)、385 个待合并的 PR,表明社区参与度极高。Google 对这个项目的投入程度,从发布频率和功能迭代来看,是认真的。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://aprilzz.com/tools/gemini-cli-guide
相关文章
Open-AutoGLM:智谱开源的手机端 AI Agent
Open-AutoGLM 是智谱 AI 开源的手机端智能助理框架,通过多模态视觉理解手机屏幕,以 ADB 自动化操作完成复杂任务。支持 Android、鸿蒙和 iOS,让手机成为真正的 AI 终端。
Trigger.dev:开发者优先的开源工作流自动化平台
Trigger.dev 是面向开发者的开源工作流自动化平台,用 TypeScript 代码定义任务而非拖拽界面,支持 AI Agent、长时运行、弹性扩缩容。
Open Design:Claude Design 的开源替代方案
Open Design 是 Anthropic Claude Design 的开源替代方案,支持 16 种编码 Agent、71 套品牌级设计系统,可生成交互式原型、幻灯片、图片和视频。本地优先、BYOK、可部署到 Vercel。