AI 前沿·阅读约 2 分钟·
Google I/O 2026 全面解读:Gemini 3.5、Omni 与 AI 搜索变革

Google I/O 2026 全面解读:Gemini 3.5、Omni 与 AI 搜索变革

Google 在 I/O 2026 上发布了 Gemini 3.5 Flash、Gemini Omni、Antigravity 2.0 等重磅产品,同时宣布 25 年来最大规模的搜索改造——AI 搜索正式成为主角。

原文来源:Google Blog 官方公告 — 2026 年 5 月 20 日发布。同期 TechCrunchForbes 等媒体均有深度报道。

2026 年 5 月 19-20 日,Google I/O 大会时隔多年再次带来实质性震撼。今年的主题非常明确:AI 不再是辅助功能,而是所有产品的核心

从 Gemini 3.5 系列模型、Omni 多模态生成能力,到 Antigravity 2.0 开发者平台、AI 搜索的全面改造,Google 几乎重构了自己的整个产品线。这篇文章把这些变化梳理清楚。

Gemini 3.5 Flash:更快、更强、更便宜

Gemini 3.5 Flash 是本次大会的核心发布之一。作为 Flash 系列的最新成员,它在速度、智能和成本之间实现了新的平衡。

关键性能数据:

基准测试分数说明
Terminal-Bench 2.176.2%编码 Agent 基准
GDPval-AA1656 EloAgent 能力评级
MCP Atlas83.6%MCP 工具调用

Google 称 3.5 Flash "在 Artificial Analysis 指数中占据右上象限"——意思是它在速度和智能两个维度上都处于行业领先位置,用户不再需要在质量和延迟之间做取舍。

对于开发者来说,最有价值的信息是:3.5 Flash 在长周期 Agent 任务上表现尤为出色。那些以前需要开发者花几天、审计师花几周的工作,现在可以在更短时间、以不到其他前沿模型一半的成本完成。

另外,Gemini 3.5 Pro 已经在内部使用,预计下月正式发布。

Gemini Omni:任何输入到任何输出

如果说 3.5 Flash 是"更好用的模型",那 Gemini Omni 就是"全新的物种"。

Gemini Omni 是一个多模态生成模型,可以从任何类型的输入(文字、图片、视频、音频)生成任何类型的输出。Google 的第一站是视频生成:

  • 物理理解能力:Omni 对重力、动能、流体力学有直观理解,生成的场景更逼真
  • 参数引用生成:可以将任何参考素材(图片、文字、视频、音频)整合为统一输出
  • SynthID 水印:生成内容自动嵌入不可见的数字水印
  • 角色一致性:同一角色的身份和声音在多个场景中保持一致

目前 Omni Flash 已面向 Google AI Plus/Pro/Ultra 用户开放,可通过 Gemini 应用、Google Flow 和 YouTube Shorts Remix 使用。

这标志着 Google 在视频生成赛道上的正式入场。此前该领域以 Runway、Pika 等初创公司和 OpenAI Sora 为主,Google 凭借 Gemini 的品牌效应和分发渠道,直接成为头号竞争者。

AI 搜索:Google 25 年来的最大改造

I/O 2026 上最引人注目的变化是搜索本身。

Google 宣布了超过 25 年来最大规模的搜索框升级——新的搜索框完全以 AI 重新设计。用户现在可以:

  • 用文字、图片、文件、视频和 Chrome 标签页混合搜索
  • 在 AI Overview 和 AI Mode 之间无缝切换,保持对话连续
  • 搜索框本身变成一个智能推理引擎,能跨来源综合信息

关键数据:AI Mode 月活用户已突破 10 亿,查询量每季度翻倍以上。

TechCrunch 用了一个直接了当的标题:"Google Search as you know it is over"(你熟悉的 Google 搜索已经结束了)。与其同时,数十家 AI 搜索初创公司正在涌入这个市场——这可能是 Google 历史上第一次在核心搜索领域面临真正的生态竞争。

搜索 Agent

大会还预告了"搜索 Agent"的概念:用户可以创建和管理多个 AI Agent,让它们在后台 24/7 运行,主动追踪任何话题、任务或项目。这标志着 Google 对搜索的定义从"你来找答案"变成了"答案主动来找你"。

Antigravity 2.0:从 IDE 到 Agent 平台

Google 的 Antigravity 在大会上从一款 AI 编码助手进化为一个完整的 Agent 优先开发平台

Antigravity 2.0 提供了:

  • 桌面应用:重新设计的独立桌面客户端
  • CLI 工具:命令行集成,适合 CI/CD 场景
  • Managed Agents API:在 Gemini API 中托管和管理 Agent
  • CodeMender:自动安全补丁功能
  • Google AI Studio 扩展:进一步降低 Agent 开发门槛

但更新也引发了一些争议。一篇在 Hacker News 上热传的博文("Google's Antigravity Bait and Switch")详细描述了强制更新如何"杀死"了原有 IDE 的工作流程:自动更新将 1.0 版 IDE 替换为了 2.0 版的对话式聊天界面,导致用户的历史记录和配置被清空。

这种"强制升级"引发了一个值得业界反思的问题:当 AI 工具本身也在快速迭代时,如何平衡新功能推送与用户已有工作流之间的稳定性?

Gemini 应用全面升级

Gemini 应用本身也迎来了重大改版:

  • "Neural Expressive"设计语言:全新视觉风格,流行动画和鲜艳配色
  • "思考级别"(Thinking Level)控制:用户可调节模型推理深度
  • Gemini Live 改进:更自然的语音对话体验
  • 对话式视频编辑:直接说"给我的人物加个 ZOOM 特效"就能完成

Flow:Google 找到了自己的创意工具

Google Flow 获得了重大更新:Gemini Omni Flash 集成、Flow Agent 和 Flow Tools。Flow 从一个简单的 AI 视频工具成长为完整的创意工作台,支持从灵感参考到成片的全流程。

值得关注的行业趋势

1. Agent 平台化

本次 I/O 最明显的信号是:Google 正在将一切产品 Agent 化。搜索有 Agent,开发有 Antigravity,创意有 Flow Agent。每家科技巨头都在做同一件事:让 AI Agent 成为用户与数字世界的默认交互方式。

2. 视频生成进入"三国杀"

OpenAI Sora、Runway Gen-4、Google Gemini Omni——视频生成赛道已经进入巨头逐鹿阶段。Omni 的差异化在于它能将 Gemini 的知识理解能力融入视频生成,使产出不仅仅是好看的画面,而是有内容的叙事。

3. AI 搜索的"后链接时代"

Google 在搜索领域的彻底改造,意味着传统"十个蓝色链接"的时代已经结束。这对 SEO、内容创作、流量分发都将产生深远影响。对于那些多年来围绕 Google SEO 建立的商业模式来说,这是一个需要立刻关注的结构性变化。

延伸阅读

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://aprilzz.com/ai/google-io-2026-ai-search-agent-platform