ETO Markets TrendWatch|Google I/O 2026:从“会回答的AI”走向“会行动的AI”
摘要:Google I/O 2026 开发者大会历来是谷歌年度最重要的产品与技术发布窗口。进入 2026 年,AI 竞争已从模型能力比拼,转向 agent、工作流与平台整合能力的全面竞赛。同赛道厂商中,OpenAI 先后把 Operator 与 ChatGPT agent 推向前台,Anthropic 持续强化 Claude Code 能力,微软也在企业侧借助 Copilot Studio 与多智能体工

Google I/O 2026 开发者大会历来是谷歌年度最重要的产品与技术发布窗口。
进入 2026 年,AI 竞争已从模型能力比拼,转向 agent、工作流与平台整合能力的全面竞赛。同赛道厂商中,OpenAI 先后把 Operator 与 ChatGPT agent 推向前台,Anthropic 持续强化 Claude Code 能力,微软也在企业侧借助 Copilot Studio 与多智能体工作流加速推进代理协作。
相比之下,Google 过去一段时间在舆论场并不算最活跃,但这次 I/O 更像一次“集中交卷”。
本次大会上,谷歌并未像过去那样零散更新单点功能,而是集中亮出一整套 AI 布局。从 Gemini 3.5 Flash、Search Agents,到 Universal Cart、Android XR 与 TPU 底座,模型、入口、终端与基础设施首次被清晰地接成一条线,Google 正把 AI 从“会回答的工具”推进为“会行动的代理体系”。
ETO Markets 将持续跟踪 Google 在模型、搜索、电商与终端侧的整合进展,帮助投资者识别 AI 平台化竞争下的新定价主线。
Gemini 3.5 Flash:执行优先
Gemini 3.5 Flash 是本届 I/O 最核心的模型更新,也是 Google 整个 agent 体系的统一执行引擎。它不再只是 Gemini 产品线里一个“更快的轻量版”,而是被直接放到 Gemini app、Search AI Mode、Gemini API、AI Studio 和 Antigravity 等核心入口中,承担起大规模执行任务的底座角色。

从能力看,Google 明确把它定义为“frontier intelligence with action”。官方披露,Gemini 3.5 Flash 在多数关键基准上超过 Gemini 3.1 Pro,同时运行速度达到其他前沿模型的约 4 倍;在编码和 agent 场景中,它在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等基准上均给出更强表现。
也就是说,这一代 Flash 的提升重点,不是世界知识问答,而是工具调用、长任务链执行与真实开发场景的效率。过去 Gemini 给市场的印象更偏“能回答”,而 3.5 Flash 则明显转向“能执行”。
至此,Google 终于有了一个可以真正支撑 agent 产品大规模落地的默认核心。
Gemini Omni:输入即创作
Google 这次真正拿出来秀肌肉的,是多模态创作框架 Gemini Omni。

它的定位不是单一视频模型,而是一个“任意输入—任意输出”的多模态创作框架,能够把图片、音频、视频和文本作为输入,再生成视频内容,并支持后续通过对话持续修改。
从功能看,Google 对它的定义是“create anything from any input”。首个版本 Omni Flash 先从视频切入,强调 world understanding、multimodality 和 editing 三项能力合并:既能基于真实世界知识理解场景,也能进行跨模态生成,还能在生成后通过对话继续修改角色、背景、镜头和环境。官方也特别强调,用户可以在保留原始内容基础上,只改动某一局部或某一片段。
Gemini Omni 的推出,代表 Google 开始挑战整条创意生产链。相较于当前多数仍停留在一次性产出阶段的生成模型,Omni 正在向“持续创作工作流”演进,并具备从单点能力切入、向完整创作链路扩展的爆发力。
Ask YouTube:从“搜标题”到“问意图”
Ask YouTube 是 YouTube 在本届 I/O 上最贴近用户使用场景的一项 AI 更新——它不只是给搜索框加了 AI,而是在重写用户发现视频内容的方式。

它的核心逻辑,是把传统视频搜索从关键词匹配,升级为对话式检索和定位,让用户不再靠标题、标签和封面找视频,而是直接用自然语言描述需求。
比如,一个家长以前想在 YouTube 上找“怎么教已经会骑平衡车的 3 岁小孩学骑自行车”,通常只能拆成几个关键词去搜,再自己一条条点开视频判断。
但 Ask YouTube 的逻辑是,用户可以直接把这个完整问题丢给系统,Ask YouTube 会先整理出一个结构化答案,再从长视频和 Shorts 里筛出最相关的片段,并直接跳转到对应位置。
它的意义在于,YouTube 正在从内容平台转向“视频知识入口”。一旦搜索方式从关键词转向意图理解,用户获取信息的效率、视频分发逻辑以及平台广告价值,都会被重新定义。
Gemini Spark:每个人的 AI 秘书
相比偏工具化的模型更新,Gemini Spark 更像 Google 首次把“个人代理”真正做成产品。

Google 将其定义为一款 24/7 运行的个人 AI 助手,基于 Gemini 3.5,并运行在 Google Cloud 虚拟机上,即使用户关闭电脑,Spark 仍可在云端持续处理任务。
从能力看,Spark 基于 Gemini 3.5 运行在 Google Cloud 虚拟机上,支持连接 Gmail、Docs、Sheets、Slides 等 Google 产品,能够持续整理信息、执行任务、跟踪进度,并在之后向用户回报结果。
试想一下,你只需要在早上交代一句“帮我整理今天最重要的三件事,再跟进昨天没回复的客户邮件,并把周会资料汇总成一页简报”,Spark 就可以在后台继续调用邮箱、文档、表格和日历去完成这些动作;等你再次打开 Gemini,它给你的不再是一串建议,而是已经推进到具体节点的任务结果。
一旦这种模式被接受,Gemini app 就不再只是聊天入口,而会进一步演变为 Google 用户的个人任务管理中枢。它改变的不是用户“怎么提问”,而是 Google 产品体系第一次开始替用户持续处理跨应用、跨时段的真实工作流。
官方表示,Spark 会先对受信任测试者开放,随后面向美国 Google AI Ultra 用户推出 Beta,同时它还会进入 Chrome 浏览器场景。在 Google “proactive, 24/7 help”的框架下,Spark 将和 Daily Brief 一道,推动 Gemini app 走向更强的 agent 化。
Universal Cart:Google开始认真做Agent电商的前台入口
在所有发布里,商业化想象力最直接落地的一环,其实是购物场景里的 Universal Cart。

Google 把它定义为 intelligent, proactive shopping cart,能够在 Search、Gemini 中汇总用户发现的商品,后续还会扩展到 YouTube 和 Gmail。
从能力看,Universal Cart 会自动追踪折扣与降价、显示价格历史、监测库存恢复,并基于 Gemini 的推理能力主动预判需求和兼容性问题。
如果你想 DIY 一台电脑,把来自不同商家的 CPU、主板、显卡和电源加入购物车后,它不仅会提醒哪些配件不兼容,还会结合 Google Wallet 识别支付卡权益、忠诚度计划和商家优惠,帮助用户选出更划算的方案。Google 同时强调,这套能力建立在更广泛的 agentic commerce 基础设施上,包括 UCP 与支付授权能力。
也就是说,未来用户不再只是“搜商品—比价格—手动下单”,而是把完整购物目标交给代理持续处理:盯价格、等补货、看优惠、查兼容性,最后再给出更优方案。
Android XR 智能眼镜:Gemini“抬头即用”
终端侧最有画面感的一次更新,不是手机,而是把 Gemini 直接搬进现实环境的 Android XR 智能眼镜。

Google 表示,未来会有两类智能眼镜:一类是音频眼镜,另一类是显示眼镜,二者都把 Gemini 作为核心交互层,让用户在不掏手机的前提下获得帮助。
音频眼镜会率先上市,支持 hands-free、heads-up 的交互方式,用户只需开口即可调用 Gemini。
一旦眼镜成为稳定入口,Agent 的默认运行环境就不再局限于屏幕,而会进入人与环境之间的实时层。
TPU 8t / 8i:下一代算力底座
TPU 8t / 8i 是这届 I/O 最偏底层、对估值最关键的更新之一。

Google 首次明确把第八代 TPU 切成双芯片路线:8t 面向训练,8i 面向推理,首次将训练和 agent 时代的大规模推理需求区分开来。
从参数看,TPU 8t 可扩展至 9600 颗 TPU 和 2PB 高带宽共享内存,处理能力接近上一代的 3 倍,性能提升最高 2 倍;TPU 8i 则支持 1152 颗 TPU 组成单个 pod,拥有 3 倍片上 SRAM,并强调更低延迟、更高吞吐和更优单位性能。
归根结底,上述发布的 Gemini、Spark、Search Agents、XR 眼镜与电商协议等等,最终都建立在 TPU、自研芯片和云基础设施之上。AI 的背后是算力,算力的背后是电力——这一点不会更改。
TPU 的训练与推理路线被正式拆分,说明 Google 已把 agent 时代的大规模算力需求,提前放进规划里,时刻准备着。
Google重连全栈 AI
整体来看,I/O 2026 最重要的信号,不是某个单点产品最惊艳,而是 Google 终于把分散的 AI 更新收束成一条清晰主线:
Gemini 3.5 Flash 负责执行
Omni 负责创作
Ask YouTube 负责内容与生产力入口
Spark 负责 agent 工作流
Universal Cart 负责流量与交易闭环
Android XR 负责终端延展
TPU 8t / 8i 负责底层支撑
至此 Google 的打法也随之从“追模型”转向“重系统”——用模型把搜索、购物、安卓、工作流和终端重新串起来。
ETO Markets 认为,Google 下一阶段的估值重估,不会只取决于单一模型表现,而将更多取决于这些产品能否真正把 Search 流量、Workspace 使用、购物意图与 AI 基础设施,整合为一个可持续变现的系统周期。
人类有史以来规模最大的生产力改造,还在继续。
免责声明
本文所载信息仅供参考,不构成任何投资建议、要约或招揽。我们不对信息的准确性、完整性或时效性做出保证,对于因依赖此信息而造成的任何损失不承担责任。
关于我们
ETO Markets 是一家立足澳大利亚、面向全球的金融服务提供商,业务覆盖 120 多个国家和地区。我们依托先进交易技术与稳健安全保障,为全球客户铸就极速执行、透明合规的交易体验,交易品种涵盖外汇、贵金属、能源、股票、指数、数字货币等多元资产,赋能投资者精准抢占市场先机,打造专业交易优势。
免责声明:
本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性作出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任
