替用户操作电脑的 AI,这门生意最后不归浏览器

桌面 AI 助手会继续发展,但短期内未必会先变成一个独立的浏览器产品。

替用户操作电脑的 AI,这门生意最后不归浏览器

Editor's Note

🗓️ 2026.03.23 | Issue#041

OpenAI 准备把 ChatGPT、Codex 和 Atlas 收进一个整合后的桌面应用,Google 一边补 Gemini Mac 应用,一边收缩 Project Mariner 的独立投入,Walmart 则直接放弃了让 ChatGPT 代结账的旧方案,改成让自家 Sparky 进驻 ChatGPT 和 Gemini。几家公司同时调整产品,已经把问题讲得很清楚。桌面 AI 助手会继续发展,但短期内未必会先变成一个独立浏览器产品。更有机会把用户留下来的,还是那些本来就掌握账户、任务历史、支付关系和后续服务的平台。


产业纵深

AI 基础设施的竞争已经延伸到电力和政策支持

亚马逊 CEO Andy Jassy 上周在内部会里说,AWS 十年后的年收入预期可以从 3000 亿美元抬到 6000 亿美元,并用这个判断解释为什么公司愿意继续砸 2000 亿美元资本开支。Reuters 把这层说得很直白,土地、电力、建筑、芯片和服务器都得提前两年铺好。

随后,竞争迅速从资本开支推进到了长期供给和能源建设。Reuters 披露,AWS 到 2027 年底前将向英伟达采购 100 万颗 GPU,并把推理芯片、网络设备一起锁下来。到了周五,AP News 又写到,美国能源部和 SoftBank 正在俄亥俄推进 10 吉瓦数据中心和 9.2 吉瓦天然气发电项目。

img

所以这周再看 AI 基础设施,已经不能只停留在「GPU 供应如何」。更现实的问题是,谁拿到了未来几年的供电、审批和长期合同,谁就更可能决定下一轮扩张速度。模型公司的融资还重要,但联邦政府层面的政策支持和审批协调、电力系统的接入、大云厂提前签下的多年订单,已经开始比模型发布节奏更影响行业进度。

模型市场开始按成本、任务和能力所有权分层

上周,模型公司和部署方看模型的方式也变了。OpenAI 发布了 GPT-5.4 mini 和 nano,明确把更便宜的小模型放进编码助手、子代理和电脑操作场景。另一边,Mistral 推出 ForgeSmall 4,把重点放在让企业更容易按自己的数据、部署方式和成本结构来做模型。

到了周五,这个变化又往前走了一步。VentureBeat 写到,小米把高强度代理任务的价格压到 GPT-5.2 和 Claude Opus 4.6 的几分之一;另一篇 VentureBeat 则说,MiniMax 的 M2.7 已经承担了自家 30% 到 50% 的强化学习研究流程。

几家公司走的路不一样,但市场判断已经很接近。模型市场正在分层。有人做最强闭源模型,有人做便宜小模型,有人卖企业定制,也有人把关键能力重新放回自己手里。部署方以后会一起比较三件事:模型适不适合具体工作,价格够不够低,关键能力还能不能留在自己手里。

AI 助手可能首先改变 AI 公司自己的工作分配

很多人还在讨论 AI 助手什么时候会大规模改变外部岗位,但上周更具体的变化先出现在公司内部。MIT Technology Review 披露,OpenAI 已把打造自动化研究员定成未来几年的研究主线,准备先在 2026 年 9 月前做出自动化研究实习生,再在 2028 年推进多代理研究系统。

同一天,MiniMax 说模型已经承担了自家 30% 到 50% 的强化学习研究流程,CNBC 又引述黄仁勋的话称,未来工程师可能会拿到相当于半份年薪规模的模型调用额度。

这些变化说明,这类 AI 助手已经从对外展示的产品卖点,进入公司内部的预算、研发和资源分配。如果一家公司真的开始按模型完成的工作量来分配额度、审批权限和考核方式,那么 AI 对组织的影响,很可能会先出现在公司内部的工作分配上,对外宣传里的裁员数字反而会更晚出现。


聚焦:替用户操作电脑的 AI,最后会留在谁的产品里?

上周最有意思的,是几家公司同时用产品调整回答了同一个问题。OpenAI 准备把 ChatGPT、Codex 和 Atlas 收进一个整合后的桌面应用,Google 开始测试 Gemini Mac 应用,还让它读取日历和屏幕上下文。与此同时,WIRED 写到,Google 正在调整 Project Mariner 团队,因为单独做会替用户操作网页和应用的 AI,使用量一直没有起来。

这里最值得注意的,是 Google 和 OpenAI 都在往更强的产品里靠。独立的浏览器产品很适合拿来演示会替用户操作网页和应用的 AI,打开网页、点按钮、跑步骤,看起来像是电脑自己会干活了。长期使用时,用户更看重的是任务不要断、账户不要重登、历史记录能回看、文件和日历能直接接上,出了问题还能知道卡在哪一步。真正能满足这些条件的,多半是桌面 AI 助手、本地客户端和已经沉淀了身份与权限的产品。

Walmart 的调整把这个分歧摆得更清楚。WIRED 报道,Walmart 和 OpenAI 去年试的 Instant Checkout 转化很差,只有跳回官网结账方案的约三分之一。于是它换了一个方案,让自家 Sparky 直接进入 ChatGPT 和 Gemini。用户第一次登录之后,ChatGPT 里的购物车和 Walmart 自家 App、网站里的购物车会同步。

img

商家愿意借聊天产品获客,但不愿把账户关系、购物车和后续服务一并交出去。模型平台想成为用户发出指令的前台,因为这意味着更多使用时长、更多交易抽成,也意味着以后能接更多服务。但零售商、SaaS 公司、办公平台甚至设备厂商,都更在意把用户关系留在自己的体系里。谁掌握登录、支付、售后和历史数据,谁就不愿只做一个被模型调用的后台接口。

Perplexity 上周先推本地 Mac 代理,又把 Comet 推上 iPhone 和 iPad,这组动作也很有参考价值。会替用户操作网页和应用的 AI 仍然有机会。关键要看,它们能不能单独成为稳定产品。现阶段看,这类产品会继续承担搜索、浏览、轻任务和发现新服务的角色。但真到了交易、协作、长任务和持续授权,用户多半还是会回到更强的桌面 AI 助手、商家产品和设备平台。

这也解释了为什么 OpenAI 现在反而把产品往整合后的桌面应用里收,没有继续把 Atlas 单独做成更大的浏览器故事。它想拿到两样东西。会替用户操作网页和应用的能力是一层,用户整段任务是另一层。Google 补 Mac 应用,也是同样的逻辑。谁能接住屏幕上下文、文件、日历、历史对话和本地权限,谁就更有机会把这段使用关系留在自己的产品里。否则,每次都得从一个网页标签重新开始。

所以回到这个问题,替用户操作电脑的 AI,最后会留在谁的产品里?至少从上周几家公司的动作看,这门生意短期内不会先归一个独立浏览器产品。更可能留下来的,是那些本来就握有账户、任务历史、支付关系和后续服务的桌面 AI 助手、商家产品和设备平台。模型公司当然还能拿到很重要的一层位置,它们会越来越像意图分发和任务协调的前台。但真把交易做完、把工作接住、把后续关系留住的,大概率还是商家自己的助手、桌面 AI 助手和设备平台。上周这些动作没有否定这类 AI。它们只是提醒我们,这门生意最后拼的是谁能接住完整的用户关系。会不会点网页,只是第一步。


信号

  • 《华尔街日报》 写到,苹果今年 AI 相关收入有望超过 10 亿美元,其中大头来自 ChatGPT 等应用的 App Store 抽成。自己的模型没追上,不妨碍它先靠设备和支付入口收钱。
  • The New Stack 详细介绍了 NemoClaw 和 OpenShell。更值得注意的是,英伟达已经把权限、安全和运行环境一起打包进自己的基础设施销售里。
  • American Medical Association 称 81% 的美国医生已经在工作中使用 AI。另一边,Bloomberg Opinion 认为不少公司在用 AI 包装原本就会发生的裁员。这两件事放在一起看,真实采用和资本市场喜欢的故事,走得并不一样。
  • BBC 报道,英国政府在创作行业强烈反弹后,放弃了更偏向让 AI 公司默认可用版权内容训练模型的方案。训练版权这件事,短期内还是很难一次性放开。
  • TechRadar 披露,迪士尼在约四个月内做出会走路的 Olaf 角色机器人,但首发场景仍是受控演出,主控也仍由人类接管。物理 AI 的第一批稳定生意,先落在专用场景,离通用机器人还远。

写在最后

桌面 AI 助手会继续存在,也会继续变强,但这门替用户操作电脑的 AI 生意要先变成稳定生意,如果只是多学会一个自动点击的动作,只能让演示更好看;能不能依附在那些本来就掌握账户、支付、任务和后续服务的平台上,才会决定它能不能留下来。