AI Picks

替用户操作电脑的 AI，这门生意最后不归浏览器

桌面 AI 助手会继续发展，但短期内未必会先变成一个独立的浏览器产品。

赵赛坡

23 Mar 2026 — 阅读时间 10 分钟

Editor's Note

🗓️ 2026.03.23 | Issue#041

OpenAI 准备把 ChatGPT、Codex 和 Atlas 收进一个整合后的桌面应用，Google 一边补 Gemini Mac 应用，一边收缩 Project Mariner 的独立投入，Walmart 则直接放弃了让 ChatGPT 代结账的旧方案，改成让自家 Sparky 进驻 ChatGPT 和 Gemini。几家公司同时调整产品，已经把问题讲得很清楚。桌面 AI 助手会继续发展，但短期内未必会先变成一个独立浏览器产品。更有机会把用户留下来的，还是那些本来就掌握账户、任务历史、支付关系和后续服务的平台。

产业纵深

AI 基础设施的竞争已经延伸到电力和政策支持

亚马逊 CEO Andy Jassy 上周在内部会里说，AWS 十年后的年收入预期可以从 3000 亿美元抬到 6000 亿美元，并用这个判断解释为什么公司愿意继续砸 2000 亿美元资本开支。Reuters 把这层说得很直白，土地、电力、建筑、芯片和服务器都得提前两年铺好。

随后，竞争迅速从资本开支推进到了长期供给和能源建设。Reuters 披露，AWS 到 2027 年底前将向英伟达采购 100 万颗 GPU，并把推理芯片、网络设备一起锁下来。到了周五，AP News 又写到，美国能源部和 SoftBank 正在俄亥俄推进 10 吉瓦数据中心和 9.2 吉瓦天然气发电项目。

所以这周再看 AI 基础设施，已经不能只停留在「GPU 供应如何」。更现实的问题是，谁拿到了未来几年的供电、审批和长期合同，谁就更可能决定下一轮扩张速度。模型公司的融资还重要，但联邦政府层面的政策支持和审批协调、电力系统的接入、大云厂提前签下的多年订单，已经开始比模型发布节奏更影响行业进度。

模型市场开始按成本、任务和能力所有权分层

上周，模型公司和部署方看模型的方式也变了。OpenAI 发布了 GPT-5.4 mini 和 nano，明确把更便宜的小模型放进编码助手、子代理和电脑操作场景。另一边，Mistral 推出 Forge 和 Small 4，把重点放在让企业更容易按自己的数据、部署方式和成本结构来做模型。

到了周五，这个变化又往前走了一步。VentureBeat 写到，小米把高强度代理任务的价格压到 GPT-5.2 和 Claude Opus 4.6 的几分之一；另一篇 VentureBeat 则说，MiniMax 的 M2.7 已经承担了自家 30% 到 50% 的强化学习研究流程。

几家公司走的路不一样，但市场判断已经很接近。模型市场正在分层。有人做最强闭源模型，有人做便宜小模型，有人卖企业定制，也有人把关键能力重新放回自己手里。部署方以后会一起比较三件事：模型适不适合具体工作，价格够不够低，关键能力还能不能留在自己手里。

AI 助手可能首先改变 AI 公司自己的工作分配

很多人还在讨论 AI 助手什么时候会大规模改变外部岗位，但上周更具体的变化先出现在公司内部。MIT Technology Review 披露，OpenAI 已把打造自动化研究员定成未来几年的研究主线，准备先在 2026 年 9 月前做出自动化研究实习生，再在 2028 年推进多代理研究系统。

同一天，MiniMax 说模型已经承担了自家 30% 到 50% 的强化学习研究流程，CNBC 又引述黄仁勋的话称，未来工程师可能会拿到相当于半份年薪规模的模型调用额度。

这些变化说明，这类 AI 助手已经从对外展示的产品卖点，进入公司内部的预算、研发和资源分配。如果一家公司真的开始按模型完成的工作量来分配额度、审批权限和考核方式，那么 AI 对组织的影响，很可能会先出现在公司内部的工作分配上，对外宣传里的裁员数字反而会更晚出现。

聚焦：替用户操作电脑的 AI，最后会留在谁的产品里？

上周最有意思的，是几家公司同时用产品调整回答了同一个问题。OpenAI 准备把 ChatGPT、Codex 和 Atlas 收进一个整合后的桌面应用，Google 开始测试 Gemini Mac 应用，还让它读取日历和屏幕上下文。与此同时，WIRED 写到，Google 正在调整 Project Mariner 团队，因为单独做会替用户操作网页和应用的 AI，使用量一直没有起来。

这里最值得注意的，是 Google 和 OpenAI 都在往更强的产品里靠。独立的浏览器产品很适合拿来演示会替用户操作网页和应用的 AI，打开网页、点按钮、跑步骤，看起来像是电脑自己会干活了。长期使用时，用户更看重的是任务不要断、账户不要重登、历史记录能回看、文件和日历能直接接上，出了问题还能知道卡在哪一步。真正能满足这些条件的，多半是桌面 AI 助手、本地客户端和已经沉淀了身份与权限的产品。

Walmart 的调整把这个分歧摆得更清楚。WIRED 报道，Walmart 和 OpenAI 去年试的 Instant Checkout 转化很差，只有跳回官网结账方案的约三分之一。于是它换了一个方案，让自家 Sparky 直接进入 ChatGPT 和 Gemini。用户第一次登录之后，ChatGPT 里的购物车和 Walmart 自家 App、网站里的购物车会同步。

商家愿意借聊天产品获客，但不愿把账户关系、购物车和后续服务一并交出去。模型平台想成为用户发出指令的前台，因为这意味着更多使用时长、更多交易抽成，也意味着以后能接更多服务。但零售商、SaaS 公司、办公平台甚至设备厂商，都更在意把用户关系留在自己的体系里。谁掌握登录、支付、售后和历史数据，谁就不愿只做一个被模型调用的后台接口。

Perplexity 上周先推本地 Mac 代理，又把 Comet 推上 iPhone 和 iPad，这组动作也很有参考价值。会替用户操作网页和应用的 AI 仍然有机会。关键要看，它们能不能单独成为稳定产品。现阶段看，这类产品会继续承担搜索、浏览、轻任务和发现新服务的角色。但真到了交易、协作、长任务和持续授权，用户多半还是会回到更强的桌面 AI 助手、商家产品和设备平台。

这也解释了为什么 OpenAI 现在反而把产品往整合后的桌面应用里收，没有继续把 Atlas 单独做成更大的浏览器故事。它想拿到两样东西。会替用户操作网页和应用的能力是一层，用户整段任务是另一层。Google 补 Mac 应用，也是同样的逻辑。谁能接住屏幕上下文、文件、日历、历史对话和本地权限，谁就更有机会把这段使用关系留在自己的产品里。否则，每次都得从一个网页标签重新开始。

所以回到这个问题，替用户操作电脑的 AI，最后会留在谁的产品里？至少从上周几家公司的动作看，这门生意短期内不会先归一个独立浏览器产品。更可能留下来的，是那些本来就握有账户、任务历史、支付关系和后续服务的桌面 AI 助手、商家产品和设备平台。模型公司当然还能拿到很重要的一层位置，它们会越来越像意图分发和任务协调的前台。但真把交易做完、把工作接住、把后续关系留住的，大概率还是商家自己的助手、桌面 AI 助手和设备平台。上周这些动作没有否定这类 AI。它们只是提醒我们，这门生意最后拼的是谁能接住完整的用户关系。会不会点网页，只是第一步。

信号

《华尔街日报》写到，苹果今年 AI 相关收入有望超过 10 亿美元，其中大头来自 ChatGPT 等应用的 App Store 抽成。自己的模型没追上，不妨碍它先靠设备和支付入口收钱。
The New Stack 详细介绍了 NemoClaw 和 OpenShell。更值得注意的是，英伟达已经把权限、安全和运行环境一起打包进自己的基础设施销售里。
American Medical Association 称 81% 的美国医生已经在工作中使用 AI。另一边，Bloomberg Opinion 认为不少公司在用 AI 包装原本就会发生的裁员。这两件事放在一起看，真实采用和资本市场喜欢的故事，走得并不一样。
BBC 报道，英国政府在创作行业强烈反弹后，放弃了更偏向让 AI 公司默认可用版权内容训练模型的方案。训练版权这件事，短期内还是很难一次性放开。
TechRadar 披露，迪士尼在约四个月内做出会走路的 Olaf 角色机器人，但首发场景仍是受控演出，主控也仍由人类接管。物理 AI 的第一批稳定生意，先落在专用场景，离通用机器人还远。