AI 公司集体抢桌面应用,竞赛翻篇了
Google、OpenAI、Anthropic、Mozilla 在同一周发布桌面级产品,争的不再是 benchmark。
Editor's Note
🗓️ 2026.04.20
上周,Google 发布 Gemini Mac 原生客户端的同一天,OpenAI 把 Codex Desktop 从编程工具升级为全能生产力平台。48 小时内,Anthropic 交出 Opus 4.7、Claude Design 和 Claude for Word 三张牌,Mozilla 也发布了自托管 AI 客户端 Thunderbolt。
四家公司、同一周、同一个方向。争的不再是跑分,是谁先占住你的工作桌面。
「Option + Space」。上周,Mac 用户按下这个快捷键,就能呼出 Google 新发布的 Gemini 桌面客户端。这是 Gemini 在 Android 和 iOS 之后首次登陆桌面。它能读取屏幕内容、调用 Google Drive 和 Photos,直接生成图片和视频。几乎同一时间,Google 还把桌面应用推向了 Windows,Alt + Space 呼出搜索框,能同时检索网页、Drive 和本地文件。Google 自己说得直白:「这只是开始,我们在打造一个真正的桌面助手。」
一家搜索公司,在 2026 年认真做原生桌面客户端。Google 过去十几年极少做消费级桌面应用,Chrome 几乎是唯一的例外。现在 Gemini 同时登陆 Mac 和 Windows,说明浏览器标签页已经不够了。AI 需要比一个网页标签更近的位置。
OpenAI 上周做了类似的事,但更激进。Codex Desktop 的更新让这个原本面向程序员的工具变成了全功能生产力平台,ZDNET 直接拿它和 Anthropic 的 Claude Cowork 做对比。它自带浏览器,能在后台操作你的 Mac,能跨天甚至跨周持续执行任务,还有了记忆功能。OpenAI 在发布会上提到,80% 的员工在用 Codex,言下之意:不只是程序员在用。Codex 现在还会在你打开应用时主动提议接着上次的任务继续。这不再是等你提问的对话框,而是一个有状态、有记忆、会主动开口的工作伙伴。
两家公司在同一周做了同一件事:让 AI 从对话框变成操作系统的一层。
Anthropic 上周的动作更密集。Opus 4.7 只是开始。9to5Mac 报道这个模型时,标题写的是「更少监督」。用户说,以前需要紧盯的高难度编程任务,现在可以放手交给它。Box AI 负责人 Yashodha Bhavnani 给出了更具体的数据:模型调用减少 56%,工具调用减少 50%,响应速度快了 24%,消耗的 AI Units 少了 30%。这组数据对应的是企业实际使用成本的下降,跟 benchmark 排名无关。
Anthropic 同时给 Claude Code 加了 /ultrareview 命令和 auto mode,让开发者可以更长时间无人值守地跑任务。这和 Codex Desktop 的「跨天跨周执行」指向同一个方向:AI 工具正在从「你问我答」变成「你走开我来干」。
Opus 4.7 只是三张牌中的一张。Claude Design 面向不会用设计软件的创始人和产品经理,用自然语言生成原型、幻灯片和单页文档,做完可以导出 PDF、PPTX 或直接发到 Canva 继续编辑。更早几天,Claude for Word 瞄准律师和金融从业者,嵌入 Word 做合同审阅和批注修改。加上 1 月的 Claude Cowork 和随后的 agentic 插件,Anthropic 的路线很清晰:不再只做开发者工具,要嵌入企业每一个部门的工作现场。 Business Insider 的判断更直接:这是对微软办公软件帝国的挑战。这家年化营收超过 300 亿美元、被 VC 追着以 8000 亿美元估值投资的公司,上周同时宣布在伦敦 Knowledge Quarter 租下可容纳 800 人的新办公空间。模型、产品和地盘,三线同时推进。

这对中国 AI 从业者有一层额外含义。过去一年,国内的模型竞争也在经历类似转向。字节的豆包、月之暗面的 Kimi、百度的文心一言都在从纯聊天界面向工具化延伸,但路径不同。中国用户的工作流更多在移动端和微信生态内完成,桌面原生应用的优先级远低于硅谷。上周的密集发布提供了一个对照:当硅谷把桌面当作 AI 嵌入工作流的主战场时,中国公司面对的问题是入口在哪里。答案大概率在企业微信、钉钉或飞书的插件生态里。但赛题是一样的:谁先占住用户的工作现场,谁就掌握下一轮分发权。
上周还有一个不起眼的发布。Mozilla 推出了自托管 AI 客户端 Thunderbolt,支持私有部署,React 源码开放在 GitHub 上。运营它的 MZLA Technologies 是 Thunderbird 邮件客户端的母公司,去年底 Mozilla 说要「为 AI 做我们当年为 Web 做过的事」。当所有大公司冲向「嵌入一切」的时候,Mozilla 提了一个不同的问题:嵌入的主权归谁?Thunderbolt 还在早期开发阶段,正在做安全审计。但它代表的方向值得留意:在 AI 争夺桌面的同一周,有人在问这个桌面应该由谁控制。半年后再看,这可能是监管讨论绕不开的议题。