Deep Reading

从细菌到大模型，智能都是预测

如果预测不仅是大模型的工作方式，也是生命和智能的共同基础，我们该如何重新理解 AI？

在过去两年的科技产业语境中，围绕大语言模型（LLM）最常见的一类贬抑性评价是：它不过是「随机鹦鹉」，只是在做「下一个 token 预测」（next-token prediction）。这类批评背后有一个人类中心主义假设：真正的智能必须包含某种不能被概率统计还原的理性内核。

Google Research 副总裁、Paradigms of Intelligence 团队创始人 Blaise Agüera y Arcas 在《什么是智能？》（What Is Intelligence?）中，对这一假设提出了系统反驳。他没有否认 AI 在做预测。相反，他提出了一个更激进的判断：预测不仅是智能的本质，也是生命的本质。

这本书不像常规科普，更像一套跨学科论证。作者穿梭于理论生物学、热力学、控制论、认知神经科学和计算机科学之间，试图为智能寻找一个物理和演化基础。对于长期关注算力、参数量和基准测试的科技从业者而言，这本书提供了一个少见的时间纵深：它把当下的 AI 革命，直接放回地球 40 亿年的生命演化史中。

序列预测的本体论

理解这本书的起点，是打破我们对「机器」和「生命」的二元对立。自笛卡尔以来，我们习惯于将自然界视为一台精密的钟表机器，再把人类理性视为某种外在于这台机器的超然存在。但在 Agüera y Arcas 看来，生命从一开始就是一种计算。

回到 40 多亿年前地球的冥古宙。在深海热泉喷口，一些简单化学物质开始形成自我催化的循环。当物理定律允许计算存在时，计算就会成为一种「动态吸引子」。作者借用约翰·冯·诺伊曼的通用构造器理论指出，任何能够自我复制的实体，都可以被理解为一种执行信息读写和构造任务的计算系统。DNA 是它的纸带，核糖体是它的读写头。

生命要在热力学第二定律的压力下维持自身的「动态稳定」，就必须不断从环境中获取低熵，也就是自由能，并排出高熵。这要求生命持续与环境互动。而在充满不确定性的环境中存活，最有效的策略就是预测。

单细胞细菌没有大脑。但当它通过细胞膜上的受体感知周围营养物质浓度的变化，并据此决定继续向前游动还是随机翻滚时，它已经在做一种基于时间序列的概率预测。它要计算的是：给定过去的感官输入和自身内部状态，采取哪种行动最可能提高未来的生存概率。

因此，真正的智能并非逻辑推理的副产品，而是生命为了在复杂环境中维持动态稳定而演化出的生存能力。

从这个角度看，大语言模型通过海量文本训练获得的「下一个 token 预测」能力，与生物在演化中磨砺出的预测能力，在数学结构上存在相似性。语言本身就是人类对世界的压缩代码。这个世界既包括物理环境，也包括彼此的心理状态。如果一个模型能够高度准确地预测人类语言序列，它就需要在内部建立对因果关系、常识和情感的抽象表征。要接近完美预测，模型就必须压缩出相当丰富的世界结构。

如果说细菌和大模型都在预测世界，那么下一个问题是：意识、自我、AI 风险和未来产业结构，是否也都可以从预测出发重新理解？

从细菌到大模型，智能都是预测

序列预测的本体论

阅读更多

Claude Opus 5 没有降价，客户开始决定每任务成本

K3 引发抛售，华尔街高估了开源模型的威胁

Bun 用 11 天迁移 53 万行代码，AI 编程基准还可信吗？

IBM 暴跌 25%，苹果市值大涨：市场开始计算 AI 投资的成本