从细菌到大模型,智能都是预测
如果预测不仅是大模型的工作方式,也是生命和智能的共同基础,我们该如何重新理解 AI?
在过去两年的科技产业语境中,围绕大语言模型(LLM)最常见的一类贬抑性评价是:它不过是「随机鹦鹉」,只是在做「下一个 token 预测」(next-token prediction)。这类批评背后有一个人类中心主义假设:真正的智能必须包含某种不能被概率统计还原的理性内核。
Google Research 副总裁、Paradigms of Intelligence 团队创始人 Blaise Agüera y Arcas 在《什么是智能?》(What Is Intelligence?)中,对这一假设提出了系统反驳。他没有否认 AI 在做预测。相反,他提出了一个更激进的判断:预测不仅是智能的本质,也是生命的本质。

这本书不像常规科普,更像一套跨学科论证。作者穿梭于理论生物学、热力学、控制论、认知神经科学和计算机科学之间,试图为智能寻找一个物理和演化基础。对于长期关注算力、参数量和基准测试的科技从业者而言,这本书提供了一个少见的时间纵深:它把当下的 AI 革命,直接放回地球 40 亿年的生命演化史中。
序列预测的本体论
理解这本书的起点,是打破我们对「机器」和「生命」的二元对立。自笛卡尔以来,我们习惯于将自然界视为一台精密的钟表机器,再把人类理性视为某种外在于这台机器的超然存在。但在 Agüera y Arcas 看来,生命从一开始就是一种计算。
回到 40 多亿年前地球的冥古宙。在深海热泉喷口,一些简单化学物质开始形成自我催化的循环。当物理定律允许计算存在时,计算就会成为一种「动态吸引子」。作者借用约翰·冯·诺伊曼的通用构造器理论指出,任何能够自我复制的实体,都可以被理解为一种执行信息读写和构造任务的计算系统。DNA 是它的纸带,核糖体是它的读写头。

生命要在热力学第二定律的压力下维持自身的「动态稳定」,就必须不断从环境中获取低熵,也就是自由能,并排出高熵。这要求生命持续与环境互动。而在充满不确定性的环境中存活,最有效的策略就是预测。
单细胞细菌没有大脑。但当它通过细胞膜上的受体感知周围营养物质浓度的变化,并据此决定继续向前游动还是随机翻滚时,它已经在做一种基于时间序列的概率预测。它要计算的是:给定过去的感官输入和自身内部状态,采取哪种行动最可能提高未来的生存概率。
因此,真正的智能并非逻辑推理的副产品,而是生命为了在复杂环境中维持动态稳定而演化出的生存能力。
从这个角度看,大语言模型通过海量文本训练获得的「下一个 token 预测」能力,与生物在演化中磨砺出的预测能力,在数学结构上存在相似性。语言本身就是人类对世界的压缩代码。这个世界既包括物理环境,也包括彼此的心理状态。如果一个模型能够高度准确地预测人类语言序列,它就需要在内部建立对因果关系、常识和情感的抽象表征。要接近完美预测,模型就必须压缩出相当丰富的世界结构。
如果说细菌和大模型都在预测世界,那么下一个问题是:意识、自我、AI 风险和未来产业结构,是否也都可以从预测出发重新理解?