AI Insider

越发拥挤的「200 亿俱乐部」｜AI Insider#232

Qwen2-Math 称霸数学 AI 模型榜单。

Poe

09 Aug 2024 — 12 min read

Photo by Katt Yukawa / Unsplash

☕ Editor’s Note

🗓️ 2024.8.9 | Issue#232

越发拥挤的「200 亿俱乐部」；
阿里巴巴 Qwen2-Math 称霸数学 AI 模型榜单;
微软与 Palantir 联手进军美国军事情报领域；
OpenAI 高管出走引发 AGI 进展质疑；

您可通过这里查看过往 AI Insider 的精选内容。

🔍 焦点：200 亿估值，或成中国大模型创业公司的拐点

中国大模型的「200 亿俱乐部」越发拥挤。

月之暗面、百川智能和智谱 AI 相继跻身「200 亿（估值）俱乐部」，MiniMax 也紧随其后。

回顾历史，曾经的「AI 四小龙」用近三年时间才触及 200 亿门槛，而如今的大模型新贵们仅用不到一年就完成了这一壮举。这种估值速度的巨大反差，不仅反映了资本市场对 AI 技术的狂热追捧，更暴露了当前投资逻辑中的潜在风险。

正如一位资深投资人所言，「200 亿只是一个数字」。在大模型这一前沿领域，传统的估值逻辑似乎已不再适用。投资人更关注的是谁能在这场马拉松中存活到最后，而非当前的技术水平或商业模式。这种「先融资，后考虑盈利」的思维，虽然为创新提供了充足的养分，却也埋下了泡沫破裂的隐患。

然而，当估值达到 200 亿这个分水岭时，创业公司往往进入一个危险的「中等估值区」。在美国， Character AI 从 40 亿美元缩水至 25 亿美元被 Google 另类收购的案例说明，即便拥有庞大的用户群，没有可行的盈利模式也难逃资本市场的冷眼。对于中国的大模型公司而言，无论是面向 C 端还是 B 端，都面临着艰巨的商业化挑战。

一家估值 200 亿的公司，至少需要在未来 2-3 年内创造 2 亿的利润。然而，目前几乎没有一家大模型创业公司展现出清晰可见的盈利路径。这种估值与商业潜力的严重错配，不仅考验着创业公司的创新能力和战略定力，更挑战着投资人的耐心。

在这种压力下，一些公司可能被迫加速商业化进程，即使创始人认为时机尚不成熟。这种「被逼上梁山」的局面，可能导致企业为追求短期业绩而牺牲长期发展，最终陷入内忧外患的困境。

面对融资的挑战，大模型公司似乎正在探索两条路径：一是寻求地方产业基金的支持，二是吸引如沙特阿美等国际资本的青睐。这两种选择各有利弊：前者可能带来更多的政策支持，但也可能加剧行业向中心化靠拢；后者虽然提供了长期资金，却可能引入新的不确定性。

值得注意的是，科技巨头如腾讯、阿里的参与，为这场游戏增添了新的变数。这不仅可能为大模型公司带来更多资源和机遇，也可能限制它们的独立发展路径。

中国大模型的真正较量，可能要到 2024 年下半年才真正开始。

🆕 产品

阿里巴巴 Qwen2-Math 称霸数学 AI 模型榜单

根据 VentureBeat 的报道，阿里云正式发布了全新的数学 AI 模型 Qwen2-Math，该模型在多个数学基准测试中超越了 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 以及谷歌的 Math-Gemini Specialized 1.5 Pro 等竞争对手，成为了全球表现最佳的数学 AI 模型。

Qwen2-Math 是阿里巴巴 Qwen 系列模型的最新成员，专门针对英语数学问题进行训练。其中，拥有 720 亿参数的 Qwen2-Math-72B-Instruct 在 MATH 基准测试中取得了 84% 的惊人成绩，该测试包含了 12500 道复杂的数学竞赛题目。

此外，Qwen2-Math-72B-Instruct 在 GSM8K（8500 道小学数学题）测试中也以 96.7% 的成绩脱颖而出，并在大学水平的数学测试（College Math benchmark）中取得了 47.8% 的成绩。

值得注意的是，即使是最小的 Qwen2-Math 版本（15 亿参数）也展现出强大的能力，在 GSM8K 上取得了 84.2% 的成绩，在大学水平的数学测试中取得了 44.2% 的成绩。

Mistral 推出 Agent API 和 La Plateforme

法国大模型公司 Mistral 发布了两种构建 AI 代理的新方法：Agent API 和 La Plateforme Agent Builder。

这两种工具旨在简化开发者和非技术用户构建定制 AI 代理的过程。

Agent API 提供了一种编程解决方案，允许开发者将代理创建集成到现有工作流程中。而 La Plateforme Agent Builder 则提供了一个用户友好的界面，允许用户通过简单的配置选项轻松创建和配置代理。

用户可以通过 La Plateforme 控制台访问 Agent Builder，并选择 Mistral 的预训练模型，例如「Mistral Large 2」，「Mistral Nemo」，「Codestral」，或任何微调模型。

此外，用户还可以设置采样温度来控制代理输出的随机性，并添加可选指令和少样本学习演示来指导代理的行为。

一旦代理部署完毕，用户可以通过 API 使用 agent_id 与其交互，或在 Le Chat 上启用聊天功能。

关键词：降价

月之暗面旗下 Kimi 开放平台宣布，上下文缓存 Cache 存储费用降价50%，Cache 存储费用由 10元/1M tokens/min，降低至 5元/1M tokens/min。

上下文缓存（Context Caching）是一种高效的数据管理技术，它允许系统预先存储那些可能会被频繁请求的大量数据或信息。这样，当用户再次请求相同信息时，系统可以直接从缓存中快速提供，而无需重新计算或从原始数据源中检索，从而节省时间和资源。

Google 也宣布旗下 Gemini 1.5 Flash 价格大幅降低，

输入令牌成本下降 78%
输出令牌成本下降 71%

同时，1.5 Flash 调优现已对所有开发者开放，并扩展 Gemini API 的支持语言至 100 多种。

💰 市场

中芯国际净利润同比暴跌近 6 成

根据 Reuters 的报道，中国最大晶圆代工厂商中芯国际 (SMIC) 尽管第二季度净利润同比暴跌 59.1%，但仍超出市场预期。

未经审计的净利润为 1.646 亿美元，超过了 LSEG 调研分析师预期中的 1.038 亿美元。这同时也是全球半导体行业复苏迹象的体现，根据半导体行业协会的数据，全球半导体销售额第二季度增长 18.3% 至 1499 亿美元，中国市场增长 21.6%。

中芯国际主要生产用于不太复杂的电子产品的基本芯片，但先进芯片的生产仍然有限，这限制了中芯国际完全利用人工智能热潮带来的增长机会，而一些竞争对手则从中获益。行业领导者台积电 (TSMC) 第二季度收入增长 40%，这主要归因于人工智能和高性能计算对先进芯片强劲的需求。

企业级 AI 搜索引擎 Glean 估值飙升至 45 亿美元

根据《华尔街日报》的报道，企业级 AI 搜索引擎 Glean 正在进行一轮融资，预计将筹集 2.5 亿美元，估值将翻倍至 45 亿美元。

Glean 由前 Google 搜索工程师 Arvind Jain 于 2019 年创立，该公司提供使用 AI 技术的搜索软件，帮助员工查找跨组织分散的信息。Glean 的订阅收入最近已达到年化 5500 万美元，预计到今年年底将达到 1 亿美元。

Glean 选择使用 OpenAI 和其他开发商提供的语言模型，而不是自行构建，此举降低了成本，但也使其更加依赖合作伙伴。

微软与 Palantir 联手进军美国军事情报领域

根据 Bloomberg 的报道，微软和 Palantir 公司将联手将他们的云计算和人工智能工具推向美国国防和情报机构，为其提供包括 OpenAI GPT-4 在内的软件，用于处理最高机密任务。

两家公司表示，Palantir 将其产品与微软为政府客户提供的 Azure 云服务集成，包括用于机密用途的工具，并将采用微软 Azure OpenAI 服务，部署在这些高度保密的云环境中。

两家公司表示，他们将为国防和情报部门提供「训练营」课程，这是 Palantir 推广其产品的首选方式，以便他们能够试用新的组合技术。

🧗‍♂️公司

AI 数据收集新贵：Turing 公司

根据 Semafor 的报道，Turing 公司正在为主要 AI 公司收集人类数据，以推动 AI 模型的进步。这家公司采用了一种独特的方法来改进 AI 模型的性能，特别是在专业领域的应用方面。

Turing 的创新之处在于它不仅仅依赖互联网上现有的数据。公司创始人 Siddharth 认为，要让 AI 模型在特定领域变得更智能，需要的是无法在网上找到的数据。为此，Turing 会雇佣数百名各领域的专家，让他们创建「输入输出对」，这些对话类似于内心独白，包含了问题和答案。

这种被称为「多轮数据」的方法，被认为是让 AI 模型学会推理和理解特定概念的关键。例如，一位化学专家可能会就某个分子提出问题，然后给出答案，接着再提出后续问题，如此往复十余次。这种方法不仅涵盖了学术领域，还包括销售等实际应用场景。

Siddharth 相信，这种过程是 AI 模型成为「代理人」的关键，使其能够独立执行复杂的多步骤任务。虽然这个所谓的「代理时代」尚未到来，但 Turing 的方法为 AI 的未来发展指明了一个潜在的方向。

OpenAI 高管出走引发 AGI 进展质疑

根据 Ars Technica 的报道，OpenAI 近期经历了重大人事变动，引发外界对其通用人工智能（AGI）研发进展的质疑。公司总裁兼联合创始人 Greg Brockman 宣布休长假至年底，另一位联合创始人 John Schulman 则永久离职加入竞争对手 Anthropic。

这些变动让人不禁疑惑：如果 OpenAI 真的即将突破 AGI，为何高管纷纷离开？AI 开发者 Benjamin De Kraker 在社交媒体上提出：「如果你确信自己参与的公司即将在一两年内实现 AGI 突破，为什么要跳槽？」

值得注意的是，多位离职高管选择加入 Anthropic。该公司由前 OpenAI 员工创立，其 Claude AI 助手正迅速获得用户青睐。Schulman 表示加入 Anthropic 是为了更专注于 AI 对齐研究和技术工作。

尽管人事动荡，OpenAI 仍坚持 AGI 研发目标。CEO Sam Altman 暗示可能有重大模型即将发布，但外界对 AGI 实现时间表仍存疑。

以上就是今天「AI Insider」的所有内容，作为一档新栏目，我们愿意聆听您的所有建议，欢迎通过评论的方式告诉您的想法。

我们下周再见。

越发拥挤的「200 亿俱乐部」｜AI Insider#232

Poe

☕ Editor’s Note

🔍 焦点：200 亿估值，或成中国大模型创业公司的拐点

🆕 产品

💰 市场

🧗‍♂️公司

Read more

智能的代价，是什么在真正拖慢 AI 产业的脚步？｜AI Insider#309

微软 OpenAI 分手大戏持续、Google 免费工具竞赛、奢侈品 AI 化提速｜AI Picks#008

他为世界造出思维机器，却不想思考机器的未来｜Deep Reading#196

告别千篇一律的 AI 回答，Notebook LM 如何打造你的专属智能助手｜Digital Explorer#066

☕ Editor’s Note

免费获取 AI Insider

🔍 焦点：200 亿估值，或成中国大模型创业公司的拐点

🆕 产品

欢迎加入 Dailyio 会员计划

💰 市场

🧗‍♂️公司

Read more

智能的代价，是什么在真正拖慢 AI 产业的脚步？｜AI Insider#309

微软 OpenAI 分手大戏持续、Google 免费工具竞赛、奢侈品 AI 化提速｜AI Picks#008

他为世界造出思维机器，却不想思考机器的未来｜Deep Reading#196

告别千篇一律的 AI 回答，Notebook LM 如何打造你的专属智能助手｜Digital Explorer#066