为什么 Meta 与 Google 终将战胜 ChatGPT?|AI Insider#234

科大讯飞的大模型困局。

为什么 Meta 与 Google 终将战胜 ChatGPT?|AI Insider#234

☕ Editor’s Note

🗓️ 2024.8.13 | Issue#234

今天重点关注以下新闻:

  • 消费 AI 赛道,Meta 和 Google 或将超越 ChatGPT;
  • Falcon Mamba 7B 新架构挑战 Transformer 霸主地位;
  • 维基百科与 AI,人类如何和机器协作知识?
  • 科大讯飞的大模型困局;

您可通过这里查看过往 AI Insider 的精选内容,欢迎成为 Dailyio 付费会员获取更多专属内容。


🔍 焦点

消费 AI 赛道,Meta 和 Google 或将超越 ChatGPT

投资人 Apoorv Agrawal 在社交媒体上撰文指出,尽管 ChatGPT 在 AI 领域掀起了巨大波澜,但 Meta 和 Google 等科技巨头在消费者 AI 市场可能更具优势。这一观点主要基于用户参与度和留存率的数据分析。

Agrawal 指出,ChatGPT 的周活跃用户与月活跃用户比率仅为 40%,而顶级消费类应用可达 80-90%,企业应用则在 60-70% 左右。这一差距凸显了 ChatGPT 在保持用户持续活跃方面的不足。更重要的是,高参与度对实现大规模采用至关重要。

img

在用户留存率方面,Meta 和 Google 的应用能保持 90% 以上的惊人数字,而 ChatGPT 虽有潜力但仍有差距。Agrawal 强调,留存率高的应用往往能实现更大规模的采用。这意味着,尽管 ChatGPT 引发了广泛关注,但在实际应用和用户黏性方面,传统科技巨头可能更胜一筹。

img

Agrawal 还指出,改变用户习惯和提高参与度并非易事。高参与度的应用已深度融入日常生活,过去十年的数据显示,即使是成功的应用,在参与度方面的重新评级也很少发生。这对 ChatGPT 等新兴 AI 应用提出了严峻挑战,它们需要在已被其他应用占据的用户时间和注意力中争取一席之地。

img

🆕 产品

苹果推出 ToolSandbox,AI 助手评估迎来新标准

根据 VentureBeat 的报道,苹果公司最近推出了一款名为 ToolSandbox 的创新基准测试工具,旨在全面评估 AI 助手的实际能力。

ToolSandbox 的独特之处在于它包含了三个关键元素:有状态交互、对话能力和动态评估。这使得测试更贴近现实世界的应用场景。研究的主要作者 Jiarui Lu 解释道,该工具能够评估 AI 助手在复杂任务中的表现,如理解系统当前状态并做出适当改变。

有趣的是,研究结果挑战了最近关于开源 AI 迅速赶上专有系统的报告。即使是最先进的 AI 助手在处理涉及状态依赖、规范化和信息不足的复杂任务时也面临挑战。

Hugging Face:AI 工具调用统一标准出炉

根据 Hugging Face 官方博客的报道,多个主流大语言模型家族现已支持统一的工具调用 API。这一重大进展意味着开发者可以使用相同的代码,无需大幅修改就能在 Mistral、Cohere、NousResearch 或 Llama 等模型的对话中调用工具。

新 API 极大简化了工具调用的实现过程。开发者只需定义清晰的函数名称、准确的类型提示和完整的文档字符串,系统就会自动生成 JSON schema 供模型读取。此外,Transformers 库还新增了辅助功能,使工具调用更加便捷。完整的文档和示例也已提供,涵盖了整个工具使用流程。

这一统一标准解决了此前工具调用实现复杂、文档不一致等痛点。它采用了类似聊天模板的方法,通过 Jinja 模板处理模型特定的格式要求。虽然在解析模型输出时仍需少量特定处理,但整体上大大降低了开发难度。随着越来越多顶尖 LLM 支持工具调用,这一标准化 API 将助力开发者更轻松地在项目中集成强大的工具增强功能。

Falcon Mamba 7B 新架构挑战 Transformer 霸主地位

阿布扎比科技创新研究所(TII)推出了一款名为 Falcon Mamba 7B 的全新开源 AI 模型,该模型采用创新的状态空间语言模型(SSLM)架构,在多项基准测试中超越了同类 Transformer 模型,包括 Meta 的 Llama 3 8B 和 Mistral 7B。

Falcon Mamba 7B 的独特之处在于其处理长文本的能力,无需额外内存或计算资源即可处理整本书的内容。在 Arc、TruthfulQA 和 GSM8K 等测试中,它的表现尤为出色。TII 的 Dr. Hakim Hacid 表示,这一突破将为智能系统的探索带来新的视角和动力。

值得注意的是,Falcon Mamba 7B 是 TII Falcon 系列中的第四个开源模型,该系列已累计下载超过 4500 万次,成为阿联酋在全球 AI 领域最成功的项目之一。这一发展不仅展示了 SSLM 架构的潜力,也预示着 AI 技术可能迎来新的发展方向。


👨‍💻应用

维基百科与 AI,知识共享的新挑战与机遇

根据科技新闻网站 Sherwood 的报道,人工智能对维基百科的影响正引发广泛关注。随着大语言模型的兴起,维基百科作为世界最大的人类知识库,已成为 AI 训练的重要数据来源。这一趋势既带来机遇,也带来挑战。

维基媒体基金会高管表示,AI 可能有助于扩大维基百科知识的传播范围,使更多人更快地获取信息。然而,如果用户主要通过 AI 工具而非直接访问维基百科获取信息,可能会影响志愿者的参与度,进而影响内容质量。维基百科高管 Lane Becker 警告说:「我们面临着失去一代志愿者以及他们所贡献的所有知识的风险。」

尽管第三方数据显示维基百科的流量有所下降,但基金会内部数据表明访问量相对稳定,每月页面浏览量保持在 150 亿到 180 亿之间。基金会呼吁 AI 公司负责任地使用维基百科的 API,并通过明确一致的归因来认可人类贡献。

为应对这一趋势,维基百科正积极探索 AI 技术的应用。志愿者们已经在使用各种 AI 和机器学习工具来支持编辑工作,特别是在处理耗时和重复性任务方面。同时,维基媒体基金会推出了付费的企业版服务,以满足高流量商业用户的需求,谷歌成为首个使用该服务的营利性客户。

AI 环保双刃剑:助力解决环境问题,但能耗隐忧凸显

根据 The Conversation 的报道,人工智能(AI)在帮助解决环境问题方面展现出巨大潜力,但其自身的能源消耗问题也引发了担忧。

AI 在多个领域为环保事业做出了贡献。在能源效率方面,AI 驱动的智能电网可以优化用电管理,Google 利用 AI 将数据中心冷却能耗降低了 40%。在城市基础设施方面,AI 技术提高了回收效率,改善了公共交通系统,还能帮助监测和预测空气质量。此外,AI 在可持续农业和环境监测方面也发挥着重要作用。

然而,AI 系统本身的能源消耗问题不容忽视。据国际能源署预测,到 2026 年,数据中心、AI 和加密货币行业的用电量可能会翻倍,达到每年超过 1,000 太瓦时。AI 还间接消耗大量水资源,用于冷却服务器和发电。专家呼吁开发更环保的 AI 系统,并建立标准来准确衡量 AI 对环境的影响。

AI 浪潮席卷好莱坞,机遇与挑战并存

根据 The Hollywood Reporter 的报道,人工智能技术正在好莱坞引发深刻变革,但业界对此反应不一。自 2022 年 ChatGPT 问世以来,AI 已成为影视行业不可忽视的力量。一方面,演员工会和作家工会积极游说立法者,寻求建立保护措施;另一方面,制片厂则对 AI 技术在制作中的应用持开放态度。

SAG-AFTRA 和 WGA 等工会呼吁立法要求 AI 公司在使用版权材料训练模型时必须获得创作者同意。相比之下,代表制片厂的电影协会(MPA)则认为现有法律足以应对,甚至主张放宽 AI 创作作品的版权标准。

尽管面临法律和伦理挑战,AI 工具已开始在编剧和动画制作中发挥作用。然而,业内对此仍存在争议,有人担心 AI 可能影响电影制作的完整性,也有人将其视为创作工具箱中的新成员。随着技术的快速发展,好莱坞如何在创新与保护之间寻求平衡,将是一个持续的挑战。


💰 市场

科大讯飞的大模型困局

作为 AI 领域的资深玩家,科大讯飞今年上半年交出了自 2008 年上市以来首份亏损的半年报,净利润同比暴跌超 600%,由盈转亏 3.8 亿至 4.6 亿元。这一突如其来的亏损,公司将其归因于大模型的巨额投入——超过 6.5 亿元。

科大讯飞的这次重大投资,既是技术前沿的必然选择,也是突破业务瓶颈的迫切需求。公司的语音识别和合成业务已经充分释放,而在其他 AI 领域又缺乏成熟的应用和盈利点。大模型无疑是一个全新的增长引擎,但这项技术的研发成本远超预期。

从财报数据来看,科大讯飞近年来的研发投入呈现加速态势,2022 年达到 38.27 亿元,同比增长 14.36%。然而,比研发费用增长更快的是销售费用,2022 年甚至超过了研发费用。这种「重销售轻研发」的倾向,与其技术驱动的定位存在一定矛盾。

更值得关注的是,如此巨大的投入并未带来相应的回报。2023 年,科大讯飞在教育和智慧城市两大核心业务上的收入均出现下滑,分别下降 8.85% 和 11.52%。这种高投入低产出的状况,引发了市场对公司经营策略的质疑。

科大讯飞的困境,某种程度上也反映了整个大模型行业的现状。技术成熟度不足、场景理解有限、产品同质化严重,这些问题都在制约着大模型的商业化进程。大模型技术是目前也是少数巨头的禁地——资金密集、技术密集,投入巨大而产出极少,行业竞争比其他领域更加激烈,风险极高。

对于科大讯飞而言,虽然在技术上有一定积累,但在大模型的核心要素——数据、算力、算法等方面并未形成突出优势。其 AI 技术原创性不足,往往采取跟随战略,这使得其在未来的行业应用场景变现上还面临诸多挑战。

在这场 AI 技术竞赛中,科大讯飞面临两难困境:不投入就会落后,投入又难以见效。这个困境不仅是科大讯飞的,也是众多 AI 企业的共同挑战。在技术与商业的平衡中,如何找到最佳点,将是决定这些企业命运的关键。


以上就是今天「AI Insider」的所有内容,作为一档新栏目,我们愿意聆听您的所有建议,欢迎通过评论的方式告诉您的想法。

我们明天再见。