最具性价比模型、最强开源小模型与最好翻译模型|AI Insider#217

芯片供应紧张有望到 2026 年缓解。

最具性价比模型、最强开源小模型与最好翻译模型|AI Insider#217

☕ Editor’s Note

🗓️ 2024.7.19 | Issue #217

今天重点推荐以下话题:

  • 新模型:主打性价比的GPT-4o mini ;
  • 新模型:开源模型 Mistral-NeMo;
  • 新模型:最好翻译模型 DeepL;
  • 台积电财报超预期,上调全年预期;
  • 微软欧洲的云计算垄断风险暂时解除;

🔍 焦点

OpenAI 推出 GPT-4o mini

根据 CNBC 的报道,OpenAI 于周四宣布推出新的 AI 模型「GPT-4o mini」。OpenAI 称这是「当今最强大和最具成本效益的小型模型」,未来还计划整合图像、视频和音频功能。

GPT-4o mini 是 OpenAI 最快速、最强大的模型 GPT-4o 的分支版本。该公司表示,这一微型 AI 模型是其推进「多模态」能力的一部分,即在一个工具中提供各种类型的 AI 生成媒体,如文本、图像、音频和视频。

这款新模型将于周四向 ChatGPT 的免费用户、ChatGPT Plus 和 Team 订阅用户开放,下周还将向 ChatGPT Enterprise 用户开放。作为估值超过 800 亿美元的 AI 巨头,OpenAI 正努力在保持生成式 AI 市场领先地位的同时,寻找盈利途径。

结合 Simon Willison 的分析GPT-4o mini 模型最大的特点就是性价比

GPT-4o mini 支持 128,000 个输入标记(包括图像和文本)和 16,000 个输出标记。其性能超越了 Claude 3 Haiku 和 Gemini 1.5 Flash,成为目前性价比最高的模型之一。

价格方面,GPT-4o mini 的成本比 GPT-3.5 低 60%,每百万输入标记仅需 15 美分,每百万输出标记 60 美分。这一价格甚至比 Claude 3 Haiku 和 Gemini 1.5 Flash 更具竞争力。与 GPT-4o 相比,mini 版本的输入成本低 33 倍,输出成本低 25 倍。

此外,GPT-4o mini 还首次应用了指令层次方法,有望提高模型抵抗越狱、提示注入和系统提示提取的能力。尽管可能无法完全解决提示注入的安全隐患,但这一改进仍然意义重大。


🆕 产品

Mistral 联合英伟达发布 Mistral-NeMo 开源模型

根据 Mistral AI 公司的官方发布,全新的大型语言模型 Mistral NeMo 正式亮相。这个 12B 参数的模型不仅在推理、知识储备和编码准确性方面达到了同类最佳水平,还具备高 128k 的上下文窗口。

Mistral 表示,NeMo 模型是与英伟达合作开发的成果,采用 Apache 2.0 许可证发布。该模型在多语言处理方面表现不俗,尤其擅长英语、法语、德语等 11 种主要语言。

值得一提的是,Mistral NeMo 采用了名为 Tekken 的新型分词器,相较于之前的 SentencePiece,它在压缩源代码和多种语言文本方面效率提升显著。

此次发布的 Mistral NeMo 不仅包含预训练基础模型,还提供了经过指令微调的版本。与 Mistral 7B 相比,新模型在遵循精确指令、推理能力、多轮对话处理以及代码生成等方面都有明显提升。

VentureBeat 援引英伟达应用深度学习研究副总裁 Bryan Catanzaro 的话称,该模型更强调易用性和效率。与需要大量云资源的大型模型不同,Mistral-NeMo 专注于更紧凑但功能强大的设计,旨在解决数据隐私、延迟和成本等企业关切

DeepL 推出最强商用翻译模型

根据 SiliconANGLE 的报道,AI 翻译软件公司 DeepL 近日发布了其最新一代的翻译大语言模型。这款专为商业用户设计的模型在多项测试中表现出色,显著超越了包括 Google Translate 和 ChatGPT 在内的竞争对手。

DeepL 表示,新模型通过数千名精选语言专家的「指导」,大幅提高了翻译准确性,同时降低了幻觉和错误信息的风险。在英日、英中、日中等语言对的翻译中,新模型较上一代提升了 1.7 倍的准确度。专业语言学家在盲测中也表现出对 DeepL 的明显偏好,相较于 Google Translate 和 ChatGPT-4 分别高出 1.3 倍和 1.7 倍。

目前,这一新模型已向 DeepL Pro 用户开放英、德、日、简体中文的翻译服务,更多语言支持也将陆续推出。


💰 市场

台积电二季度业绩超预期,供不应求或持续至 2025 年

根据 CNBC 的报道,台积电(TSMC)公布了令人瞩目的 2024 年第二季度财报,营收和利润均超出市场预期,凸显人工智能芯片需求持续高涨的趋势。

台积电第二季度营收达 6735.1 亿新台币(约 208.2 亿美元),同比增长 40.1%;净利润为 2478.5 亿新台币,同比增长 36.3%。公司董事长兼 CEO 魏哲家表示,业绩增长主要得益于 3 纳米和 5 纳米先进制程技术的强劲需求。

值得注意的是,魏哲家警告称芯片供应紧张可能持续到 2025 年,直到 2026 年才有望缓解。

公司预计 2024 年将是「强劲增长年」,第三季度营收有望达到 224 亿至 232 亿美元,同时将资本支出预算上调至 300–320 亿美元。面对 AI 芯片需求激增,台积电正考虑将更多 N5 产能转为 N3 产能,以满足 3 纳米芯片的强劲需求。

AI 创业公司 Cohere 与富士通达成战略合作

加拿大 AI 初创公司 Cohere 与日本科技巨头富士通达成战略合作,共同开发名为 「Takane」(意为「山峰」)的日语大语言模型。

具体来看,富士通对 Cohere 进行了「重大投资」,双方将携手开发具有日语能力的大语言模型(LLM)和解决方案。「Takane」将基于 Cohere 的 Command R+ 模型打造,旨在为日本企业提供高效的 AI 工具。

值得注意的是,富士通将成为这些日语 AI 模型和服务的独家提供商,公司计划于 2024 年 9 月通过其 Kozuchi 云平台向企业客户推出 「Takane」。

荷兰芯片初创公司 Nearfield Instruments 获 1.35 亿欧元融资

根据 Nearfield Instruments 的官方声明,这家荷兰芯片设备制造商日前宣布完成 1.35 亿欧元(约合 1.48 亿美元)的 C 轮融资。本轮融资由美国风投公司 Walden Catalyst Management 和新加坡主权财富基金淡马锡(Temasek)领投。

这家成立于 2016 年的鹿特丹公司专注于计量和检测解决方案,目前拥有 170 名员工。为了服务三星电子等客户,公司还在韩国设立了办事处。

Nearfield Instruments 联合创始人兼首席执行官 Hamed Sadeghian 在接受采访时表示,公司有望从 AI 驱动的半导体行业需求增长中受益。他预计公司「将在 2026 年前成为独角兽企业」。


👮‍♂️ 监管

微软与法国云计算公司 OVHcloud 达成反垄断和解

根据 Politico 的报道,微软与欧洲云服务提供商 OVHcloud 签署了一项反垄断和解协议,成功避免了欧盟的反垄断调查。这项协议结束了持续两年的纷争。

微软此举表明其正在积极应对来自欧洲监管机构和竞争对手的压力。和解协议的细节尚未完全公开,但预计将包括微软在云服务定价和捆绑销售等方面做出让步。

这一发展对欧洲云计算市场可能产生深远影响。它不仅缓解了微软面临的监管压力,还可能为其他科技巨头与欧洲本土云服务提供商之间的合作开创先例。

而根据彭博社的报道,Google 此前试图以 5 亿美元的交易阻止欧洲云基础设施服务提供商协会 (CISPE) 与微软达成反垄断和解,但最终未能成功。

据悉,Google 向 CISPE 提出的方案包括价值近 5 亿美元、为期 5 年以上的软件许可证,以及约 1500 万美元的现金。这个提议的时机很微妙,据报道是在 CISPE 与微软达成和解的「几天前」提出的。然而,CISPE 最终还是选择了与微软达成协议。

值得注意的是,CISPE 与微软达成的协议要求该组织撤回对微软的反垄断投诉。尽管具体条款未公开,但据路透社报道,微软将支付约 2200 万美元的「一次性」费用,以支付 CISPE 三年的法律费用。

这一系列事件不仅反映了大型科技公司在云计算市场的激烈竞争,也凸显了它们如何利用监管环境来获取竞争优势。

Meta 暂停巴西 AI 工具,隐私政策引争议

根据路透社的报道,Meta 宣布暂停在巴西使用生成式人工智能工具,以回应该国政府对其新隐私政策的质疑。这一决定凸显了 AI 发展与数据保护之间的紧张关系。

Meta 此举源于巴西国家数据保护局(ANPD)本月初的裁决,要求公司调整隐私政策,删除涉及个人数据用于 AI 训练的相关条款。作为拥有超过 2 亿人口的重要市场,巴西是 Meta 旗下 WhatsApp 的第二大用户群。

Meta 表示,将在与 ANPD 就生成式 AI 问题进行沟通期间暂停相关工具。这一事件反映了科技公司在 AI 创新与用户隐私保护之间寻求平衡的挑战,也为全球其他国家如何监管 AI 发展提供了借鉴。


以上就是今天「AI Insider」的所有内容,作为一档新栏目,我们愿意聆听您的所有建议,欢迎通过评论的方式告诉您的想法。

我们下周再见。