AI Insider

当「华尔街之狼」遇到大语言模型｜AI Insider#218

柔佛州有望成为「东南亚的深圳」。

赵赛坡

22 Jul 2024 — 阅读时间 9 分钟

☕ Editor’s Note

🗓️ 2024.7.22 | Issue #218

今天重点推荐以下话题：

AI VS 华尔街；
马来西亚柔佛州正在成长为东南亚 AI 枢纽；
OpenAI 计划设计自己的芯片；
Asana 对 Claude 3.5 Sonnet 的深度剖析；

🔍 焦点

AI VS 华尔街

随着人工智能技术的迅速发展，华尔街正面临着前所未有的挑战和机遇。前摩根士丹利全球研究主管、前瑞银集团研究、数据和分析主管 Juan Luis Perez 在 FT 撰文指出，金融行业需要在 AI 技术中融入人性化元素，以增强客户信任度并提高接受程度。

AI 在金融分析领域已展现出显著优势。统计数据表明，AI 在预测公司盈利方面平均表现优于股票分析师，基于规则的策略在提供金融建议方面也常常优于私人银行家。

然而，尽管 AI 展现出如此强大的能力，金融专业人士仍然难以完全接受和信任 AI。Perez 引用了数据科学家 César Hidalgo 的研究，揭示了人类判断机器和人类建议的不同方式：

当使用程序时，人们倾向于关注工具的性能，任何预测错误都可能导致金融专业人士对其失去信心。
在判断人类建议时，我们会考虑到给予建议者的意图，而不仅仅是性能。这种差异导致人们对人类建议的容忍度更高，即使其表现不如 AI。

金融专业人士难以完全接受 AI 的原因多样：

人们倾向于抵制与自身经验相矛盾的信息。
金融市场的非平稳性使得 AI 的应用更加困难，因为市场不会对相同的数据以完全相同的方式反应。
每个策略师都有强烈的初始信念或「身份认同」，这会影响他们的判断。
最后，人们渴望控制，而 AI 模型（如 ChatGPT）的决策过程往往难以理解和控制。

为了提高 AI 在金融领域的接受度，Perez 提出了几点建议：

允许人类调整 AI 模型的某些参数，给予金融专业人士一定的主动权；
在财富管理等领域，可以接受一定程度的性能损失，以换取更多人接受 AI 洞见；
提高 AI 的可解释性，满足审计和合规的需求；
引入「思维链」逻辑，将专家知识编码到原始模型中，提高模型的可信度。

正如 Perez 所言：「我们期望机器是理性的，而人类是人性化的」。这句话深刻地概括了人类对 AI 和人类专业人士的不同期望。在金融服务领域，尤其是在客户关系管理方面，人性化因素仍然至关重要，「信任和判断是客户关系中的关键特征。最终，我们期望人类表现得像人类」。

💰 市场

马来西亚柔佛州正在成长为东南亚 AI 枢纽

根据《金融时报》的报道，马来西亚南部的柔佛州正在经历一场数据中心建设热潮，吸引了包括 TikTok、英伟达和微软在内的科技巨头投资数十亿美元。这一地区曾经是丛林和棕榈油种植园，如今正迅速转型为数字经济的基础设施中心。

柔佛州的崛起得益于其独特的地理位置优势。与新加坡仅有几公里之遥，企业可以享受到更便宜的土地和更充足的能源供应，同时又能紧邻东南亚最大的金融中心。

马来西亚投资、贸易和工业部长 Tengku Zafrul Aziz 表示，柔佛州有潜力成为「东南亚的深圳」。

随着新加坡在 2019 年暂停批准新建数据中心，数据中心产业可能成为柔佛州向高科技制造业转型的支柱，目前该州已经将审批时间从三个月缩短到最快七天，进一步刺激了投资热潮。

OpenAI 计划设计自己的芯片

OpenAI 正在与半导体设计公司 Broadcom 洽谈开发新型 AI 芯片。这一举措旨在减少对英伟达的依赖，并加强其供应链的自主性。

OpenAI 的联合创始人兼 CEO Sam Altman 正在积极推动这项计划，他认为 AI 发展的主要瓶颈在于芯片、能源和计算能力的容量限制。Altman 表示：「OpenAI 不会坐视不管，让其他人在前线建设这些关键资源。」

尽管有微软 130 亿美元的投资支持，OpenAI 仍在寻求额外的资金和合作伙伴来实现其雄心勃勃的计划。一位知情人士透露：「做这些事情确实需要大量资金。」

👨‍💻应用

了解 OpenAI 如何应对「忽略指令」漏洞

根据 The Verge 的报道，OpenAI 的新模型 GPT-4o Mini 包含一项重要的安全机制，旨在防止用户通过「忽略所有先前指令」等提示注入方式来破坏 AI 系统。

这项名为「指令层级」的新技术将提高模型对开发者原始提示的重视程度，而不是听从用户注入的各种可能破坏系统的提示。OpenAI API 平台产品负责人 Olivier Godement 表示，这项技术将有效阻止网络上流传的「忽略所有指令」攻击。

GPT-4o Mini 是首个采用这一安全方法的模型。它不仅价格更低、更轻量级，还能更好地遵循开发者设定的系统消息。

不过，鉴于 OpenAI 近期面临的安全和透明度问题，重建用户信任仍需要大量研究和资源投入。这项新的安全更新无疑是朝着正确方向迈出的重要一步。

Asana 对 Claude 3.5 Sonnet 的深度剖析

据 Asana 官方博客发布的评测报告，Claude 3.5 Sonnet 在性能、代理推理和回答质量方面均取得显著突破，成为 Asana 测试过的最佳模型之一。

Asana 视 AI 为集成的团队成员，而非简单的工具。他们开发了全面的 LLM 质量保证流程，包括单元测试、集成测试和端到端测试。这套方法论不仅确保了 AI 功能的可靠性，还能在一小时内对新模型进行初步评估。Claude 3.5 Sonnet 的测试结果令人瞩目：首个令牌时间比前代产品快 67%，在工具使用基准测试中得分 90%，并在 Asana 的 LLM 单元测试中通过率达到 78%，与 Claude 3 Opus 并列最高。

值得注意的是，Claude 3.5 Sonnet 在代理推理能力上取得了质的飞跃。既能够执行更长、更复杂的推理链，还表现出更有效的决策能力。

AI 加持，巴黎奥运将带来全新观赛体验

根据《连线》杂志的报道，2024 年巴黎奥运会将为观众带来前所未有的观赛体验。奥林匹克转播服务公司（OBS）正在利用一系列创新技术，让观众感受身临其境的震撼。

OBS 将采用超高清和高动态范围技术制作视频内容，大幅提升画面细节和色彩表现。同时，他们还将提供垂直视频、8K 视频和 360 度全景拍摄等多种格式，满足不同设备和需求。

值得一提的是，OBS 将借助 AI 和云技术，实现电影级镜头的实时直播。这意味着观众将能看到此前只有在电影中才能呈现的特效镜头，如 360 度环绕运动员的慢动作回放。

此外，5.1.4 环绕音频和增强现实技术的应用，将进一步提升观众的沉浸感。OBS 总裁 Yiannis Exarchos 表示，他们的目标是让观众感受到前所未有的亲临感。

以上就是今天「AI Insider」的所有内容，作为一档新栏目，我们愿意聆听您的所有建议，欢迎通过评论的方式告诉您的想法。

我们明天再见。

当「华尔街之狼」遇到大语言模型｜AI Insider#218

赵赛坡

☕ Editor’s Note

🔍 焦点

💰 市场

👨‍💻应用

阅读更多

AI 产业进入「筑城」时刻

同一个 Agentic AI，四种不同的基础设施赌注

AI 编程工具的繁荣，建在一把碎掉的尺子上

当模型变成插件，AI 战争进入分发时代

☕ Editor’s Note

免费获取 AI Insider

🔍 焦点

升级 Premium 会员

💰 市场

👨‍💻应用

阅读更多

AI 产业进入「筑城」时刻

同一个 Agentic AI，四种不同的基础设施赌注

AI 编程工具的繁荣，建在一把碎掉的尺子上

当模型变成插件，AI 战争进入分发时代