当「华尔街之狼」遇到大语言模型|AI Insider#218

柔佛州有望成为「东南亚的深圳」。

当「华尔街之狼」遇到大语言模型|AI Insider#218

☕ Editor’s Note

🗓️ 2024.7.22 | Issue #218

今天重点推荐以下话题:

  • AI VS 华尔街;
  • 马来西亚柔佛州正在成长为东南亚 AI 枢纽;
  • OpenAI 计划设计自己的芯片;
  • Asana 对 Claude 3.5 Sonnet 的深度剖析;

🔍 焦点

AI VS 华尔街

随着人工智能技术的迅速发展,华尔街正面临着前所未有的挑战和机遇。前摩根士丹利全球研究主管、前瑞银集团研究、数据和分析主管 Juan Luis Perez 在 FT 撰文指出,金融行业需要在 AI 技术中融入人性化元素,以增强客户信任度并提高接受程度

AI 在金融分析领域已展现出显著优势。统计数据表明,AI 在预测公司盈利方面平均表现优于股票分析师,基于规则的策略在提供金融建议方面也常常优于私人银行家。

然而,尽管 AI 展现出如此强大的能力,金融专业人士仍然难以完全接受和信任 AI。Perez 引用了数据科学家 César Hidalgo 的研究,揭示了人类判断机器和人类建议的不同方式:

  • 当使用程序时,人们倾向于关注工具的性能,任何预测错误都可能导致金融专业人士对其失去信心。
  • 在判断人类建议时,我们会考虑到给予建议者的意图,而不仅仅是性能。这种差异导致人们对人类建议的容忍度更高,即使其表现不如 AI。

金融专业人士难以完全接受 AI 的原因多样:

  • 人们倾向于抵制与自身经验相矛盾的信息。
  • 金融市场的非平稳性使得 AI 的应用更加困难,因为市场不会对相同的数据以完全相同的方式反应。
  • 每个策略师都有强烈的初始信念或「身份认同」,这会影响他们的判断。
  • 最后,人们渴望控制,而 AI 模型(如 ChatGPT)的决策过程往往难以理解和控制。

为了提高 AI 在金融领域的接受度,Perez 提出了几点建议:

  • 允许人类调整 AI 模型的某些参数,给予金融专业人士一定的主动权;
  • 在财富管理等领域,可以接受一定程度的性能损失,以换取更多人接受 AI 洞见;
  • 提高 AI 的可解释性,满足审计和合规的需求;
  • 引入「思维链」逻辑,将专家知识编码到原始模型中,提高模型的可信度。

正如 Perez 所言:「我们期望机器是理性的,而人类是人性化的」。这句话深刻地概括了人类对 AI 和人类专业人士的不同期望。在金融服务领域,尤其是在客户关系管理方面,人性化因素仍然至关重要,「信任和判断是客户关系中的关键特征。最终,我们期望人类表现得像人类」。


💰 市场

马来西亚柔佛州正在成长为东南亚 AI 枢纽

根据《金融时报》的报道,马来西亚南部的柔佛州正在经历一场数据中心建设热潮,吸引了包括 TikTok、英伟达和微软在内的科技巨头投资数十亿美元。这一地区曾经是丛林和棕榈油种植园,如今正迅速转型为数字经济的基础设施中心。

柔佛州的崛起得益于其独特的地理位置优势。与新加坡仅有几公里之遥,企业可以享受到更便宜的土地和更充足的能源供应,同时又能紧邻东南亚最大的金融中心。

马来西亚投资、贸易和工业部长 Tengku Zafrul Aziz 表示,柔佛州有潜力成为「东南亚的深圳」

随着新加坡在 2019 年暂停批准新建数据中心,数据中心产业可能成为柔佛州向高科技制造业转型的支柱,目前该州已经将审批时间从三个月缩短到最快七天,进一步刺激了投资热潮。

OpenAI 计划设计自己的芯片

OpenAI 正在与半导体设计公司 Broadcom 洽谈开发新型 AI 芯片。这一举措旨在减少对英伟达的依赖,并加强其供应链的自主性。

OpenAI 的联合创始人兼 CEO Sam Altman 正在积极推动这项计划,他认为 AI 发展的主要瓶颈在于芯片、能源和计算能力的容量限制。Altman 表示:「OpenAI 不会坐视不管,让其他人在前线建设这些关键资源。」

尽管有微软 130 亿美元的投资支持,OpenAI 仍在寻求额外的资金和合作伙伴来实现其雄心勃勃的计划。一位知情人士透露:「做这些事情确实需要大量资金。」


👨‍💻应用

了解 OpenAI 如何应对「忽略指令」漏洞

根据 The Verge 的报道,OpenAI 的新模型 GPT-4o Mini 包含一项重要的安全机制,旨在防止用户通过「忽略所有先前指令」等提示注入方式来破坏 AI 系统。

这项名为「指令层级」的新技术将提高模型对开发者原始提示的重视程度,而不是听从用户注入的各种可能破坏系统的提示。OpenAI API 平台产品负责人 Olivier Godement 表示,这项技术将有效阻止网络上流传的「忽略所有指令」攻击。

GPT-4o Mini 是首个采用这一安全方法的模型。它不仅价格更低、更轻量级,还能更好地遵循开发者设定的系统消息。

不过,鉴于 OpenAI 近期面临的安全和透明度问题,重建用户信任仍需要大量研究和资源投入。这项新的安全更新无疑是朝着正确方向迈出的重要一步。

Asana 对 Claude 3.5 Sonnet 的深度剖析

据 Asana 官方博客发布的评测报告,Claude 3.5 Sonnet 在性能、代理推理和回答质量方面均取得显著突破,成为 Asana 测试过的最佳模型之一。

Asana 视 AI 为集成的团队成员,而非简单的工具。他们开发了全面的 LLM 质量保证流程,包括单元测试、集成测试和端到端测试。这套方法论不仅确保了 AI 功能的可靠性,还能在一小时内对新模型进行初步评估。Claude 3.5 Sonnet 的测试结果令人瞩目:首个令牌时间比前代产品快 67%,在工具使用基准测试中得分 90%,并在 Asana 的 LLM 单元测试中通过率达到 78%,与 Claude 3 Opus 并列最高。

值得注意的是,Claude 3.5 Sonnet 在代理推理能力上取得了质的飞跃。既能够执行更长、更复杂的推理链,还表现出更有效的决策能力。

AI 加持,巴黎奥运将带来全新观赛体验

根据《连线》杂志的报道,2024 年巴黎奥运会将为观众带来前所未有的观赛体验。奥林匹克转播服务公司(OBS)正在利用一系列创新技术,让观众感受身临其境的震撼。

OBS 将采用超高清和高动态范围技术制作视频内容,大幅提升画面细节和色彩表现。同时,他们还将提供垂直视频、8K 视频和 360 度全景拍摄等多种格式,满足不同设备和需求。

值得一提的是,OBS 将借助 AI 和云技术,实现电影级镜头的实时直播。这意味着观众将能看到此前只有在电影中才能呈现的特效镜头,如 360 度环绕运动员的慢动作回放。

此外,5.1.4 环绕音频和增强现实技术的应用,将进一步提升观众的沉浸感。OBS 总裁 Yiannis Exarchos 表示,他们的目标是让观众感受到前所未有的亲临感。


以上就是今天「AI Insider」的所有内容,作为一档新栏目,我们愿意聆听您的所有建议,欢迎通过评论的方式告诉您的想法。

我们明天再见。