Digital Explorer

我的大语言模型使用方法论：模型选择、提示优化与工作流设计｜Digital Explorer#026

哪些模型最被低估、哪些是最具「弹性」的模型？

Editor’s Note

今天是 2024 年 3 月 26 日，您正在阅读的是第 26 期 Digital Explorer。

本期我们继续聊大模型，如果从 2022 年 12 月算起，我已经和大语言模型打了近一年半的交道，体验过「惊喜」，也感受过「惊吓」，当然还有数不胜数的失望与无奈。本期我会以一位大语言模型重度用户为切入点，总结过去一年多来的经验和教训：

与此同时，我也会对当下主流大语言模型应用做一些点评和分析，哪些是最被低估的模型、哪些是最具「弹性」的模型；另外，近期由上下文窗口与 RAG 驱动的长文本应用开始爆发，本期也会做一些盘点。

接下来，欢迎和我一切探索关于大模型的所有可能，

如果非要为大语言模型影响了哪些人类工作进行排名，内容产业无疑是最应该上榜的职业。特别是对像我这样以文字为生的内容工作者，我对大语言模型的情感，随着 OpenAI、Anthropic 的闭源模型以及一种开源模型的能力变化而不断变化。

春节期间，我将大语言模型完全引入「Dailyio Briefing」的生产过程，并在后续的一篇长文里做了复盘，感兴趣的朋友可以通过这里浏览一番。

如果从 2022 年 12 月算起，我已经和大语言模型打了近一年半的交道，体验过「惊喜」，也感受过「惊吓」，当然还有数不胜数的失望与无奈。本期我会以一名大语言模型重度用户为切入点，总结过去一年多来的经验和教训，同时也会对当下主流大语言模型应用做一些点评和分析。

为了叙述简便，下文里所有「大模型」都是指代以 ChatGPT 为代表的「大语言模型」。

1.没有万能的模型

就像没有万能的（数字）工具一样，即便是再「通用」的大模型，也不是万能的。比如语言层面，绝大多数海外公司的大模型都无法较好处理中文内容，同样，你让通义千问或零一万物去处理英文内容也不会得到太好的结果。