我的大语言模型使用方法论:模型选择、提示优化与工作流设计|Digital Explorer#026
哪些模型最被低估、哪些是最具「弹性」的模型?
Editor’s Note
今天是 2024 年 3 月 26 日,您正在阅读的是第 26 期 Digital Explorer。
本期我们继续聊大模型,如果从 2022 年 12 月算起,我已经和大语言模型打了近一年半的交道,体验过「惊喜」,也感受过「惊吓」,当然还有数不胜数的失望与无奈。本期我会以一位大语言模型重度用户为切入点,总结过去一年多来的经验和教训:
- 如果没有万能模型,用户该怎么办?
- 为什么使用大模型是一件浪费时间的事情?
- 为 API 付费还是付费订阅在线服务?
与此同时,我也会对当下主流大语言模型应用做一些点评和分析,哪些是最被低估的模型、哪些是最具「弹性」的模型;另外,近期由上下文窗口与 RAG 驱动的长文本应用开始爆发,本期也会做一些盘点。
接下来,欢迎和我一切探索关于大模型的所有可能,
大模型·流程
我的大模型使用报告
如果非要为大语言模型影响了哪些人类工作进行排名,内容产业无疑是最应该上榜的职业。特别是对像我这样以文字为生的内容工作者,我对大语言模型的情感,随着 OpenAI、Anthropic 的闭源模型以及一种开源模型的能力变化而不断变化。
春节期间,我将大语言模型完全引入「Dailyio Briefing」的生产过程,并在后续的一篇长文里做了复盘,感兴趣的朋友可以通过这里浏览一番。
如果从 2022 年 12 月算起,我已经和大语言模型打了近一年半的交道,体验过「惊喜」,也感受过「惊吓」,当然还有数不胜数的失望与无奈。本期我会以一名大语言模型重度用户为切入点,总结过去一年多来的经验和教训,同时也会对当下主流大语言模型应用做一些点评和分析。
为了叙述简便,下文里所有「大模型」都是指代以 ChatGPT 为代表的「大语言模型」。
1.没有万能的模型
就像没有万能的(数字)工具一样,即便是再「通用」的大模型,也不是万能的。比如语言层面,绝大多数海外公司的大模型都无法较好处理中文内容,同样,你让通义千问或零一万物去处理英文内容也不会得到太好的结果。