Prompt 学习地图 25 | 理论&实践 – CoT 逐步思考和推理

现任谷歌大脑研究员 Jason Wei 在 22 年 1 月发布在 arxiv 上发布了一篇题为《 Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 》的文章,当时 NLP Prompt learning 兴起已开始大约两年时间,OpenAI 彼时刚刚推出 GPT-3 的第二个大版本更新不久,作者在这样的大背景下提出了思维链这个概念。本文经过 6 次修订和迭代,最新的一版(v6)发布于 2023 年 1 月 10 日。

思维链方法是通过中间推理步骤实现复杂的推理能力,它鼓励大语言模型解释自己的推理过程,将大目标拆解成小目标,一步一步思考计算最后得到最终结果。思维链的主要思想是通过向大语言模型展示一些少量的示例,在示例中解释推理过程,大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。

我们可以把它和少样本提示词结合起来,在需要先推理再响应的更复杂的任务中取得更好的效果。这篇论文被视为思维链方法的开山之作,后续又有十几篇论文延展和进化了这一思想。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.
退出移动版