告诉大模型“深呼吸”能大幅提升数学得分
2023-9-20 21:56:26 Author: www.solidot.org(查看原文) 阅读量:14 收藏

  • 文章
  • 皮肤

人工智能

Wilson (42865)发表于 2023年09月20日 21时56分 星期三
来自飞行中的阴影

Google DeepMind 的研究人员在预印本平台 arXiv 发表论文《Large Language Models as Optimizers》,介绍了大模型的一种优化方法:用一个大模型修饰提示,改进另一个大模型的数学能力。初步结果显示,使用“深呼吸,一步步解决问题”的提示效果最为显著,能大幅提升数学测试得分。对 Google 的 PaLM 2 大模型使用该提示,它在小学数学应用题数据集 GSM8K 中的正确率达到了 80.2%,而不使用该提示正确率只有 34%,“让我们一步步思考”提示的正确率为 71.8%。为什么会有如此惊人的变化?大模型显然不会呼吸,也不像人类那样思考和推理。它们所做的推理都源自从书籍和互联网上抓取的短语数据集。其中包括问答形式的论坛,此类论坛包含了大量“深呼吸”,“一步步思考”等短语,后面紧跟着更细致入微的推理方案。这些短语可能有助于大模型产生更好的答案。

https://arstechnica.com/?p=1969012
https://arxiv.org/pdf/2309.03409.pdf




文章来源: https://www.solidot.org/story?sid=76142
如有侵权请联系:admin#unsafe.sh