大语言模型：APE:Large Language Models Are Human-Level Prompt Engineers概述

CUHK-SZ-relu

已于 2024-03-31 11:51:56 修改

阅读量845

点赞数 5

CC 4.0 BY-SA版权

文章标签：语言模型 prompt 人工智能

于 2024-03-11 16:10:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43210957/article/details/136626002

本文探讨了如何在无需微调的情况下，利用大语言模型自动生成更自然的prompt，针对不同类型的模型提出适应策略，并通过评价指标优化提示。作者强调了通过resample高分指令来进一步提升性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

研究内容

如何通过prompt，在不进行微调大语言模型的前提下，增加大语言模型的表现

研究动机

prompt非常有用，但是人工设置的非常不自然；
因此提出了要自动使用大语言模型自己选择prompt；
取得了很好的效果。

作者主要是提出了三件事：

如何让大语言模型生成prompt

LLM是可以分为两类的，

其中一类GPT是只能从前到后的，他们不支持句子补全（在一段话当中填写空缺位置）；
另一类，则是可以反向的例如T5、GLM、 InsertGPT，这些模型就会支持句子补全。

因此作者为这两类模型分别设置了两种方法，例子如下：
在这里插入图片描述
同时作者指出，也不一定要和这俩完全相同，使用回答评价指标一定可以找到一个更加适合指令instruction生成的prompt这里只是样板(template)。作者给出了在本文实验当中实际采用的prompt：

如何评价这些prompt

就是简单的让其跑一下分

如何进一步优化prompt

可以使用大语言模型进一步resample跑一下选出来的高分指令instruction：

在这里插入图片描述
再在这些指令当做选择更好的指令。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CUHK-SZ-relu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。