跳到主要内容

🟢 “标准”提示

到目前为止,我们已经说过几种不同格式的提示。根据Kojima等人的说法1,我们将仅包含一个问题的提示称为“标准”提示。我们还认为仅包含问答形式为问题的提示也是“标准”提示。

我为什么要在意?

我们引用的许多文章都使用这个术语。我们这么定义它的目的,以便我们可以讨论与标准提示不同的新型提示。

标准提示的两个示例:

标准提示

法国的首都是哪里?

问答形式的标准提示

问:法国的首都是哪里?

答:

Few Shot标准提示

Few shot标准提示2就是只包含示例的标准提示。示例是提示要解决的任务的例子,这些示例包含在提示本身中3。在研究中,Few shot标准提示有时简称为标准提示(尽管我们尝试在本指南中不这样称呼)。

Few Shot标准提示的两个示例:

Few Shot标准提示

西班牙的首都是哪里?
马德里
意大利的首都是哪里?
罗马
法国的首都是哪里?

问答形式的Few Shot标准提示

问:西班牙的首都是哪里?
答:马德里
问:意大利的首都是哪里?
答:罗马
问:法国的首都是哪里?
答:

Few shot提示有助于“few shot”或称为“上下文中”的学习,即在不更新参数的情况下进行学习4


  1. Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large Language Models are Zero-Shot Reasoners.
  2. Liu, P., Yuan, W., Fu, J., Jiang, Z., Hayashi, H., & Neubig, G. (2022). Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing. ACM Computing Surveys. https://doi.org/10.1145/3560815
  3. Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., Neelakantan, A., Shyam, P., Sastry, G., Askell, A., Agarwal, S., Herbert-Voss, A., Krueger, G., Henighan, T., Child, R., Ramesh, A., Ziegler, D. M., Wu, J., Winter, C., … Amodei, D. (2020). Language Models are Few-Shot Learners.
  4. Zhao, T. Z., Wallace, E., Feng, S., Klein, D., & Singh, S. (2021). Calibrate Before Use: Improving Few-Shot Performance of Language Models.