“我们表明，任何人都可以使用一个...

蚁工厂
2023-03-26 17:01:36

“我们表明，任何人都可以使用一个过时的现成开源大型语言模型 (LLM)，并通过在一台机器上使用高质量的训练数据在 30 分钟内对其进行训练，从而赋予它神奇的类似 ChatGPT 的指令遵循能力。令人惊讶的是，指令遵循似乎不需要最新或最大的模型：我们的模型只有 60 亿个参数，而 GPT-3 有 1750 亿个参数。我们开源了模型 (Dolly) 的代码，并展示了如何在 Databricks 上重新创建它。”
网页链接
图为训练前后的效果对比。