“我们表明,任何人都可以使用一个...

  • 蚁工厂
  • 2023-03-26 17:01:36
“我们表明,任何人都可以使用一个过时的现成开源大型语言模型 (LLM),并通过在一台机器上使用高质量的训练数据在 30 分钟内对其进行训练,从而赋予它神奇的类似 ChatGPT 的指令遵循能力。令人惊讶的是,指令遵循似乎不需要最新或最大的模型:我们的模型只有 60 亿个参数,而 GPT-3 有 1750 亿个参数。我们开源了模型 (Dolly) 的代码,并展示了如何在 Databricks 上重新创建它。”
网页链接
图为训练前后的效果对比。
“我们表明,任何人都可以使用一个...“我们表明,任何人都可以使用一个...