人人都在期待GPT-4,OpenAI却仍在改进GPT-3

  • 麻省理工科技评论
  • 2022-12-05 22:35:49
预训练语言模型 【人人都在期待GPT-4,OpenAI却仍在改进GPT-3】

OpenAI 的大型语言模型 GPT-3 风头正劲,但有关其下一代模型 GPT-4 的小道消息已经悄然出现。不过按照目前的状况来看,OpenAI 可能还没有完成对 GPT-3 的改进。

OpenAI 近日发布了一款名为 ChatGPT 的新模型,它是 GPT-3 的衍生产品,旨在通过对话的方式来回答问题。

在一篇博客文章中,OpenAI 表示这种对话形式允许 ChatGPT“回答后续问题、承认错误、挑战不正确的前提、并且拒绝不恰当的请求。”

面对 GPT-3 的一些问题,ChatGPT 似乎能提供可行的解决方案,但我在尝试时发现,它还远没有解决所有的问题。这表明,即使未来它进化到 GPT-4,似乎也无法解决所有问题。

最棘手的一个问题是:它会胡编乱造。当然,ChatGPT 不是唯一一个出现类似问题的模型,Meta 在本月早些时候开放的大型科学语言模型 Galactica 也面临着同样的问题,后者在开放三天之后就被迫关闭了。

OpenAI 的科学家约翰·舒尔曼(John Schulman)表示他们还有很多事情要做:“我们在这个(胡编乱造的)问题上取得了一些进展,但它还远没有得到解决。”

所有的大型语言模型都会产生毫无意义的内容,而 ChatGPT 的不同之处在于,当它不知道自己在说什么时,它可以大方地承认这一点。“你可以问它:‘你确定吗?’它会回复:‘也许没那么确定。’”OpenAI 的首席技术官米拉·穆拉蒂(Mira Murati)解释称。

而且与此前的大多数语言模型不同,如果用户抛出一个 ChatGPT 没有被训练过的话题,它会拒绝回答。

例如,它不会试图回答“2022 年之后会发生什么事”之类的问题。它也不会回答有关个人的问题。

ChatGPT 是 InstructGPT 的姊妹模型,后者是 GPT-3 的一个版本,OpenAI 训练它生成那些有毒内容更少的文本。

它也类似于 DeepMind 在 9 月份发布的一个名为Sparrow 的模型。所有这三个模型都是根据人类用户的反馈进行训练的。

戳链接查看详情:人人都在期待GPT-4,OpenAI却仍在改进GPT-3
人人都在期待GPT-4,OpenAI却仍在改进GPT-3