《GPT 无法翻译超长内容的提示词优化尝试》...
- 宝玉xp
- 2024-10-12 19:19:08
《GPT 无法翻译超长内容的提示词优化尝试》
最近科技文章翻译 GPT
网页链接 一直有用户反馈内容长了就不翻译,变成摘要了,这是由于内容一长, GPT-4o “变懒”了,于是不翻译完整内容,只是摘要。
其实我一直很困扰这个问题,最早写过插件自动拆分,但是由于 OpenAI 频繁改版网页早已无法使用,最近都是手动拆分,也挺麻烦的。
刚才想到一个主意,也许我可以尝试让 GPT 自己分页,每次输出其中一页,但是打印出来页码,这样我可以只要输出 continue 就可以,不需要手动去拆分。
初步测试了一下看来是可行的。一篇很长的文章 网页链接 (感谢小互 @互联网的那点事 提供的测试案例 )也可以在 6 次 continue 后完成。
分页的核心原理是few shot,分别给了两个例子,对于不超长和超长应该如何输出
另外最开始在xml中page的属性中是让打印一共多少页,但是 GPT 数学不好,有一次测试输出了20页,其实完全没必要,所以改成 more 来标志还有没有多余的内容,这样会尽可能一次多翻译一点。
另外文本过长还是不行的,无法超出模型的上下文范围。
完整提示词发布在博客上了:
网页链接
最近科技文章翻译 GPT

其实我一直很困扰这个问题,最早写过插件自动拆分,但是由于 OpenAI 频繁改版网页早已无法使用,最近都是手动拆分,也挺麻烦的。
刚才想到一个主意,也许我可以尝试让 GPT 自己分页,每次输出其中一页,但是打印出来页码,这样我可以只要输出 continue 就可以,不需要手动去拆分。
初步测试了一下看来是可行的。一篇很长的文章 网页链接 (感谢小互 @互联网的那点事 提供的测试案例 )也可以在 6 次 continue 后完成。
分页的核心原理是few shot,分别给了两个例子,对于不超长和超长应该如何输出
另外最开始在xml中page的属性中是让打印一共多少页,但是 GPT 数学不好,有一次测试输出了20页,其实完全没必要,所以改成 more 来标志还有没有多余的内容,这样会尽可能一次多翻译一点。
另外文本过长还是不行的,无法超出模型的上下文范围。
完整提示词发布在博客上了:
