Raspberry：为微调具有推理能力的LLM创建开源玩具数据集，其特色在于通过合成复杂用户查询和自我批评数据来提升模型的推理能力

爱可可-爱生活
2024-09-19 11:08:21

【Raspberry：为微调具有推理能力的LLM创建开源玩具数据集，其特色在于通过合成复杂用户查询和自我批评数据来提升模型的推理能力】'Create an open source toy dataset for finetuning LLMs with reasoning abilities' GitHub: github.com/daveshap/Raspberry 开源数据集 LLM微调推理能力机器学习