Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

  • 爱可可-爱生活
  • 2024-11-29 07:07:11
【Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决】
'An Open Large Reasoning Model for Real-World Solutions'
GitHub: github.com/AIDC-AI/Marco-o1
大语言模型 人工智能 推理模型 问题解决
Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决