[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Supervised Fine-T

[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Supervised Fine-T

【[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Sup

2025-02-28浏览详情

Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

【Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛

2024-11-29浏览详情

Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷

Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷

【Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷

2024-10-25浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!