推理模型

【[214星] DeepSeek R1：介绍了如何从头构建 DeepSeek R1 模型，包括使用 Qwen 作为基础模型，应用 GRPO 算法进行初步训练，以及通过 Sup

【Marco-o1：开源大型推理模型，专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型，集成了Chain-of-Thought微调、蒙特卡洛

【Stable Diffusion 3.5：一款用于简单推理的AI模型，能够快速生成高质量的图像，支持多种文本编码器和核心MM-DiT技术，让图像生成更便捷

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦！