【[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Sup
2025-02-28浏览详情
【Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛
2024-11-29浏览详情
【Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷
2024-10-25浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!