一文看懂Deepseek R2大模型最新爆...

  • 骑牛姐姐
  • 2025-05-04 02:37:21
一文看懂Deepseek R2大模型最新爆料核心亮点:
1.模型升级,新版本参数量将达到1200B,相比R1的761B,接近翻倍,性能显著提升。
2.采用MoE混合专家架构,模型根据不同的任务选择,把一个任务分配给多个小专家模型,这种模型的优势既提高效率,又减少资源浪费。
3.硬件国产化,R2版本将彻底摆脱英伟达,GPU采用昇腾910B芯片,昇腾910B在FP16精度下峰值算力达到376TFLOPS,在模型训练中,训练效率超越英伟达A100。
4.多模态视觉能力更强,图像识别准确率R2版本达到了92.4%,超过GPT—4的图像识别能力。
5.更低的成本,输入成本降低到0.07美元/百万次,输出成本0.27美元/百万次。
一文看懂Deepseek R2大模型最新爆...