LLM训练

优化版HF LLaMA训练类：专为大型语言模型（LLM）训练优化的类，集成了多种高效训练技术，如减少精度训练、高效缩放点积注意力（SDPA）、全分片数据并行（FSDP）或零冗余优化器（ZeRO）等，旨

优化版HF LLaMA训练类：专为大型语言模型（LLM）训练优化的类，集成了多种高效训练技术，如减少精度训练、高效缩放点积注意力（SDPA）、全分片数据并行（FSDP）或零冗余优化器（ZeRO）等，旨

【优化版HF LLaMA训练类：专为大型语言模型（LLM）训练优化的类，集成了多种高效训练技术，如减少精度训练、高效缩放点积注意力（SDPA）、全分

2024-08-28 浏览详情

Liger-Kernel：为大型语言模型训练设计的高效 Triton 内核，通过一行代码提升模型性能，降低内存使用，支持更长上下文长度、更大批量大小和庞大词汇量

Liger-Kernel：为大型语言模型训练设计的高效 Triton 内核，通过一行代码提升模型性能，降低内存使用，支持更长上下文长度、更大批量大小和庞大词汇量

【Liger-Kernel：为大型语言模型训练设计的高效 Triton 内核，通过一行代码提升模型性能，降低内存使用，支持更长上下文长度、更大批量大

2024-08-27 浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦！