优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分片数据并行(FSDP)或零冗余优化器(ZeRO)等,旨

优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分片数据并行(FSDP)或零冗余优化器(ZeRO)等,旨

【优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分

2024-08-28浏览详情

Liger-Kernel:为大型语言模型训练设计的高效 Triton 内核,通过一行代码提升模型性能,降低内存使用,支持更长上下文长度、更大批量大小和庞大词汇量

Liger-Kernel:为大型语言模型训练设计的高效 Triton 内核,通过一行代码提升模型性能,降低内存使用,支持更长上下文长度、更大批量大小和庞大词汇量

【Liger-Kernel:为大型语言模型训练设计的高效 Triton 内核,通过一行代码提升模型性能,降低内存使用,支持更长上下文长度、更大批量大

2024-08-27浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!