【优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分
2024-08-28浏览详情
【Liger-Kernel:为大型语言模型训练设计的高效 Triton 内核,通过一行代码提升模型性能,降低内存使用,支持更长上下文长度、更大批量大
2024-08-27浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!