优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分片数据并行(FSDP)或零冗余优化器(ZeRO)等,旨
- 爱可可-爱生活
- 2024-08-28 05:28:46
【优化版HF LLaMA训练类:专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,如减少精度训练、高效缩放点积注意力(SDPA)、全分片数据并行(FSDP)或零冗余优化器(ZeRO)等,旨在提升训练效率和内存使用效率】'optimized_hf_llama_class_for_training - This project provides monkey patched llama class for the appetizer of LLMs with larger vocab and long context inputs.' GitHub: github.com/SeunghyunSEO/optimized_hf_llama_class_for_training LLM训练 深度学习优化 AI研究