混元视频HunyuanVideo：腾讯开发的开源视频生成基础模型，采用统一的图像和视频生成架构，具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

爱可可-爱生活
2024-12-05 14:31:35

【混元视频HunyuanVideo：腾讯开发的开源视频生成基础模型，采用统一的图像和视频生成架构，具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估，在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。推荐配置80GB显存GPU，支持生成最高720p分辨率视频】

'HunyuanVideo: A Systematic Framework For Large Video Generation Model Training'

GitHub: github.com/Tencent/HunyuanVideo

AI视频生成深度学习开源模型人工智能