混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

  • 爱可可-爱生活
  • 2024-12-05 14:31:35
【混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估,在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。推荐配置80GB显存GPU,支持生成最高720p分辨率视频】

'HunyuanVideo: A Systematic Framework For Large Video Generation Model Training'

GitHub: github.com/Tencent/HunyuanVideo

AI视频生成 深度学习 开源模型 人工智能
混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估,在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。推荐配置80GB显存GPU,支持生成最高720p分辨率视频混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估,在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。推荐配置80GB显存GPU,支持生成最高720p分辨率视频混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示词重写功能。根据专业人员评估,在视觉质量、动作质量和文本对齐度等方面均优于多个主流闭源商业模型。推荐配置80GB显存GPU,支持生成最高720p分辨率视频