#这个AI爆火!输入1句话,生成1段视频!#

  • AMiner学术头条
  • 2022-06-10 14:50:04
这个AI爆火!输入1句话,生成1段视频!】清华&智源研究院提出CogVideo:最大的文本生成视频模型
CogVideo应该是当前最大的、也是首个开源的文本生成视频模型。
在设计模型上,模型一共有90亿参数,基于预训练文本-图像模型CogView2打造,一共分为两个模块。
第一部分先基于CogView2,通过文本生成几帧图像,这时候合成视频的帧率还很低;
第二部分则会基于双向注意力模型对生成的几帧图像进行插帧,来生成帧率更高的完整视频。
……

论文:CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers
论文及代码:人工智能 科技
AMiner官网:网页链接
#这个AI爆火!输入1句话,生成1段视频!##这个AI爆火!输入1句话,生成1段视频!##这个AI爆火!输入1句话,生成1段视频!##这个AI爆火!输入1句话,生成1段视频!#