该研究探索了用于图像和视频生成的基于 transformer 的扩散模型,并介绍了 gentron,它是一族使用基于 transformer 的扩散的生成模型,扩展到文本到视频生成,并在人类评估中取得了显著的视觉质量改进。
该研究介绍了基于transformer的gentron扩散模型,用于图像和视频生成。该模型在文本到视频生成中取得了显著的视觉质量改进。
该研究探索了用于图像和视频生成的基于 transformer 的扩散模型,并介绍了 gentron,它是一族使用基于 transformer 的扩散的生成模型,扩展到文本到视频生成,并在人类评估中取得了显著的视觉质量改进。
该研究介绍了基于transformer的gentron扩散模型,用于图像和视频生成。该模型在文本到视频生成中取得了显著的视觉质量改进。