Stable Diffusion 文本到图像扩散模型


产品介绍

Image

Stable Diffusion

文本到图像扩散模型


特性

Stable Diffusion 是一种潜在的文本到图像扩散模型。由于Stability AI的慷慨计算捐赠和LAION的支持,我们能够对LAION-5B数据库的512x512图像的子集进行潜在扩散模型的训练。

类似于GoogleImagen,该模型使用一个冻结的CLIP ViT-L/14文本编码器来根据文本提示对模型进行调节。具有860M UNet123M文本编码器,该模型相对轻量,并且可以在至少具有10GB VRAMGPU上运行。请参见下面的本节以及模型卡片。