Stable Diffusion 系列模型向来是文字生成图片 AI 模型的标杆,最新 Stable Diffusion 3 虽然效能强劲,但也对运算器材要求极高。 最近 Stability AI 就推出新版本,降低运算门槛。
今次推出的 Stable Diffusion 3 Medium 规模较之前推出的 Stable Diffusion 3 Large 模型小,也是系列首个开源模型。 Stability AI 表示,这个版本的表现与 Large 版本相近,同时有更高的资源运用效率。
Stable Diffusion 3 Medium 包含20亿个参数,通过采用「变分自编码器(VAE)」,在更小的规模下仍然可以提供优秀的生成细节表现,包括克服手部和面部的常见伪影问题。 这个模型还能理解涉及空间关系、构图元素、动作和风格的复杂提示,在生成文字时实现「前所未有的效果」,而不会出现伪像或拼写错误。
新模型的运作要求只需要最少 5GB 的 GPU VRAM,而 Stability AI 建议使用 16GB GPU VRAM 来运作,这样虽然仍然算是高要求,但已经可以在一般的消费级 GPU 和企业级 GPU 上运作。
赞 (0)
打赏
微信扫一扫