普通电脑也可以快速生成图片全新 Stable Diffusion 3 Medium 降低运作门槛

BOB • 2024年6月14日 12:41 • 投稿

Stable Diffusion 系列模型向来是文字生成图片 AI 模型的标杆，最新 Stable Diffusion 3 虽然效能强劲，但也对运算器材要求极高。最近 Stability AI 就推出新版本，降低运算门槛。

今次推出的 Stable Diffusion 3 Medium 规模较之前推出的 Stable Diffusion 3 Large 模型小，也是系列首个开源模型。 Stability AI 表示，这个版本的表现与 Large 版本相近，同时有更高的资源运用效率。

Stable Diffusion 3 Medium 包含20亿个参数，通过采用「变分自编码器（VAE）」，在更小的规模下仍然可以提供优秀的生成细节表现，包括克服手部和面部的常见伪影问题。这个模型还能理解涉及空间关系、构图元素、动作和风格的复杂提示，在生成文字时实现「前所未有的效果」，而不会出现伪像或拼写错误。

新模型的运作要求只需要最少 5GB 的 GPU VRAM，而 Stability AI 建议使用 16GB GPU VRAM 来运作，这样虽然仍然算是高要求，但已经可以在一般的消费级 GPU 和企业级 GPU 上运作。

普通电脑也可以快速生成图片 全新 Stable Diffusion 3 Medium 降低运作门槛

相关推荐

发表回复

普通电脑也可以快速生成图片全新 Stable Diffusion 3 Medium 降低运作门槛