文生图：介绍一个文字生成图片的开源工具

强怀梅 · 2025-7-10 10:55:00

之前介绍过音频处理，图片生成视频，图片+音频对嘴，视频+音频对嘴。
今天介绍一个文字生成图片的开源项目，我已经在本地搭建完成了使用了。

一：下载源代码

地址：https://github.com/AUTOMATIC1111/stable-diffusion-webui

直接下载，解压就行。

二：环境搭建

使用Anaconda环境中搭建：

#进入加压包
cd stable-diffusion-webui
#创建环境
conda create --name stable-diff python=3.10
#激活环境：
conda activate stable-diff
#首次运行（会下载模型）：
python launch.py<br><br>#运行中如果有报错，差什么就安装什么<br>pip install ...

复制代码

三：运行

运行：
python webui.py

复制代码

四：添加v2新模型

这里默认下载的是v1-5-pruned-emaonly。查了下最新的有v2版本，下面就配置个v2版本。
（1）：模型下载：https://huggingface.co/stabilityai/stable-diffusion-2-1/tree/main

下载文件v2-1_768-ema-pruned.safetensors 有点大5G。放到文件夹\stable-diffusion-webui\models\Stable-diffusion 中。
然后重启服务，刷新模板，重新生成。图片生成了，但是图像不对。

注意如果有报错，需要设置一下：

modules.devices.NansException: A tensor with NaNs was produced in Unet. This could be either because there's not enough precision to represent the picture, or because your video card does not support half type. Try setting the "Upcast cross attention layer to float32" option in Settings > Stable Diffusion or using the --no-half commandline argument to fix this. Use --disable-nan-check commandline argument to disable this check.

复制代码

（2）：解码器下载，这里使用社区开源的解码器
https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors。
下载后存放在文件夹 \stable-diffusion-webui\models\VAE 。

（3）：配置：
<ol ><li >回到 Web UI 界面，进入 Settings (设置) 标签页。
<li >在左侧菜单，点击 Stable Diffusion 子菜单。（就是你之前找到 "Upcast" 选项的那个地方）。
<li >在右侧的选项中，找到一个叫做 SD VAE 的下拉菜单。
<li >点击这个下拉菜单，选择你刚刚放进去的那个 VAE 文件（比如 vae-ft-mse-840000-ema-pruned.safetensors）。
<ul ><li >
如果菜单里没看到，可以点击下拉菜单旁边的小小的<strong >刷新按钮
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册

文生图：介绍一个文字生成图片的开源工具

相关帖子

签约作者

文生图：介绍一个文字生成图片的开源工具

相关帖子

相关推荐

签约作者