Windows 本地搭建 Stable Diffusion WebUI:环境配置与模型加载实践
一、前言:Stable Diffusion WebUI 仍有一席之地
ComfyUI 的节点式工作流固然灵活,但 Stable Diffusion WebUI(以下简称 WebUI)在易用性和快速出图方面仍有优势。对于不需要复杂工作流、只想"输提示词→出图"的用户,WebUI 的操作路径更短,上手门槛更低。
此外,WebUI 的部分插件生态(如 OpenPose 编辑器、Tagger 反推提示词)在 ComfyUI 中并无完美替代。两种工具并行使用,才是本地 AI 绘画的最佳实践。
本文聚焦 WebUI 在 Windows 环境下的完整部署流程,涵盖环境搭建、模型加载、插件配置与常见报错排查。
二、硬件与驱动基线
| 项目 | 最低配置 | 推荐配置 | 说明 |
|---|---|---|---|
| GPU | NVIDIA GTX 1060 6GB | RTX 3060 12GB / 4060 Ti 16GB | 必须为 NVIDIA,AMD 方案需 ROCm |
| 显存 | 6GB | 12GB+ | 8GB 可跑 SD1.5,SDXL 建议 12GB 起 |
| 内存 | 16GB | 32GB | 模型加载峰值占用高 |
| 磁盘 | 50GB SSD | 200GB+ NVMe | 单个大模型 4-8GB |
| Python | 3.10.x | 3.10.6 | 3.11+ 存在兼容问题,不建议使用 |
| Git | 最新版 | 最新版 | 用于拉取仓库和插件更新 |
| NVIDIA 驱动 | >= 545 | 最新版 | 驱动过低会导致 CUDA 报错 |
前置确认:打开命令行执行以下命令,确认 CUDA 可用:
nvidia-smi输出中应显示驱动版本和 CUDA 版本。如果命令不存在,说明驱动未正确安装。
三、方案一:整合包部署(新手推荐)
整合包将 Python、Git、PyTorch、WebUI 本体预打包,解压即用。
3.1 下载与解压
- 获取整合包(文末有资源获取方式)
- 解压到非系统盘、无中文无空格的路径,例如
D:\sd-webui
路径禁忌:
C:\Users\我的文档\sd webui\(含中文+空格,必报错)
3.2 启动
双击run.bat或webui-user.bat,首次启动会自动安装依赖(约 10-20 分钟)。
启动成功后浏览器自动打开http://127.0.0.1:7860。
3.3 放入模型
将.safetensors或.ckpt模型文件放入:
stable-diffusion-webui/ └── models/ └── Stable-diffusion/ # 主模型放这里刷新页面,左上角模型下拉框即可选择。
四、方案二:原生安装(进阶用户)
4.1 安装 Python 3.10
winget install Python.Python.3.10安装时勾选"Add Python to PATH"。
4.2 安装 Git
winget install Git.Git4.3 克隆仓库
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui4.4 配置启动参数
编辑webui-user.bat,添加以下内容:
@echo off set PYTHON=C:\Python310\python.exe set GIT=C:\Program Files\Git\cmd\git.exe set VENV_DIR=venv set COMMANDLINE_ARGS=--xformers --medvram --api| 参数 | 作用 |
|---|---|
--xformers | 显存优化,减少 30-50% 占用 |
--medvram | 中等显存模式,8GB 适用 |
--lowvram | 低显存模式,4-6GB 救急 |
--api | 开启 API 接口,供外部调用 |
--listen | 允许局域网访问 |
--no-half-vae | 解决部分显卡 VAE 报错 |
4.5 启动
webui-user.bat首次启动自动创建虚拟环境并安装所有依赖,耗时 15-30 分钟。后续启动约 30 秒。
五、模型文件说明与管理
5.1 模型类型
| 类型 | 目录 | 格式 | 说明 |
|---|---|---|---|
| 主模型 | models/Stable-diffusion/ | .safetensors/.ckpt | SD1.5 / SDXL / FLUX 等 |
| LoRA | models/Lora/ | .safetensors | 微调风格/人物,叠加使用 |
| VAE | models/VAE/ | .safetensors/.pt | 色彩解码器,影响画面色彩 |
| Embedding | embeddings/ | .pt/.safetensors | 负面提示词模板 |
| ControlNet | models/ControlNet/ | .safetensors | 姿势/线稿/深度控制 |
| Hypernetwork | models/hypernetworks/ | .pt | 风格迁移(已较少使用) |
5.2 推荐基础模型
| 模型 | 底模 | 特点 | 适用场景 |
|---|---|---|---|
| anything-v5 | SD1.5 | 二次元经典 | 动漫/插画 |
| realisticVision-v6 | SD1.5 | 写实人像 | 摄影/人像 |
| dreamshaper-v8 | SD1.5 | 通用均衡 | 新手首选 |
| sdxl-base-1.0 | SDXL | 高分辨率原生 | 设计/商业 |
| flux1-dev | FLUX.1 | 最新架构 | 追求质量 |
5.3 模型共享(与 ComfyUI 共用)
如果同时安装了 ComfyUI 和 WebUI,通过符号链接共享模型,节省磁盘:
mklink /D "D:\sd-webui\models\Stable-diffusion" "D:\ComfyUI\models\checkpoints" mklink /D "D:\sd-webui\models\Lora" "D:\ComfyUI\models\loras"六、核心插件推荐与安装
6.1 必装插件
| 插件 | 功能 | 安装方式 |
|---|---|---|
| openpose-editor | 在线编辑 OpenPose 骨架图 | Extensions → Install from URL |
| sd-webui-controlnet | ControlNet 集成 | 同上 |
| adetailer | 自动面部/手部修复 | 同上 |
| tagger | 反推图片提示词 | 同上 |
| sd-webui-regional-prompter | 区域分区提示词 | 同上 |
| zh_CN 本地化 | 中文界面 | Settings → User interface → Localization |
6.2 安装方法
方式一:WebUI 界面安装
Extensions → Install from URL → 粘贴仓库地址 → Install → Apply and restart UI方式二:命令行安装
cd stable-diffusion-webui\extensions git clone https://github.com/Mikubill/sd-webui-controlnet.git重启 WebUI 即可生效。
七、ControlNet 配置
7.1 安装步骤
- 安装
sd-webui-controlnet插件 - 下载 ControlNet 模型放入
models/ControlNet/ - 重启 WebUI
7.2 常用 ControlNet 模型
| 模型 | 控制方式 | 场景 |
|---|---|---|
| control_v11p_sd15_openpose | 人体姿态 | 指定人物动作 |
| control_v11p_sd15_lineart | 线稿 | 根据草图生成 |
| control_v11f1e_sd15_depth | 深度图 | 保持空间结构 |
| control_v11p_sd15_canny | 边缘检测 | 保留轮廓细节 |
| control_v11p_sd15_scribble | 涂鸦 | 粗略草图引导 |
7.3 使用流程
- 生成页面展开 ControlNet 面板
- 勾选 Enable
- 选择模型和预处理器
- 上传参考图或手绘草图
- 正常输入提示词生成
八、出图参数调优
8.1 核心参数
| 参数 | 推荐值 | 说明 |
|---|---|---|
| Sampling Steps | 20-30 | 步数过低图片模糊,过高无收益 |
| Sampler | DPM++ 2M Karras | 通用最优选择 |
| CFG Scale | 7-9 | 提示词跟随度,过高会过曝 |
| Batch Size | 1-4 | 同时生成张数,受显存限制 |
| Width × Height | 512×768 (SD1.5) / 1024×1024 (SDXL) | 不要超出模型原生分辨率太多 |
8.2 高清放大方案
| 方案 | 原理 | 速度 | 质量 |
|---|---|---|---|
| Hires. fix | 潜空间放大再采样 | 中 | 高 |
| Extras → Upscale | 像素级超分辨率 | 快 | 中 |
| SD Upscale (脚本) | 分块放大再融合 | 慢 | 最高 |
Hires. fix 推荐参数:
Upscaler: R-ESRGAN 4x+ Hires steps: 15-20 Denoising strength: 0.3-0.5 Upscale by: 1.5-2.0九、常见问题排查
| 问题 | 原因 | 解决方案 |
|---|---|---|
CUDA out of memory | 显存不足 | 加--medvram或--lowvram启动参数 |
启动卡在Installing xformers | 网络问题 | 换镜像源或手动pip install xformers |
| 生成图片全黑 | VAE 未加载 | Settings → Stable Diffusion → 选择 VAE |
| 生成图片偏灰/偏色 | VAE 不匹配 | SD1.5 用vae-ft-mse-840000,SDXL 用自带 VAE |
| 插件不显示 | 版本不兼容 | git pull更新插件,或换 Python 3.10 |
RuntimeError: Couldn't install torch | PyTorch 安装失败 | 手动安装:pip install torch --index-url https://download.pytorch.org/whl/cu121 |
| LoRA 不生效 | 路径或触发词错误 | 确认文件在models/Lora/,提示词加<lora:名称:权重> |
| ControlNet 面板不出现 | 插件未安装或模型缺失 | 安装插件 + 下载 ControlNet 模型 |
| 页面打不开(白屏) | 端口被占用或启动失败 | 改--port 7861,检查终端报错 |
十、WebUI vs ComfyUI:如何选择
| 维度 | WebUI | ComfyUI |
|---|---|---|
| 上手难度 | 低,界面直观 | 中,需理解节点逻辑 |
| 灵活性 | 中等,受界面限制 | 高,自由组合节点 |
| 显存效率 | 一般 | 更优,按需加载 |
| 适合场景 | 快速出图、批量生成 | 复杂工作流、视频生成 |
| 插件生态 | 成熟,数量多 | 快速增长中 |
| 学习曲线 | 平缓 | 初期陡峭,后期收益大 |
建议:两种都装,日常用 WebUI 快速出图,复杂任务切 ComfyUI。模型通过符号链接共享,互不冲突。
十一、学习资源
WebUI 的部署只是起点,从提示词工程到 ControlNet 精控,从 LoRA 训练到批量出图,每个环节都有深入空间。我整理了一份 Stable Diffusion 及 AIGC 全栈学习资源合集,涵盖入门到实战的完整路径。
资源获取:留言"SD",我会把整理好的教程索引与模型清单发给你。
十二、总结
Stable Diffusion WebUI 本地部署的核心难点在于环境配置——Python 版本、CUDA 驱动、PyTorch 版本三者必须匹配。整合包方案直接跳过了这个门槛,让新手能在 10 分钟内跑起来。原生安装则适合需要精细控制环境的进阶用户。
两种部署方式、两类出图工具(WebUI + ComfyUI)、一套共享模型库——这就是 2026 年本地 AI 绘画的最佳实践架构。
部署中遇到问题,欢迎评论区交流。
声明:本文涉及的技术资源均来源于开源社区公开分享,仅供学习与技术研究使用。
作者:赛博仓鼠
更新日期:2026-06-26
最后修订:补充 ControlNet 配置与模型共享方案