📝 提效录
✂️AI去除背景在线一键抠图换背景🎨AI图片生成即梦4.0免费生图📝诗词工具箱藏头诗对联生成📛网名生成器智能AI取网名✍️艺术签名8种字体在线签名🧮社保计算器五险一金在线算

Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站

📅 2026-06-20📝 7196字✍️ 提效录
AI绘画
Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站配图1

Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站

还记得2023年我第一次接触AI绘画时,Midjourney的惊艳效果让我彻夜难眠,但每月30美元的订阅费和风格限制总让我觉得不够自由。后来我发现了开源神器Stable Diffusion,一瞬间就像打开了新世界的大门——免费、可控、可本地运行。转眼到了2026年,Stable Diffusion的生态已经变得无比成熟,SDXL Turbo、Stable Video Diffusion、ControlNet 3.0等新特性层出不穷,但很多新手朋友仍然卡在“本地安装”这道门槛上。今天我就用第一人称的口吻,陪你从零开始,把Stable Diffusion稳稳地装进你的电脑里。

为什么选择本地部署Stable Diffusion?

隐私与数据安全:你的创意,只属于你

当你用在线AI绘画服务时,每一次生成的图片、每一段prompt都会上传到云端服务器。ChatGPT、Midjourney这些工具的协议里往往写着“可使用用户内容进行模型训练”。如果你商用设计稿、角色概念图、甚至是个人艺术项目,本地部署意味着所有数据留在你的硬盘里,没有人能“学习”你的创意。

无限次生成,零等待,零成本

在线服务通常有次数限制(Midjourney的快速模式每月只有15小时)或按次收费。本地部署后,只要你的显卡扛得住,想生成多少张就生成多少张。2026年的Stable Diffusion已经能通过Tiling技术在大显存下生成8K分辨率图片,配合TensorRT加速,一张1024×1024的图仅需2秒。更妙的是,本地部署不需要排队——深夜灵感爆发时直接开干。

完全可控:从模型到参数,一切你说了算

在线工具给你的是“黑箱”——你只能调滑条和选风格。本地安装后,你可以: - 自由更换Checkpoint(基础模型),从写实到二次元,甚至自己训练LoRA - 使用ControlNet精确控制构图、姿势、深度 - 叠加多个LoRA(低秩适应模块)实现角色、画风、动作的混合控制 - 自定义Sampler(采样器)和CFG Scale,玩出Darkroom风格、水墨风

2026年的硬件门槛有多低?

很多人以为本地安装需要顶配显卡,其实2026年一张二手RTX 3060(12G显存)就能流畅运行SDXL。如果使用SDXL TurboLCM-LoRA,甚至能在GTX 1660上2秒出图。下面我会详细列出硬件清单。

准备工作:硬件检查与软件依赖

硬件最低要求(2026年实测)

组件 最低配置 推荐配置
显卡 NVIDIA GTX 1060 6GB(或AMD RX 5600 XT) NVIDIA RTX 3060 12GB / RTX 4060
显存 4GB(仅支持SD 1.5) 8GB以上(支持SDXL)
内存 16GB 32GB
硬盘 20GB可用空间 200GB(模型多的话)
系统 Windows 10 64位 / Ubuntu 20.04 Windows 11 / Ubuntu 22.04

如果你用AMD显卡,2026年的ROCm 6.0和DirectML支持已经非常成熟,但建议新手首选NVIDIA,因为CUDA生态最无痛

必装软件清单

  1. Python 3.10.6(注意:不要装3.11或3.12,很多库不兼容)
  2. Git(用于下载仓库和模型)
  3. CUDA 11.8(NVIDIA显卡必备,2026年建议用CUDA 12.1以获得最新优化)
  4. cuDNN(深度学习加速库,配合CUDA版本)
  5. Visual Studio Build Tools(编译xformers等依赖时需要C++编译器)

注意:如果你是Windows用户,强烈建议先装好Git for WindowsPython官方安装包,安装时勾选“Add Python to PATH”。

验证环境:打开终端打几个命令

安装完成后,打开命令提示符(CMD)或PowerShell,输入:

python --version   # 应该显示 Python 3.10.6
git --version      # 应该显示 git version 2.x.x
nvcc --version     # 应该显示 Cuda compilation tools, release 11.8

如果没有报错,说明环境就绪。如果nvcc找不到,别急,下面我会教你在WebUI安装过程中自动检测CUDA。

配图1
图1:终端窗口下验证Python、Git和CUDA版本的输出示例,确保环境准备无误。

方案一:使用Stable Diffusion WebUI一键安装(新手最推荐)

下载Automatic1111的webui.sh

Automatic1111的WebUI是目前用户量最大、插件最丰富的界面,2026年它已经更新到了1.9.x版本,原生支持SDXL、ControlNet、Tiled VAE等。安装方法极其简单:

  1. 打开你希望安装的目录(建议放在D盘或空间充裕的盘,路径不要有中文和空格)
  2. 在地址栏输入 cmd 打开终端
  3. 输入以下命令克隆仓库:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
  1. 进入文件夹:
cd stable-diffusion-webui
  1. 运行启动脚本(Windows用 webui-user.bat,Linux/Mac用 bash webui.sh

首次运行会自动下载依赖,包括PyTorch、xformers、深度学习库等。这个过程大约5-20分钟,取决于你的网速。注意:如果遇到网络问题,可以设置国内镜像源——在webui-user.bat里添加一行 set COMMANDLINE_ARGS=--xformers --no-half-vae

第一次启动:界面长什么样?

启动完成后,终端会显示一个本地地址,通常是 http://127.0.0.1:7860。用浏览器打开,你会看到:

关键设置:在Settings里找到“Optimization”,把内存优化方案选为“xformers”(如果你显卡显存较小,也可选“medvram”或“lowvram”),然后点击“Apply settings”并重启UI。

常见问题:显卡没被识别怎么办?

如果启动时看到“No module named 'torch'”或“CUDA not available”,大概率是PyTorch安装问题。手动安装CUDA版的PyTorch:

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

再重新运行webui-user.bat。

方案二:使用ComfyUI手动配置(进阶玩家的灵活选择)

为什么选择ComfyUI?

ComfyUI采用节点式工作流,你可以像搭乐高一样把text encoder、sampler、vae decoder串联起来。对于想要深度定制出图流程的用户(比如同时用多个ControlNet、叠加多个LoRA、动态调整seed),ComfyUI比WebUI更高效。2026年ComfyUI已经支持Stable Video DiffusionZero-1-to-3等新模型。

安装步骤

  1. 同样先克隆仓库:
git clone https://github.com/comfyanonymous/ComfyUI.git
  1. 进入目录,创建虚拟环境(推荐):
cd ComfyUI
python -m venv venv
.\venv\Scripts\activate  # Windows激活
  1. 安装依赖:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
  1. 运行:
python main.py

访问 http://127.0.0.1:8188 即可。

加载第一个基础工作流

ComfyUI默认没有模型,你需要手动把下载的Checkpoint放到 ComfyUI/models/checkpoints/ 目录。然后从菜单栏“Load Default Workflow”加载一个txt2img工作流,双击空白处搜索“checkpoint”,把它连到模型节点,再选择采样器(如DPM++ 2M Karras),最后点击“Queue Prompt”生成。

WebUI vs ComfyUI:我该选哪个?

维度 WebUI ComfyUI
易用性 ★★★★★ ★★★
性能(显存占用) 中等 更省显存
插件生态 极其丰富 也有,但数量少
工作流复用 每个生成是独立的 可保存/分享.wf文件
适合人群 新手、快速出图 进阶玩家、自动化脚本用户

建议:先装WebUI上手,玩熟后再装ComfyUI。两者可以共存于同一台机器,共享同一套模型文件夹。

模型下载与安装:让你的SD真正“活”起来

模型分类与推荐网站

Stable Diffusion的模型主要分三类: - Checkpoint:基础模型,比如SD 1.5、SDXL、SDXL Turbo、Realistic Vision等 - LoRA:微调模块,大小几十MB,可以叠加使用,比如特定角色、画风、服装 - VAE:变分自编码器,影响色彩和细节,常用vae-ft-mse-840000

去哪里下载?首选 CivitAI(2026年已经称为AI模型界的GitHub),注册后可以下载各种模型。Hugging Face也是官方来源,但国内访问可能较慢。

安装到正确的位置

WebUI的模型路径在 stable-diffusion-webui/models/: - Checkpoint -> Stable-diffusion/ 文件夹(.safetensors文件) - LoRA -> Lora/ 文件夹 - VAE -> VAE/ 文件夹 - ControlNet模型 -> ControlNet/ 文件夹

ComfyUI的路径类似:ComfyUI/models/ 下有对应子文件夹。

推荐几款2026年必装模型

  1. SDXL Turbo:官方蒸馏模型,只需1-2步即可出高质量图,适合快速迭代
  2. Realistic Vision V6.0:写实人像之王,皮肤质感炸裂
  3. DreamShaper XL:兼顾写实和幻想的全能模型
  4. Anime Pastel Dream:二次元画风,特别适合插画
  5. LCM-LoRA:配合SD 1.5使用,可以将采样步数从30压缩到4步,速度提升6倍

下载完成后,必须重启WebUI或ComfyUI才能识别新模型。WebUI里可以在左上角下拉菜单切换Checkpoint。

配图2
图2:CivitAI网站的模型详情页,包含样本图、下载链接和使用说明,这里是找模型的首选地。

优化与加速:让SD跑得比闪电还快

xformers:显存节省+速度提升

xformers是NVIDIA开源的注意力优化库,能减少约30%的显存占用,同时提升生成速度。在WebUI的启动参数中添加 --xformers 即可。如果你用的是ComfyUI,确保安装了xformers包:

pip install xformers --index-url https://download.pytorch.org/whl/cu118

Tiling:生成超高分辨率图片

普通SDXL最大生成1024×1024,但通过Tiled VAE插件,你可以把大图切块处理。比如生成2048×2048,实际显存占用只相当于1024。在WebUI的Extensions里搜索“Tiled Diffusion”,安装后可以在txt2img界面启用“Tiled VAE”和“Tiled Diffusion”。

TensorRT加速:为NVIDIA显卡量身定制

2026年NVIDIA发布了TensorRT for Stable Diffusion,可以将模型编译为优化版本,速度提升40%-60%。安装方法: 1. 在WebUI的Extensions里安装“sd-webui-tensorrt” 2. 打开Settings > TensorRT,选择你的显卡型号 3. 点击“Export TensorRT engine”等待编译(第一次可能耗时10分钟) 4. 编译完成后,在txt2img界面选择“TensorRT”作为后端

内存不够怎么办?——参数微调

如果你只有4GB显存,可以尝试: - 使用 --medvram--lowvram 启动参数(但会降低速度) - 换用SD 1.5模型,而不是SDXL - 关闭“面部修复”(face restoration)等后处理功能 - 在设置里降低“批次大小”(Batch Count)和“批次尺寸”(Batch Size)

2026年新利器:Flash Attention 3.0

2026年Flash Attention 3.0已经集成到PyTorch 2.5中,它通过软硬件协同优化,让注意力计算更快更省显存。如果你的显卡是RTX 40系列,强烈推荐安装PyTorch 2.5以上版本:

pip install torch==2.5.0 torchvision==0.18.0 --index-url https://download.pytorch.org/whl/cu121

配合 --xformers 和Flash Attention,一张512×512的图可以做到1秒内生成。

常见问题与排错(FAQ)

启动时报错“RuntimeError: Could not load library cudnn_cnn_infer64_8.dll”怎么办?

答案:这个问题通常是cuDNN版本不匹配导致的。去NVIDIA官网下载cuDNN for CUDA 11.8或12.1(根据你装的CUDA版本),将压缩包里的bin、lib、include文件夹复制到CUDA安装目录(如C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8)。如果是Windows,也可以直接把cuDNN的bin目录添加到系统Path变量。

安装插件时总是报“SSL: CERTIFICATE_VERIFY_FAILED”错误?

答案:这是因为国内部分网络环境可能无法验证GitHub的SSL证书。解决方法:在WebUI的webui-user.bat文件里,在set COMMANDLINE_ARGS=后面加上--skip-version-check 2>nul,或者临时设置环境变量set GIT_SSL_NO_VERIFY=1。更稳妥的办法是使用代理科学上网,或通过手动下载插件zip包,解压到extensions文件夹。

生成的图片全是黑色的,或者提示“NaN”?

答案:这通常是VAE问题或显存溢出导致。首先确保你使用的模型对应的VAE已经正确加载(CivitAI上的模型页面通常会注明推荐的VAE)。如果显存不足,可以在启动参数加--no-half-vae(让VAE用全精度计算),或者降低图片尺寸与采样步数。另外,有些模型(如SDXL Turbo)需要配合特定的sampler(如Euler a),否则会出黑图。

如何让Stable Diffusion使用Intel/AMD的显卡?NVIDIA独显好贵。

答案:2026年已经有大佬开发了DirectMLVulkan后端。针对AMD显卡,可以尝试使用stable-diffusion-webui-directml分支:在安装时设置环境变量set USE_DIRECTML=1,启动参数加--backend-directml。但注意,DirectML的显存效率比CUDA略低,且某些ControlNet模型可能不兼容。Intel的Arc显卡(如A770)也支持DirectML,性能尚可。

我能不能把Stable Diffusion放到云服务器上,然后远程访问?

答案:当然可以!本地安装只是基础,你还可以用GPU云主机(比如AutoDL、恒源云)租用30系列或40系列显卡,每小时仅几毛钱。安装好WebUI后,修改webui-user.bat的启动参数,加上--listen--port 7860,然后在云服务器的防火墙放行该端口。外网访问建议通过frp内网穿透或Tailscale组网,避免安全问题。另外,如果只是偶尔用,也可以用Google Colab免费版的T4显卡(但有限制),这方面可以结合DeepSeekChatGPT写一个自动化脚本定时重启Colab。

总结:你的AI绘画之旅才刚刚开始

从零开始安装Stable Diffusion并不难——检查硬件、克隆仓库、运行脚本、下载模型,一共四步。2026年的AI绘画生态已经非常友好,甚至像Stable Diffusion WebUI Forge这样的优化版启动器还提供了图形化安装向导,一键搞定所有依赖。但安装只是第一步,真正有趣的是后面的探索:

当你亲手生成第一张高质量的AI图片时,那种成就感远不是在线工具能比的。你会发现,AI不是替代艺术家的工具,而是放大你创造力的画笔。现在,打开你的电脑,照着教程开始吧——如果遇到问题,评论区留言,或者搜索“Stable Diffusion 2026 常见问题”,总有一群热心的社区小伙伴在等你。

为了2026年更自由的创作,请勇敢地踏出第一步!

Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站配图2

常见问题

为什么选择ComfyUI?

ComfyUI采用节点式工作流,你可以像搭乐高一样把text encoder、sampler、vae decoder串联起来。对于想要深度定制出图流程的用户(比如同时用多个ControlNet、叠加多个LoRA、动态调整seed),ComfyUI比WebUI更高效。2026年ComfyUI已经支持Stable Video DiffusionZero-1-to-3等新模型。

安装步骤
  1. 同样先克隆仓库: bash git clone https://github.com/comfyanonymous/ComfyUI.git
  2. 进入目录,创建虚拟环境(推荐): bash cd ComfyUI python -m venv venv .\venv\Scripts\activate # Windows激活
  3. 安装依赖: bash pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt
  4. 运行: bash python main.py 访问 http://127.0.0.1:8188 即可。
加载第一个基础工作流

ComfyUI默认没有模型,你需要手动把下载的Checkpoint放到 ComfyUI/models/checkpoints/ 目录。然后从菜单栏“Load Default Workflow”加载一个txt2img工作流,双击空白处搜索“checkpoint”,把它连到模型节点,再选择采样器(如DPM++ 2M Karras),最后点击“Queue Prompt”生成。

WebUI vs ComfyUI:我该选哪个?

| 维度 | WebUI | ComfyUI | |------|-------|---------| | 易用性 | ★★★★★ | ★★★ | | 性能(显存占用) | 中等 | 更省显存 | | 插件生态 | 极其丰富 | 也有,但数量少 | | 工作流复用 | 每个生成是独立的 | 可保存/分享.wf文件 | | 适合人群 | 新手、快速出图 | 进阶玩家、自动化脚本用户 | 建议:先装WebUI上手,玩熟后再装ComfyUI。两者可以共存于同一台机器,共享同一套模型文件夹。

模型下载与安装:让你的SD真正“活”起来

模型分类与推荐网站

Stable Diffusion的模型主要分三类: - Checkpoint:基础模型,比如SD 1.5、SDXL、SDXL Turbo、Realistic Vision等 - LoRA:微调模块,大小几十MB,可以叠加使用,比如特定角色、画风、服装 - VAE:变分自编码器,影响色彩和细节,常用vae-ft-mse-840000 去哪里下载?首选 CivitAI(2026年已经称为AI模型界的GitHub),注册后可以下载各种模型。Hugging Face也是官方来源,但国内访问可能较慢。

相关工具推荐

🔧 AI图像工具推荐 →

🛠️ 读完文章了?试试提效录自建工具,免费在线打开即用

✂️AI去除背景在线一键抠图换背景🎨AI图片生成即梦4.0免费生图📝诗词工具箱藏头诗对联生成📛网名生成器智能AI取网名✍️艺术签名8种字体在线签名🧮社保计算器五险一金在线算