Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站
Stable Diffusion 2026本地安装完全指南:从零开始搭建你的AI绘画工作站
还记得2023年我第一次接触AI绘画时,Midjourney的惊艳效果让我彻夜难眠,但每月30美元的订阅费和风格限制总让我觉得不够自由。后来我发现了开源神器Stable Diffusion,一瞬间就像打开了新世界的大门——免费、可控、可本地运行。转眼到了2026年,Stable Diffusion的生态已经变得无比成熟,SDXL Turbo、Stable Video Diffusion、ControlNet 3.0等新特性层出不穷,但很多新手朋友仍然卡在“本地安装”这道门槛上。今天我就用第一人称的口吻,陪你从零开始,把Stable Diffusion稳稳地装进你的电脑里。
为什么选择本地部署Stable Diffusion?
隐私与数据安全:你的创意,只属于你
当你用在线AI绘画服务时,每一次生成的图片、每一段prompt都会上传到云端服务器。ChatGPT、Midjourney这些工具的协议里往往写着“可使用用户内容进行模型训练”。如果你商用设计稿、角色概念图、甚至是个人艺术项目,本地部署意味着所有数据留在你的硬盘里,没有人能“学习”你的创意。
无限次生成,零等待,零成本
在线服务通常有次数限制(Midjourney的快速模式每月只有15小时)或按次收费。本地部署后,只要你的显卡扛得住,想生成多少张就生成多少张。2026年的Stable Diffusion已经能通过Tiling技术在大显存下生成8K分辨率图片,配合TensorRT加速,一张1024×1024的图仅需2秒。更妙的是,本地部署不需要排队——深夜灵感爆发时直接开干。
完全可控:从模型到参数,一切你说了算
在线工具给你的是“黑箱”——你只能调滑条和选风格。本地安装后,你可以: - 自由更换Checkpoint(基础模型),从写实到二次元,甚至自己训练LoRA - 使用ControlNet精确控制构图、姿势、深度 - 叠加多个LoRA(低秩适应模块)实现角色、画风、动作的混合控制 - 自定义Sampler(采样器)和CFG Scale,玩出Darkroom风格、水墨风
2026年的硬件门槛有多低?
很多人以为本地安装需要顶配显卡,其实2026年一张二手RTX 3060(12G显存)就能流畅运行SDXL。如果使用SDXL Turbo或LCM-LoRA,甚至能在GTX 1660上2秒出图。下面我会详细列出硬件清单。
准备工作:硬件检查与软件依赖
硬件最低要求(2026年实测)
| 组件 | 最低配置 | 推荐配置 |
|---|---|---|
| 显卡 | NVIDIA GTX 1060 6GB(或AMD RX 5600 XT) | NVIDIA RTX 3060 12GB / RTX 4060 |
| 显存 | 4GB(仅支持SD 1.5) | 8GB以上(支持SDXL) |
| 内存 | 16GB | 32GB |
| 硬盘 | 20GB可用空间 | 200GB(模型多的话) |
| 系统 | Windows 10 64位 / Ubuntu 20.04 | Windows 11 / Ubuntu 22.04 |
如果你用AMD显卡,2026年的ROCm 6.0和DirectML支持已经非常成熟,但建议新手首选NVIDIA,因为CUDA生态最无痛。
必装软件清单
- Python 3.10.6(注意:不要装3.11或3.12,很多库不兼容)
- Git(用于下载仓库和模型)
- CUDA 11.8(NVIDIA显卡必备,2026年建议用CUDA 12.1以获得最新优化)
- cuDNN(深度学习加速库,配合CUDA版本)
- Visual Studio Build Tools(编译xformers等依赖时需要C++编译器)
注意:如果你是Windows用户,强烈建议先装好Git for Windows和Python官方安装包,安装时勾选“Add Python to PATH”。
验证环境:打开终端打几个命令
安装完成后,打开命令提示符(CMD)或PowerShell,输入:
python --version # 应该显示 Python 3.10.6
git --version # 应该显示 git version 2.x.x
nvcc --version # 应该显示 Cuda compilation tools, release 11.8
如果没有报错,说明环境就绪。如果nvcc找不到,别急,下面我会教你在WebUI安装过程中自动检测CUDA。

图1:终端窗口下验证Python、Git和CUDA版本的输出示例,确保环境准备无误。
方案一:使用Stable Diffusion WebUI一键安装(新手最推荐)
下载Automatic1111的webui.sh
Automatic1111的WebUI是目前用户量最大、插件最丰富的界面,2026年它已经更新到了1.9.x版本,原生支持SDXL、ControlNet、Tiled VAE等。安装方法极其简单:
- 打开你希望安装的目录(建议放在D盘或空间充裕的盘,路径不要有中文和空格)
- 在地址栏输入
cmd打开终端 - 输入以下命令克隆仓库:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- 进入文件夹:
cd stable-diffusion-webui
- 运行启动脚本(Windows用
webui-user.bat,Linux/Mac用bash webui.sh)
首次运行会自动下载依赖,包括PyTorch、xformers、深度学习库等。这个过程大约5-20分钟,取决于你的网速。注意:如果遇到网络问题,可以设置国内镜像源——在webui-user.bat里添加一行 set COMMANDLINE_ARGS=--xformers --no-half-vae。
第一次启动:界面长什么样?
启动完成后,终端会显示一个本地地址,通常是 http://127.0.0.1:7860。用浏览器打开,你会看到:
- txt2img:输入prompt,选择模型,点击生成
- img2img:基于已有图片修改
- Settings:调整VRAM使用量、采样方法等
- Extensions:安装各种插件
关键设置:在Settings里找到“Optimization”,把内存优化方案选为“xformers”(如果你显卡显存较小,也可选“medvram”或“lowvram”),然后点击“Apply settings”并重启UI。
常见问题:显卡没被识别怎么办?
如果启动时看到“No module named 'torch'”或“CUDA not available”,大概率是PyTorch安装问题。手动安装CUDA版的PyTorch:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
再重新运行webui-user.bat。
方案二:使用ComfyUI手动配置(进阶玩家的灵活选择)
为什么选择ComfyUI?
ComfyUI采用节点式工作流,你可以像搭乐高一样把text encoder、sampler、vae decoder串联起来。对于想要深度定制出图流程的用户(比如同时用多个ControlNet、叠加多个LoRA、动态调整seed),ComfyUI比WebUI更高效。2026年ComfyUI已经支持Stable Video Diffusion和Zero-1-to-3等新模型。
安装步骤
- 同样先克隆仓库:
git clone https://github.com/comfyanonymous/ComfyUI.git
- 进入目录,创建虚拟环境(推荐):
cd ComfyUI
python -m venv venv
.\venv\Scripts\activate # Windows激活
- 安装依赖:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
- 运行:
python main.py
访问 http://127.0.0.1:8188 即可。
加载第一个基础工作流
ComfyUI默认没有模型,你需要手动把下载的Checkpoint放到 ComfyUI/models/checkpoints/ 目录。然后从菜单栏“Load Default Workflow”加载一个txt2img工作流,双击空白处搜索“checkpoint”,把它连到模型节点,再选择采样器(如DPM++ 2M Karras),最后点击“Queue Prompt”生成。
WebUI vs ComfyUI:我该选哪个?
| 维度 | WebUI | ComfyUI |
|---|---|---|
| 易用性 | ★★★★★ | ★★★ |
| 性能(显存占用) | 中等 | 更省显存 |
| 插件生态 | 极其丰富 | 也有,但数量少 |
| 工作流复用 | 每个生成是独立的 | 可保存/分享.wf文件 |
| 适合人群 | 新手、快速出图 | 进阶玩家、自动化脚本用户 |
建议:先装WebUI上手,玩熟后再装ComfyUI。两者可以共存于同一台机器,共享同一套模型文件夹。
模型下载与安装:让你的SD真正“活”起来
模型分类与推荐网站
Stable Diffusion的模型主要分三类: - Checkpoint:基础模型,比如SD 1.5、SDXL、SDXL Turbo、Realistic Vision等 - LoRA:微调模块,大小几十MB,可以叠加使用,比如特定角色、画风、服装 - VAE:变分自编码器,影响色彩和细节,常用vae-ft-mse-840000
去哪里下载?首选 CivitAI(2026年已经称为AI模型界的GitHub),注册后可以下载各种模型。Hugging Face也是官方来源,但国内访问可能较慢。
安装到正确的位置
WebUI的模型路径在 stable-diffusion-webui/models/:
- Checkpoint -> Stable-diffusion/ 文件夹(.safetensors文件)
- LoRA -> Lora/ 文件夹
- VAE -> VAE/ 文件夹
- ControlNet模型 -> ControlNet/ 文件夹
ComfyUI的路径类似:ComfyUI/models/ 下有对应子文件夹。
推荐几款2026年必装模型
- SDXL Turbo:官方蒸馏模型,只需1-2步即可出高质量图,适合快速迭代
- Realistic Vision V6.0:写实人像之王,皮肤质感炸裂
- DreamShaper XL:兼顾写实和幻想的全能模型
- Anime Pastel Dream:二次元画风,特别适合插画
- LCM-LoRA:配合SD 1.5使用,可以将采样步数从30压缩到4步,速度提升6倍
下载完成后,必须重启WebUI或ComfyUI才能识别新模型。WebUI里可以在左上角下拉菜单切换Checkpoint。

图2:CivitAI网站的模型详情页,包含样本图、下载链接和使用说明,这里是找模型的首选地。
优化与加速:让SD跑得比闪电还快
xformers:显存节省+速度提升
xformers是NVIDIA开源的注意力优化库,能减少约30%的显存占用,同时提升生成速度。在WebUI的启动参数中添加 --xformers 即可。如果你用的是ComfyUI,确保安装了xformers包:
pip install xformers --index-url https://download.pytorch.org/whl/cu118
Tiling:生成超高分辨率图片
普通SDXL最大生成1024×1024,但通过Tiled VAE插件,你可以把大图切块处理。比如生成2048×2048,实际显存占用只相当于1024。在WebUI的Extensions里搜索“Tiled Diffusion”,安装后可以在txt2img界面启用“Tiled VAE”和“Tiled Diffusion”。
TensorRT加速:为NVIDIA显卡量身定制
2026年NVIDIA发布了TensorRT for Stable Diffusion,可以将模型编译为优化版本,速度提升40%-60%。安装方法: 1. 在WebUI的Extensions里安装“sd-webui-tensorrt” 2. 打开Settings > TensorRT,选择你的显卡型号 3. 点击“Export TensorRT engine”等待编译(第一次可能耗时10分钟) 4. 编译完成后,在txt2img界面选择“TensorRT”作为后端
内存不够怎么办?——参数微调
如果你只有4GB显存,可以尝试:
- 使用 --medvram 或 --lowvram 启动参数(但会降低速度)
- 换用SD 1.5模型,而不是SDXL
- 关闭“面部修复”(face restoration)等后处理功能
- 在设置里降低“批次大小”(Batch Count)和“批次尺寸”(Batch Size)
2026年新利器:Flash Attention 3.0
2026年Flash Attention 3.0已经集成到PyTorch 2.5中,它通过软硬件协同优化,让注意力计算更快更省显存。如果你的显卡是RTX 40系列,强烈推荐安装PyTorch 2.5以上版本:
pip install torch==2.5.0 torchvision==0.18.0 --index-url https://download.pytorch.org/whl/cu121
配合 --xformers 和Flash Attention,一张512×512的图可以做到1秒内生成。
常见问题与排错(FAQ)
启动时报错“RuntimeError: Could not load library cudnn_cnn_infer64_8.dll”怎么办?
答案:这个问题通常是cuDNN版本不匹配导致的。去NVIDIA官网下载cuDNN for CUDA 11.8或12.1(根据你装的CUDA版本),将压缩包里的bin、lib、include文件夹复制到CUDA安装目录(如C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8)。如果是Windows,也可以直接把cuDNN的bin目录添加到系统Path变量。
安装插件时总是报“SSL: CERTIFICATE_VERIFY_FAILED”错误?
答案:这是因为国内部分网络环境可能无法验证GitHub的SSL证书。解决方法:在WebUI的webui-user.bat文件里,在set COMMANDLINE_ARGS=后面加上--skip-version-check 2>nul,或者临时设置环境变量set GIT_SSL_NO_VERIFY=1。更稳妥的办法是使用代理科学上网,或通过手动下载插件zip包,解压到extensions文件夹。
生成的图片全是黑色的,或者提示“NaN”?
答案:这通常是VAE问题或显存溢出导致。首先确保你使用的模型对应的VAE已经正确加载(CivitAI上的模型页面通常会注明推荐的VAE)。如果显存不足,可以在启动参数加--no-half-vae(让VAE用全精度计算),或者降低图片尺寸与采样步数。另外,有些模型(如SDXL Turbo)需要配合特定的sampler(如Euler a),否则会出黑图。
如何让Stable Diffusion使用Intel/AMD的显卡?NVIDIA独显好贵。
答案:2026年已经有大佬开发了DirectML和Vulkan后端。针对AMD显卡,可以尝试使用stable-diffusion-webui-directml分支:在安装时设置环境变量set USE_DIRECTML=1,启动参数加--backend-directml。但注意,DirectML的显存效率比CUDA略低,且某些ControlNet模型可能不兼容。Intel的Arc显卡(如A770)也支持DirectML,性能尚可。
我能不能把Stable Diffusion放到云服务器上,然后远程访问?
答案:当然可以!本地安装只是基础,你还可以用GPU云主机(比如AutoDL、恒源云)租用30系列或40系列显卡,每小时仅几毛钱。安装好WebUI后,修改webui-user.bat的启动参数,加上--listen和--port 7860,然后在云服务器的防火墙放行该端口。外网访问建议通过frp内网穿透或Tailscale组网,避免安全问题。另外,如果只是偶尔用,也可以用Google Colab免费版的T4显卡(但有限制),这方面可以结合DeepSeek或ChatGPT写一个自动化脚本定时重启Colab。
总结:你的AI绘画之旅才刚刚开始
从零开始安装Stable Diffusion并不难——检查硬件、克隆仓库、运行脚本、下载模型,一共四步。2026年的AI绘画生态已经非常友好,甚至像Stable Diffusion WebUI Forge这样的优化版启动器还提供了图形化安装向导,一键搞定所有依赖。但安装只是第一步,真正有趣的是后面的探索:
- 用ControlNet让照片中的人物摆出你想要的姿势
- 用LoRA训练自己宠物、朋友、甚至你画风的数字分身
- 用Stable Video Diffusion把静态图变成4秒的短视频
- 配合ChatGPT生成精妙的prompt,或者用Midjourney的私服学习其构图规律
当你亲手生成第一张高质量的AI图片时,那种成就感远不是在线工具能比的。你会发现,AI不是替代艺术家的工具,而是放大你创造力的画笔。现在,打开你的电脑,照着教程开始吧——如果遇到问题,评论区留言,或者搜索“Stable Diffusion 2026 常见问题”,总有一群热心的社区小伙伴在等你。
为了2026年更自由的创作,请勇敢地踏出第一步!
常见问题
为什么选择ComfyUI?
ComfyUI采用节点式工作流,你可以像搭乐高一样把text encoder、sampler、vae decoder串联起来。对于想要深度定制出图流程的用户(比如同时用多个ControlNet、叠加多个LoRA、动态调整seed),ComfyUI比WebUI更高效。2026年ComfyUI已经支持Stable Video Diffusion和Zero-1-to-3等新模型。
安装步骤
- 同样先克隆仓库:
bash git clone https://github.com/comfyanonymous/ComfyUI.git - 进入目录,创建虚拟环境(推荐):
bash cd ComfyUI python -m venv venv .\venv\Scripts\activate # Windows激活 - 安装依赖:
bash pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt - 运行:
bash python main.py访问http://127.0.0.1:8188即可。
加载第一个基础工作流
ComfyUI默认没有模型,你需要手动把下载的Checkpoint放到 ComfyUI/models/checkpoints/ 目录。然后从菜单栏“Load Default Workflow”加载一个txt2img工作流,双击空白处搜索“checkpoint”,把它连到模型节点,再选择采样器(如DPM++ 2M Karras),最后点击“Queue Prompt”生成。
WebUI vs ComfyUI:我该选哪个?
| 维度 | WebUI | ComfyUI | |------|-------|---------| | 易用性 | ★★★★★ | ★★★ | | 性能(显存占用) | 中等 | 更省显存 | | 插件生态 | 极其丰富 | 也有,但数量少 | | 工作流复用 | 每个生成是独立的 | 可保存/分享.wf文件 | | 适合人群 | 新手、快速出图 | 进阶玩家、自动化脚本用户 | 建议:先装WebUI上手,玩熟后再装ComfyUI。两者可以共存于同一台机器,共享同一套模型文件夹。
模型下载与安装:让你的SD真正“活”起来
模型分类与推荐网站
Stable Diffusion的模型主要分三类: - Checkpoint:基础模型,比如SD 1.5、SDXL、SDXL Turbo、Realistic Vision等 - LoRA:微调模块,大小几十MB,可以叠加使用,比如特定角色、画风、服装 - VAE:变分自编码器,影响色彩和细节,常用vae-ft-mse-840000 去哪里下载?首选 CivitAI(2026年已经称为AI模型界的GitHub),注册后可以下载各种模型。Hugging Face也是官方来源,但国内访问可能较慢。