一、引言:为什么2026年Stable Diffusion仍是AI绘画之王?
2026年,AI绘画已从新奇玩具演变为生产力工具。在Midjourney、DALL·E 4等闭源商业产品群雄逐鹿的时代,**Stable Diffusion(简称SD)**依然稳坐开源AI绘画领域的头把交椅。原因很简单:它完全免费、本地运行、无限生成、高度可定制。
无论你是设计师想快速产出概念图,还是自媒体创作者需要配图素材,亦或是纯粹的AI技术爱好者,掌握Stable Diffusion都是一项极有价值的技能。本文将从零开始,带你走完SD下载安装、硬件配置、界面操作、模型选择、提示词技巧的完整学习路径。
二、Stable Diffusion基础
2.1 SD是什么?
Stable Diffusion是由Stability AI开发的开源文生图扩散模型。用户输入文字描述(Prompt),SD就能生成对应的图片。2022年发布至今,经历了从SD 1.5到SDXL再到SD3的多次重大迭代。
版本简史:
- SD 1.5(2022年):经典版本,社区生态最丰富,至今仍被广泛使用。
- SDXL 1.0(2023年):分辨率跃升至1024×1024,画面质量和构图能力大幅提升。
- SD3(2024-2025年):引入MMDiT架构,文字渲染和复杂指令理解能力飞跃,支持多模态生成。
- SD3.5(2025年):进一步优化,支持多种尺寸变体,是2026年的主流推荐版本。
2.2 SD vs Midjourney vs DALL·E
| 维度 | Stable Diffusion | Midjourney | DALL·E |
|---|---|---|---|
| 费用 | 完全免费 | $10-60/月 | 按量付费 |
| 运行方式 | 本地部署/云端 | 仅云端(Discord) | 仅云端 |
| 可控性 | 极高(ControlNet/LoRA等) | 中等 | 较低 |
| 隐私性 | 完全本地 | 图片上传云端 | 图片上传云端 |
| NSFW支持 | 取决于模型 | 严格限制 | 严格限制 |
| 上手难度 | 中等 | 低 | 低 |
结论:追求自由度、隐私和零成本选SD;追求极致画质和便捷上手选Midjourney。两者并不冲突,很多专业用户会结合使用。
三、安装教程
3.1 Windows一键安装(Automatic1111 WebUI)
Automatic1111 WebUI是目前最流行的SD图形界面,功能全面、插件丰富。
安装步骤:
- 安装Python 3.10.6(勾选”Add Python to PATH”)
- 安装Git
- 下载Automatic1111整合包:打开命令行,执行:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui - 将下载好的SD模型文件放入
models/Stable-diffusion/目录 - 双击运行
webui-user.bat,等待自动安装依赖并启动 - 浏览器打开
http://127.0.0.1:7860即可使用
对于零基础用户,推荐去B站搜索”秋叶SD整合包”,有完整的一键解压即用方案,内置常用模型和插件,省去配置繁琐步骤。
3.2 Mac M芯片安装方案
Apple Silicon Mac同样可以运行SD,推荐使用Draw Things(App Store免费下载)或Mochi Diffusion(GitHub开源)。性能方面,M2/M3芯片约相当于RTX 2060水平,生成速度可以接受。
3.3 Google Colab免费云端方案
没有好显卡?Google Colab提供免费GPU资源:
- 打开浏览器访问Colab
- 搜索”Stable Diffusion WebUI Colab”笔记本
- 点击”连接到云端GPU运行时”
- 依次运行代码单元格,自动安装并启动WebUI
- 通过生成的Gradio链接访问界面
免费版每日有使用时长限制,长期使用建议升级Colab Pro($9.99/月,更好的GPU资源)。
3.4 常见安装报错解决方案
- “CUDA out of memory”:显存不足,尝试添加
--medvram或--lowvram启动参数 - “No module named xxx”:依赖安装不完整,删除venv文件夹后重新运行
- 启动闪退:检查Python版本必须是3.10.6,路径不能包含中文或空格
四、硬件配置推荐
4.1 三档配置方案
| 档位 | 显卡 | 显存 | 内存 | 适合场景 |
|---|---|---|---|---|
| 最低配 | GTX 1060 6GB | 4GB+ | 16GB | 512×512小图,入门体验 |
| 中配 | RTX 3060 12GB | 8GB+ | 16GB | 1024×1024常规创作 |
| 推荐配 | RTX 4070Ti 12GB+ | 12GB+ | 32GB | 高清大图、视频生成 |
| 高配 | RTX 4090 24GB | 24GB | 64GB | 专业级创作,训练模型 |
AMD显卡也可以,但需要使用DirectML或ROCm后端,性能和兼容性不如NVIDIA。纯CPU也能跑,但生成一张图可能需要几分钟甚至更久,不推荐。
4.2 云端GPU方案性价比对比
没有独立显卡的用户,云端GPU方案是最佳选择:
- Google Colab:免费额度有限,Pro版$9.99/月,提供T4 GPU
- AutoDL:国内云GPU,按量计费,RTX 3090约1.5元/小时
- 揽睿星舟:国内SD专用云平台,预装环境,即开即用
- Stable Diffusion网页版:如海艺AI、LiblibAI等,每天赠送免费额度
五、界面操作入门
5.1 txt2img(文生图)操作指南
打开WebUI后,默认进入txt2img界面。操作流程非常简单:
- 在左上角Stable Diffusion checkpoint下拉框选择模型
- 在第一个文本框中输入正面提示词(想要的内容)
- 在第二个文本框中输入负面提示词(不想要的内容)
- 设置生成参数(分辨率、步数等)
- 点击右上角Generate按钮
5.2 img2img(图生图)操作指南
img2img可以根据已有图片和提示词生成新图片,常用于风格转换、图片优化等场景:
- 切换到img2img标签页
- 上传参考图片
- 输入提示词描述你想要的改变
- 调整Denoising strength(降噪强度):0.3-0.5保留原图结构,0.6-0.8大幅改变
- 点击生成
5.3 核心参数解析
- CFG Scale(提示词引导强度):控制AI遵循提示词的程度。推荐值5-7,太低画面随机、太高画面对比过度。
- Sampling Steps(采样步数):迭代次数,20-30步即可获得不错效果,更多步数边际效益递减。
- Sampler(采样器):推荐使用DPM++ 2M Karras或Euler a,速度快且效果好。
- Seed(随机种子):相同种子+相同提示词产生相同图片,设为-1表示随机。
六、模型选择指南
6.1 基础模型推荐
模型是SD的灵魂,不同模型画风截然不同:
- 写实模型:ChilloutMix、Realistic Vision、majicMIX realistic —— 适合真人风格
- 二次元模型:Anything V5、Counterfeit、MeinaMix —— 适合动漫插画
- 建筑/场景:ArchitectureRealMix、Realistic Stock Photo
- 通用推荐:SDXL Base、Juggernaut XL —— 综合素质优秀
模型文件放在 models/Stable-diffusion/ 目录下,WebUI会自动识别,刷新即可在界面中切换。
6.2 LoRA模型使用
LoRA是一种轻量级微调技术,可以给基础模型添加特定角色、画风或概念。比如想生成特定动漫角色,只需下载对应的LoRA文件放入 models/Lora/ 目录,然后在提示词中加入 <lora:角色名:0.8> 即可触发。
6.3 Civitai模型下载
Civitai(civitai.com)是全球最大的SD模型分享社区,拥有数万个免费模型。你可以按下载量排序筛选高质量模型,也可以查看其他用户上传的效果图来判断模型是否适合自己。国内用户也可访问LiblibAI(liblib.art),中文界面更友好。
推荐阅读: ComfyUI教程 — 如果你已经熟悉WebUI,ComfyUI的节点式工作流能带来更高的创作自由度和效率。
七、提示词技巧
7.1 正面提示词万能公式
[画质关键词] + [主体描述] + [环境/场景] + [风格/艺术家] + [光照/色彩] + [构图/视角]
示例:
masterpiece, best quality, 1girl, long black hair, sitting in a cozy coffee shop, warm afternoon sunlight through window, soft bokeh background, detailed eyes, film grain, depth of field, 8k
7.2 负面提示词模板(直接复制使用)
(worst quality, low quality:1.4), blurry, bad anatomy, extra fingers, missing fingers, deformed hands, ugly face, disfigured, poorly drawn, mutation, watermark, signature, text, extra limbs, jpeg artifacts, lowres, bad proportions, cartoon, 3d
7.3 画质提升关键词
在所有提示词最前面加上以下组合,能显著提升画面质量:
- masterpiece, best quality —— 最常用的画质咒语
- ultra high res, 8k, photorealistic —— 超高清写实
- intricate details, sharp focus —— 精致细节、锐利焦点
- professional lighting, cinematic —— 专业布光、电影感
- trending on ArtStation —— 偏艺术站插画风格
中文提示词现已被大部分模型支持,但英文提示词的精准度和效果仍优于中文,建议优先使用英文撰写。
八、总结
Stable Diffusion从一个极客玩具成长为全民创作工具,只用了短短四年。2026年,SD的生态已经极其成熟:一键安装包降低了上手门槛,Civitai/ LiblibAI等社区提供了海量免费模型,ControlNet/IP-Adapter等插件赋予了精细控制能力。
学习SD的最好方式就是动手实操——下载安装、找几张参考图、尝试不同的模型和提示词。AI绘画的核心不是技术有多深,而是你的创意有多广。
继续探索: 如果你想了解更进阶的AI工具,可以阅读我们准备的 AI绘画免费App推荐、2026年十大免费AI工具推荐 以及 AI视频生成工具评测,让AI全面赋能你的创作流程。