Midjourney好用但要付费,而且风格受限。Stable Diffusion可以本地运行,完全免费,而且可以训练自己的风格。本文教你从零搭建。
一、硬件要求
| 配置 | 最低要求 | 推荐配置 |
|---|---|---|
| 显卡 | GTX 1060 6GB | RTX 4070 12GB以上 |
| 内存 | 16GB | 32GB |
| 硬盘 | 50GB SSD | 200GB NVMe SSD |
| 系统 | Windows 10/11 | Windows 11 / Ubuntu |
二、安装步骤
方式1:ComfyUI(推荐)
# 克隆仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
# 安装依赖
pip install -r requirements.txt
# 启动
python main.py
方式2:WebUI(AUTOMATIC1111)
# 克隆仓库
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
# 启动(Windows)
webui-user.bat
三、模型下载
基础模型
- SDXL 1.0:通用模型,质量最高
- SD 1.5:经典模型,LoRA最多
- Pony:动漫风格专用
- DreamShaper:写实风格专用
下载地址
- Civitai(civitai.com):最大的SD模型社区
- Hugging Face(huggingface.co):官方模型仓库
四、LoRA使用
LoRA是轻量级的风格/角色微调模型,可以让你的SD生成特定风格的图片。
安装LoRA
- 从Civitai下载LoRA文件(.safetensors格式)
- 放到
ComfyUI/models/loras/目录 - 在工作流中加载LoRA节点
推荐LoRA
- Detail Tweaker:增加细节
- Add More Details:增加画面丰富度
- Watercolor Style:水彩画风格
- Cyberpunk Style:赛博朋克风格
五、ComfyUI工作流
基础文生图工作流
节点连接:
Load Checkpoint → CLIP Text Encode (正向) → KSampler → VAE Decode → Save Image
→ CLIP Text Encode (负向) ↗
图生图工作流
节点连接:
Load Image → VAE Encode → KSampler → VAE Decode → Save Image
Load Checkpoint → CLIP Text Encode ↗
六、常见问题
Q: 显存不够怎么办?
A: 1) 使用SD而不是SDXL 2) 降低分辨率 3) 启用--lowvram参数 4) 使用云GPU
A: 1) 使用SD而不是SDXL 2) 降低分辨率 3) 启用--lowvram参数 4) 使用云GPU
Q: 生成的图片质量不好?
A: 1) 使用更好的基础模型 2) 优化Prompt 3) 添加LoRA 4) 调整采样步数和CFG
A: 1) 使用更好的基础模型 2) 优化Prompt 3) 添加LoRA 4) 调整采样步数和CFG
七、总结
SD vs Midjourney:
Midjourney:简单易用,质量高,但要付费且风格受限
Stable Diffusion:免费无限,风格自由,但需要学习成本
建议:先用Midjourney入门,再用SD做深度创作
Midjourney:简单易用,质量高,但要付费且风格受限
Stable Diffusion:免费无限,风格自由,但需要学习成本
建议:先用Midjourney入门,再用SD做深度创作