Stable Diffusion新手入门指南
Stable Diffusion是目前最受欢迎的开源AI图像生成模型,可以根据文字描述创造出高质量的图片。掌握基本使用方法后,你就能轻松生成各种风格的艺术作品、插图和概念图。
- 选择合适的运行平台. 访问Hugging Face Spaces或使用Google Colab在线运行Stable Diffusion。如果你有NVIDIA显卡(显存4GB以上),可以下载AUTOMATIC1111 WebUI在本地安装。在线平台适合初学者,本地安装运行速度更快但需要一定技术基础。
- 学习基础提示词语法. 提示词决定生成图片的内容和风格。使用英文描述你想要的画面,多个关键词用逗号分隔。在关键词后加权重数字如(keyword:1.2)来增强效果,使用[keyword]来减弱影响。负面提示词用于排除不想要的元素。
- 设置图片参数. 在参数面板中设置图片尺寸,新手建议使用512x512像素。Steps(采样步数)设置为20-30即可获得良好效果,数值过高会增加生成时间但改善有限。CFG Scale设置为7-12,控制AI对提示词的遵循程度。
- 选择合适的采样器. 在Sampling method下拉菜单中选择采样器。DPM++ 2M Karras和Euler a是最常用的选择,前者质量更高,后者速度更快。不同采样器会产生不同的画面风格,可以多尝试找到喜欢的效果。
- 编写有效的提示词. 先描述主体对象,然后添加环境背景、光照效果、艺术风格等。使用具体的形容词而不是模糊描述,比如用"golden hour lighting"代替"beautiful light"。学习常用的质量提升词汇如"highly detailed"、"8k"、"masterpiece"。
- 生成并优化图片. 点击Generate按钮开始生成图片。如果结果不满意,调整提示词权重或修改负面提示词。使用Seed值可以重现相同的图片构图,然后微调其他参数。批量生成多张图片可以获得更多选择。
- 使用高级功能. 尝试img2img功能将现有图片作为参考进行重绘。使用Inpainting功能修改图片的特定区域。探索ControlNet扩展来精确控制构图和姿态。下载社区制作的LoRA模型来生成特定角色或风格。