Stable Diffusion新手入门指南

Stable Diffusion是目前最受欢迎的开源AI图像生成模型，可以根据文字描述创造出高质量的图片。掌握基本使用方法后，你就能轻松生成各种风格的艺术作品、插图和概念图。

选择合适的运行平台. 访问Hugging Face Spaces或使用Google Colab在线运行Stable Diffusion。如果你有NVIDIA显卡（显存4GB以上），可以下载AUTOMATIC1111 WebUI在本地安装。在线平台适合初学者，本地安装运行速度更快但需要一定技术基础。
学习基础提示词语法. 提示词决定生成图片的内容和风格。使用英文描述你想要的画面，多个关键词用逗号分隔。在关键词后加权重数字如(keyword:1.2)来增强效果，使用[keyword]来减弱影响。负面提示词用于排除不想要的元素。
设置图片参数. 在参数面板中设置图片尺寸，新手建议使用512x512像素。Steps（采样步数）设置为20-30即可获得良好效果，数值过高会增加生成时间但改善有限。CFG Scale设置为7-12，控制AI对提示词的遵循程度。
选择合适的采样器. 在Sampling method下拉菜单中选择采样器。DPM++ 2M Karras和Euler a是最常用的选择，前者质量更高，后者速度更快。不同采样器会产生不同的画面风格，可以多尝试找到喜欢的效果。
编写有效的提示词. 先描述主体对象，然后添加环境背景、光照效果、艺术风格等。使用具体的形容词而不是模糊描述，比如用"golden hour lighting"代替"beautiful light"。学习常用的质量提升词汇如"highly detailed"、"8k"、"masterpiece"。
生成并优化图片. 点击Generate按钮开始生成图片。如果结果不满意，调整提示词权重或修改负面提示词。使用Seed值可以重现相同的图片构图，然后微调其他参数。批量生成多张图片可以获得更多选择。
使用高级功能. 尝试img2img功能将现有图片作为参考进行重绘。使用Inpainting功能修改图片的特定区域。探索ControlNet扩展来精确控制构图和姿态。下载社区制作的LoRA模型来生成特定角色或风格。