Stable diffusion小白入门学习教程：文生图教程讲解

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

Stable diffusion小白入门学习教程：文生图教程讲解

热心网友时间：2026-04-22

转载

Stable Diffusion小白入门：一文看懂文生图核心功能

欢迎回到《Stable Diffusion小白入门》系列。上回我们成功安装了软件，今天，咱们就深入它的核心功能——文生图界面，一步步拆解，让你也能轻松生成心仪的图片。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

先来看上面这张图，这就是Stable Diffusion的文生图主界面。整个界面布局清晰，大致可以划分为五个功能区域：

第一个区域是模型区。选择不同的模型，就等于选择了不同的画风和流派。简单来说，如果你加载的是一个二次元风格模型，那么最终生成的图片就会偏向动漫风格；如果用的是写实模型，出图效果就更接近真人照片。

以秋叶整合包自带的“anything-v5-PrtRE”模型为例，它就是一个典型的二次元模型。当你输入“1girl”这样的提示词，得到一张二次元女孩肖像的概率就非常大。

当然，Stable Diffusion的模型生态远比这复杂，除了主模型，还有VAE、LoRA等微调模型。不过别担心，这些进阶内容我们会在后续章节详细展开。

第二个关键区域是提示词区。想要AI画出你想要的画面，清晰、准确的提示词至关重要，其重要性不亚于模型选择。

提示词主要分两类：正向提示词和反向提示词。正向词描述你“想要什么”，比如“蓝天，白云，城堡”；反向词则声明你“不想要什么”，比如“模糊，多手指，畸变”。

如果你用的是原版WebUI，初期可能会对写提示词感到无从下手，因为需要自己搜集和组合关键词。

这也是为什么推荐新手使用秋叶整合包的原因之一——它贴心地内置了许多常用且分类好的提示词词典，鼠标点选即可添加，大大降低了上手门槛。

提示词还有更复杂的用法，比如通过英文括号`()`来调整不同词汇的权重。这部分内容我们同样会安排单独的文章进行详解。

第三个区域是参数调整区，这里的概念相对复杂一些，建议结合实操多尝试几遍，感受会更深刻。

3.1 采样方法：AI的“绘画手法”

要理解采样，得先简单了解Stable Diffusion的出图原理。它主要分为两步：

第一步是前向扩散，可以想象成把一滴墨水滴入清水，墨迹逐渐晕开、变淡，直到和水完全混为一体，变成看似随机的噪点图。

第二步是逆向扩散（去噪），AI根据你的文字描述，一步步从那张噪点图中“猜”出原本的图像，并清除噪点，最终形成清晰的画面。

这第二步的去噪过程就是“采样”，而采用的不同数学方法就是“采样方法”。你可以把它理解为AI不同的作画手法。

面对繁多的采样方法，新手容易困惑。根据常见的分类和社区经验，大致可以归纳为以下几类：

老式常微分采样：如Euler、Heun、LMS。特点简单、速度快，效果稳定，通常20-30步就能得到不错的结果。
祖先采样：如Euler a、DPM2 a。名字带“a”。这类方法随机性较强，旨在用较少步数产生多样化结果，但图片不“收敛”，即步数增加画面也不稳定，不适合需要复现相同画面的场景。
Karras采样：如LMS Karras、DPM2 Karras。这类方法前期噪点多，后期噪点少，有助于提升图像质量，建议步数设置在15步以上。
已过时采样：如DDIM和PLMS。社区普遍认为效果已落后于新方法，生成图片容易显得不自然。
DPM家族采样：这是最庞大的家族，包括DPM、DPM2、DPM++、DPM++ 2M等。DPM++ 2M在速度和质量上平衡较好；DPM++ SDE基于随机微分方程，和祖先采样一样不收敛。
UniPC采样：2023年发布的新方法，目前以速度快著称，能在较少步数内生成高质量图片。

如果看了还是选择困难，这里有几个实用的经验参考：