三分钟快速掌握SD-Lora模型炼制入门教程

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI教程

三分钟快速掌握SD-Lora模型炼制入门教程

热心网友时间：2026-05-21

转载

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

在AI绘画创作中，利用Stable Diffusion（SD）模型结合Lora（低秩自适应）技术，已成为实现个性化模型定制的高效方案。相较于耗费巨大资源从头训练完整模型，Lora通过对预训练大模型进行轻量级微调，能显著降低计算成本与时间，同时确保生成作品的质量与独特性。

然而，Lora模型的炼制流程包含多个关键概念与步骤。为便于深入理解，我们将分为上下两篇进行讲解。本篇将重点介绍炼制前的必备准备、核心参数配置，以及决定模型成败的“打标签”核心环节。

炼制Lora模型如同建筑，扎实的前期准备是成功的关键。此阶段需重点关注数据集、模式与内容筛选。

数据集准备： 首先明确炼制目标。确定所需风格后，选择对应的模型架构（SD 1.5 或 SDXL），并将所有参考图片统一处理为该架构推荐的分辨率。这是保证训练一致性与效果稳定的前提。

模式选择： 以常见的在线训练平台（如Liblib.AI）为例，平台通常提供多种预设模式，例如“自定义”、“XL”、“人像”、“ACG”、“画风”等。不同模式不仅会默认调用不同的基础模型，其推荐的提示词模板及所需的数据集图片数量也存在差异。

综合来看，针对不同炼制目标，所需的图片数量参考范围如下：

其中，“ACG”模式的需求量与“画风”模式大致相同。

内容选择： 参考图的挑选至关重要。应尽可能覆盖目标主体的多维度特征，以确保模型学习的全面性。以炼制人物角色Lora为例，你的图片集合应包含：

此外，包含不同光照条件与背景场景的高清图片，能极大提升模型的环境理解与泛化能力。

材料备齐后，下一步是调整决定“炼制火候”的关键参数。主要包括底模选择、训练参数配置以及预览提示词设定。

底模选择： Lora需要在某个大模型（即Checkpoint或底模）的基础上进行微调。当前主流选择是SD1.5和SDXL两大系列。SDXL通常在画面细节、光影质感方面表现更优；而SD1.5系列生态成熟，插件支持广泛。至于新发布的SD3，因其周边工具链尚在发展，本次暂不讨论。

若能找到与炼制目标高度契合的专用底模，效果会事半功倍。例如，炼制3D图标风格，可优先考虑BDicon或DDicon等模型。若无直接匹配的，使用SD1.5或SDXL的通用基础模型作为起点也是稳妥的选择。

参数选择： 训练参数分为基础与高级两类。对于大多数应用场景，调整好基础参数中的“单张重复次数（Repeat）”和“训练轮次（Epoch）”即可。

Repeat值越高，模型对单张图片的学习就越深刻，但过高的值极易导致“过拟合”——模型僵化地记住了训练图片的细节，丧失了创造与泛化能力，同时也会增加不必要的算力消耗与时间成本。常规的参数建议范围是：

模型效果预览提示词： 在训练设置中，填写一组你期望生成的、相对简洁的正向提示词（Prompt）。训练过程中，平台将使用这组提示词配合正在炼制的Lora实时生成预览图。这些预览图是监控训练进程是否正常的重要依据。若预览图能稳定呈现数据集特征且画面协调，通常表明训练方向正确。

图片上传后，便进入最核心的环节——打标签。此环节需设置裁剪方式、分辨率、打标算法、阈值，并编写至关重要的“模型触发词”。其中，裁剪方式与打标阈值通常保持默认即可，裁剪分辨率需符合所选底模的要求。

触发词的核心作用： 触发词是调用Lora模型效果的“钥匙”。编写得当，它能精准激活你炼制的风格；编写不当，模型可能无法被有效触发，导致效果不佳。

1. 触发词的编写策略

打标时，系统会以你设定的触发词作为前缀，自动为图片中的其他元素添加描述性标签。

2. 打标签的黄金法则

这是决定Lora模型炼制成功与否的核心原则，必须深刻理解：

标注“变量”，忽略“常量”： 只给图片中会发生变化的特征打标签。例如，炼制某个特定人物的Lora，该人物更换的不同服装（变量）需要标注。而人物固有的、不变的特征，如“蓝色眼睛”、“特定脸型”（常量），则绝对不要标注。
模型的学习逻辑： 通过这种方式，模型会自主学会将你设定的触发词（如“my_char”）与那些未被标注的固有特征关联起来。它将自行领悟：“只要出现触发词‘my_char’，就代表这个角色拥有蓝色眼睛和特定脸型”。
核心要诀： 未标注即身份。 所有你没有特意打上标签的特征，都会被模型默认为该触发词所代表对象的、不可分割的独特身份标识。