LiblibAI模型训练教程:从零开始训练自己的模型
在LiblibAI平台进行LoRA模型训练时,数据准备是首要且不可回避的环节。虽然步骤看似简单——准备20到50张同主题的正方形图片,裁剪为768×768或1024×1024分辨率,文件名采用半角数字加下划线加英文单词,标签用半角逗号分隔并支持加权——但每一步出错都会导致后续训练难以推进。许多用户在
在LiblibAI平台进行LoRA模型训练时,数据准备是首要且不可回避的环节。虽然步骤看似简单——准备20到50张同主题的正方形图片,裁剪为768×768或1024×1024分辨率,文件名采用半角数字加下划线加英文单词,标签用半角逗号分隔并支持加权——但每一步出错都会导致后续训练难以推进。许多用户在上传数据后遭遇“标签格式错误”提示,或在训练中途发现loss突然飙升到inf,这通常并非平台故障,而是因为文件名中混入了中文标点、分辨率与底模要求不匹配,或关键参数组合触发了隐性冲突。

准备训练数据集
第一步:收集20到50张主题一致、风格统一的方形图片。例如,若要训练水墨人物肖像,则全部素材应为水墨人物,避免混入现代插画或风景照片。若素材不足20张,后续需适当调高Repeat值,以补偿特征学习强度的不足。
第二步:使用Photoshop或XnConvert等工具,将所有图片裁剪为严格的正方形。分辨率仅支持768×768或1024×1024——注意,平台不会自动校验长宽比,非等比拉伸的图片一旦进入训练流程,生成的LoRA模型很可能出现形变。
第三步:文件重命名必须遵循半角数字加下划线加英文描述词的格式。例如 01_ink_wash_scholar.jpg。禁止使用空格、中文括号、顿号、冒号等符号,即使“01-水墨人物.jpg”这类带短横线的命名也会被判定为非法。注意,平台对文件名的校验极为严格,半角符号是硬性要求。
第四步:标注标签时使用英文逗号分隔关键词,并可对核心词进行加权,例如 (ink_wash:1.3), scholar, soft_brush, white_space。所有标点必须为半角字符,若出现全角逗号,整个标签将解析失败。手动编辑标签时尤其容易忽略此细节。
选择底模与基础参数
方法一:进入“赛博丹炉”界面,点击左侧“训练LoRA”,在底模列表中根据用途选择:
- 人像/ACG类内容选用SD1.5;
- 写实场景、建筑、产品图选用SDXL;
- PVC、金属、玻璃等材质表现选用Foundation1.0。
方法二:在简易参数面板中,“单次张数”保持默认值15,“循环轮次”设为8,“模型效果预览提示词”必须包含所设定的触发词。例如 ink_wash, scholar figure——若遗漏触发词,即使训练完成也无法正常调用,等于徒劳无功。
最后,务必关闭“混合精度训练”开关。此步骤不可跳过。LiblibAI的云端环境启用该选项后,极易出现NaN Loss,训练通常在第3至第5轮突然中断,日志中仅显示一行“loss=nan”,无其他错误提示。关闭该开关,能节省大量重新训练的时间。
调整高级参数止血
点击“高级参数”展开面板,需关注以下四个关键点:
第一,将Repeat设为5至8。若素材不超过20张,建议取7或8。Repeat值过低会导致特征学习不充分,过高则容易过拟合。
第二,Epoch先尝试5和8两个值。切勿直接设为12——轮次过多,在小数据集上反而容易引发过拟合,生成的图像细节会变得一塌糊涂。
第三,学习率填写3e-4(风格类)或4e-4(角色类),调度策略必须选择“cosine with warmup”。固定学习率会导致前期震荡严重、后期收敛缓慢,训练效果大打折扣。
第四,Batch Size与梯度累积的乘积需控制在8至12之间。平台分配A10显卡(24GB)时,Batch Size设为2,梯度累积设为4;若为V100(32GB),Batch Size设为3,梯度累积设为3。乘积低于8会导致模型学不牢固,高于12则显存溢出风险大增,可能直接导致训练进程崩溃。
上传与启动训练
将处理好的图片拖入右侧“图片/数据处理”区域,系统将自动执行裁剪与标签解析。请观察每张图片下方是否显示绿色对勾,标签文字是否清晰可读——这表示前置校验已通过。
检查左侧面板所有参数,确保没有红色警告图标。尤其注意两点:确认“触发词”已填入预览提示词框;确认混合精度处于关闭状态。
点击“开始训练”,页面将跳转至实时监控页面。正常情况下,loss曲线在前100步内从2.x快速下降至1.x,200步后稳定在0.25至0.4之间波动。观察到这一走势后,即可放心离开,无需一直盯着进度条。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:LiblibAI模型训练教程:从零开始训练自己的模型要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点GoogleMeet是面向商业与企业的视频会议服务,支持屏幕共享、实时字幕及与GoogleWorkspace集成,适用于项目讨论、网络研讨和线上教学等多种会议场景,具备扎实的安全与隐私保护。
Lanter是Chrome扩展,利用AI将YouTube视频语音转为带时间戳的文字笔记,支持一键抓取高光、自动标点排版、书签管理、全局搜索及每日邮件汇总,方便高效回顾视频关键内容。
一款AI驱动的Chrome扩展音频笔记应用,支持录音自动转文字、标签分类与全文搜索,将语音转化为可检索的数字资产,显著提升信息定位与管理效率。
专为GoogleMeet设计的AIChrome扩展,实时转录会议内容,自动生成摘要并提取行动项与决策,无缝同步至Google文档、任务及Gmail,省去手动整理时间,显著提升协作效率。
- 日榜
- 周榜
- 月榜
热点快看
