训练笔记:
素材共78张,风格很特殊的素材要去掉,先裁成正方形,再用sd web ui放缩到768*768像素,如果过宽或者过长就裁成多张,如果原图比较高清,也裁成多张。和主体物无关的尽量裁掉。
打标,去掉特征描述(你需要的特征),补全画面未识别的大块物件和背景,这两点比较关键,固定一个引导词在顶部,其余在训练时打乱。也可以花更多时间精细打标,但是我不是很细。
训练参数没怎么调整,
Unet 0.0001 Text encoder lr 0.00001 Batch size 5 Network Rank Dim 128 Network Alpha 64
Repeat 10 Epoch 20 保留第一个标签其余打乱
其它参数都是默认的。
使用笔记:
这个lora基于:indigoFurryMix_v115Anime(32fp),用sd1.5训练效果似乎不好。
CLIP 终止层数1
无vae
采样方法 (Sampler):DPM++SDE Karras和Euler a(畸形率比较高)其余没怎么测过,高步数的退火Restart似乎效果不好,在之前的那个lora是这样的。
步数70左右效果可以,步数再高的话,DPM++SDE Karras,细节会好一点点
提示词引导系数 (CFG Scale)在4-5.5附近比较好
lora权重在0.9附近都行
其它更详细的没空测了,我还有不少疑惑。
版本区别:
按训练轮次有14,15,16,17,18,19,20一共7个版本,数字越大拟合越多,这7个版本效果都及格。
我个人认为18版的拟合效果最好,但我测试的不够,请自行判断。
其它:
懒得翻译了。不好意思。
第一次训练lora,其实我的数据集处理是过关的,根本不需要调什么参数,但是因为我一开始测试方法不太对,折腾了很久。
模型测试也考验眼力,再者就是大量时间。
在云端训练的,不然一批5张顶不住。
ai更新换代那么快,sd1.5该盖棺入坟了吧,细节理解真不到位,本身我也用sd用了一段时间。
其实我有一点点美术基础。
如果有其他问题也别问我,我也不知道,上面的经验全部仅供参考。
Description
Looks like we don't have an active mirror for this one right now.
This archive is kept alive by community contributions, so there are still some gaps, especially for newly removed content.
Some files do get recovered over time through contributions. If you're looking for this one, feel free to ask in Discord, or help preserve it if you have a copy.
