ausen - CivArchive (CivitAI Archive)

训练笔记：

素材共78张，风格很特殊的素材要去掉，先裁成正方形，再用sd web ui放缩到768*768像素，如果过宽或者过长就裁成多张，如果原图比较高清，也裁成多张。和主体物无关的尽量裁掉。

打标，去掉特征描述（你需要的特征），补全画面未识别的大块物件和背景，这两点比较关键，固定一个引导词在顶部，其余在训练时打乱。也可以花更多时间精细打标，但是我不是很细。

训练参数没怎么调整，

Unet 0.0001 Text encoder lr 0.00001 Batch size 5 Network Rank Dim 128 Network Alpha 64

Repeat 10 Epoch 20 保留第一个标签其余打乱

其它参数都是默认的。

使用笔记：

这个lora基于：indigoFurryMix_v115Anime（32fp），用sd1.5训练效果似乎不好。

CLIP 终止层数1

无vae

采样方法 (Sampler)：DPM++SDE Karras和Euler a（畸形率比较高）其余没怎么测过，高步数的退火Restart似乎效果不好，在之前的那个lora是这样的。

步数70左右效果可以，步数再高的话，DPM++SDE Karras，细节会好一点点

提示词引导系数 (CFG Scale)在4-5.5附近比较好

lora权重在0.9附近都行

其它更详细的没空测了，我还有不少疑惑。

版本区别：

按训练轮次有14,15,16,17,18,19,20一共7个版本，数字越大拟合越多，这7个版本效果都及格。

我个人认为18版的拟合效果最好，但我测试的不够，请自行判断。

其它：

懒得翻译了。不好意思。

第一次训练lora，其实我的数据集处理是过关的，根本不需要调什么参数，但是因为我一开始测试方法不太对，折腾了很久。

模型测试也考验眼力，再者就是大量时间。

在云端训练的，不然一批5张顶不住。

ai更新换代那么快，sd1.5该盖棺入坟了吧，细节理解真不到位，本身我也用sd用了一段时间。

其实我有一点点美术基础。

如果有其他问题也别问我，我也不知道，上面的经验全部仅供参考。

Description