[Qwen image lora] Zundamon (Tohoku Zunko Project) / ずんだもん（東北ずん子プロジェクト）

東北ずん子プロジェクトよりずんだの妖精ずんだもんです。
素材はすべて生成AIによる30枚の画像です。
Qwen-Imageは解像度1024で学習する場合、Vram24Gbに収まらないためブロックスワップを使わないといけなくなり、そのため非常に学習時間がかかってしまいました。
そこで解像度512ではどうかと思いテストをするためにデータセットを作りました。
600ステップを21分程度で完了でき、まぁまぁな出来になってるのではないかと思います。
問題はキャプションのほうで、トリガーワードに指定したものはあまり意味が無いというのは少し前のテストでわかっていたので彼女の名前はずんだもん（Her name is Zundamon）というものを最初に持ってきました。
結果として、これでもずんだもん（zundamon）というワードでは出てきませんでした。
初音ミクが走っていると入れれば出てくるぐらいになるにはどうすればいいのか、というテストを今後していきたいと思っています。
と言ってもおそらくQwen-Imageは主流になるとは思いませんので今後の次期モデルにも応用できそうな知見を発見できたらと考えています。

Description

Details

Files

training_data.zip

Mirrors

qwen_lora_zundamon_test01.safetensors

Mirrors