東北ずん子プロジェクトより ずんだの妖精 ずんだもん です。
素材はすべて生成AIによる30枚の画像です。
Qwen-Imageは解像度1024で学習する場合、Vram24Gbに収まらないためブロックスワップを使わないといけなくなり、そのため非常に学習時間がかかってしまいました。
そこで解像度512ではどうかと思いテストをするためにデータセットを作りました。
600ステップを21分程度で完了でき、まぁまぁな出来になってるのではないかと思います。
問題はキャプションのほうで、トリガーワードに指定したものはあまり意味が無いというのは少し前のテストでわかっていたので 彼女の名前はずんだもん(Her name is Zundamon) というものを最初に持ってきました。
結果として、これでも ずんだもん(zundamon) というワードでは出てきませんでした。
初音ミクが走っている と入れれば出てくるぐらいになるにはどうすればいいのか、というテストを今後していきたいと思っています。
と言ってもおそらくQwen-Imageは主流になるとは思いませんので今後の次期モデルにも応用できそうな知見を発見できたらと考えています。
Description
Details
Downloads
13
Platform
CivitAI
Platform Status
Deleted
Created
9/12/2025
Updated
9/18/2025
Deleted
9/12/2025
Trigger Words:
There is a girl with green hair and animal ears., She is wearing a white shirt, green suspender shorts and green shoes.
Files
training_data.zip
Mirrors
CivitAI (2 mirrors)
qwen_lora_zundamon_test01.safetensors
Mirrors
Huggingface (1 mirrors)
CivitAI (2 mirrors)