今朝ネットを見ていると、ローカルでも動画生成できる Wan2.1 なるものが
あることに気づきました。以前、animationdiff?など stable diffusion でも
GIFっぽい数秒の動画生成は出来るような記事は見ておりましたが、当時の私は
とてもそれを理解することは出来ず、放置しておりました。(今でも厳しいですが・・
私のアホ頭脳でもなんとか comfyUI は利用できているので、note等でわかりやすく
紹介してくださっていた有志の記事を見ながら設定すると、意外とあっさり動作。
・・・Wan 2.1 凄ぇ!!
Hunyuan も感動しましたが、あちらはテキストベースであり時折神動画も
生成されますが、正にガチャ状態ですし、生成にはそれなりに時間もかかるため
最近では放置気味でした。Wan2.1も2秒を超えてくると、1動画当たり20分を
超えてくるため、時間的には気軽に生成という状況ではありませんが、それでも
課金なしで、画像から動画生成できる点は素晴らしいです。
※有志ワークフローやGGUFなど諸々検討し、現在では内容により数分、長くとも
10分程度で、VGAサイズ程度であれば、5秒動画生成が可能に。
さらに、I2V + Lora 併用により画像さえあれば、夢のような動画生成が無限に。
6秒だと当方環境では1時間近くかかりますが、出来栄えは素晴らしいものでした。
fal.aiのように数分で生成完了し、画像サイズも問わず動きも素晴らしい動画と
比較すると Wan2.1 動画は子供騙しレベルではありますが、fal.ai は1動画当たり
0.3~0.4ドル飛んでいきますので、20ドル課金してもあっという間に無くなります。
Wan2.1はその点、時間さえかければローカルでも動きますので、そこが素晴らしい。
4090や5090構成パソコンのような、一般の方ではまず手が出せない機材ではなく
当方 4070 Ti SUPER 16G でもそれなりに動きますし、8ギガクラスでも動作が
可能という記事も見ましたので、当方の前環境である、数年前のゲーミングPCに
RTX 3060 12G 換装レベルでも、それなりに動くのではないでしょうか。
今までは、i2vなど画像から動画生成する場合、クラウド系有料サービスか、
ローカルだと最低でも4090クラスが必要な環境が多いように感じており、
現実的ではないと感じておりました。Hunyuan + comyUI は、あくまで txtベース、
Lora生成もあるようでしたが、私のアホ頭脳ではついていけず。
stable diffusion にて FLUX、SDXL、Lora活用し画像生成、comfyUI でFLUX など
上記利用し画像生成、その画像を元に fala.i 課金し、1枚画像からの動画生成も
並行利用して楽しむ毎日、そんな状況に一石を投じた Wan2.1 の衝撃。
昨今のAI進化レベルは凄いですね。夢が広がります、ほんとに。
某方AI動画。さすがに顔の一部をカット(笑)
以下、適当にWan2.1で生成。I2V生成が捗り過ぎて、昔の画像を引っ張り出して生成中。
1枚の画像さえあれば、CIVITAIで Wan video 検索、Lora活用しI2V生成を行えば、もう
なんでもありですね。1枚の画像さえあれば、好みの女性を巨乳に変え、ペニスを咥えさせ
満面の笑みで顔射やパイズリ、SEXし放題。妄想ワールドが今や目の前にあっさりと再現。
往年のグラビアアイドルがパイズリし、顔射される動画をローカル環境でこんな簡単に・・。
※簡単とはいえ、モノによっては stable diffusion + FLUX やSDXL を利用し、事前に
1枚画像を生成しておく必要はあります。動画で強引に生成することも出来ますが、
再現性が微妙です。1枚ベースとなるパイズリやSEX画像を生成しておけば、あとは
Wan2.1様の動画ガチャ次第ではありますが、夢のような動画が山ほど生成可能。


コメント