wan2.2 設定状況

先日のComfyUIアップデート以降、主に利用しているI2V動画生成ワークフローにおいて、初回は成功するものの、2回目以降はエラーを吐くかノイズ動画になり、再起動しない限り生成できない状況が続いておりました。

T2VやPetraVerkaik動画生成時は一切問題ないのですが、メインで利用する事が多いI2Vでこの状況だと流石にストレスなので、Geminiの力を借りて修正対策を試みました。

基本をしっかり把握して作成されている方からすると、開いた口が塞がらないレベルで私は生成していると思ってますし、とりあえず動けばいいという感じで我流で強引に調整し作成しているため参考にもならないとは思いますが、ご参考までに。


一点目:GGUFの変更

・GGUF Q4_K_M (4bit) → Q3_K_M (3bit)

以前Geminiで調べた際は Q4_K_M が最適解でしたが、I2Vの当方メインワークフローを現状のComfyUIで利用する場合は、Q3_K_Mが良さそうです。
※T2VやPetraVerkaikの場合は、従来通りQ4_K_Mで問題なし。

Q3_K_Mに変更すべき理由:

  • モデル本体: 約 9GB
  • 計算用ワークスペース (KV Cache): 数GB
  • テキスト理解 (CLIP/T5): 約 1GB〜2GB
  • 画像変換 (VAE): 約 2GB〜4GB
  • Windows OSの維持: 約 1GB

これらを合計すると 15GB〜17GB に達し、VRAM 16GBの限界を常に叩いています。モデルをQ3に下げることで本体が 5GB〜6GB 程度に縮小し、VRAM内に「計算のための余白」が生まれ、2回目以降のメモリ断片化によるエラー(2回目の呪い)を回避できるようになります。

比較項目 Q4_K_M (中精度) Q3_K_M (軽量精度) 決定的な差
VRAM占有量 約10.1 GB 約7.6 GB 約2.5GBの余裕
品質保持率 約95~97% 約90~95% 目視では判別困難
描画の細かさ 非常に細かい 僅かに質感が平坦 背景に僅かな差
エラー耐性 極めて低い 高い 安定性の鍵

ダウンロード先:
https://huggingface.co/QuantStack/Wan2.2-I2V-A14B-GGUF/tree/main


二点目:各種設定数値の調整

メモリ圧迫やノイズの原因となる部分を調整しました。一点目のGGUF変更が一番効果的でしたが、こちらも安定に寄与しています。

  • ComfyUI 各ノード生成途中の経過プレビューを停止
  • #50 アップスケール前サイズ: 448×672 → 384×672(計算量約15%削減)
  • #57 Kサンプラー設定:
    • ステップ: 8 → 12
    • CFG: 2.0 → 2.5
    • サンプラー名: euler → dpmpp_2m_sde
    • ステップ終了: 2 → 4(※#58のステップ開始も4へ変更)
  • #76 タイルサイズ: 256 → 128
  • #101 キャッシュ設定:
    • clear cache after n Frame: 100 → 20
    • ensemble: true → false
  • #107 出力サイズ: 640×960 → 576×1008(1.5倍かつ16の倍数)

【サンプラーの使い分け】
euler: 計算が速く、破綻を防ぐための定石。
dpmpp_2m_sde: ノイズ除去が丁寧で質感が向上するが、VRAM消費は増える。
※品質重視なら Steps 12 / CFG 2.5 あたりが常用推奨です。


結果:見事に安定しました

実際はGGUF変更、これに尽きると思います。以前はQ4_K_Mでも動いていましたし、初回なら長い動画もいけるのですが、I2Vの「2回目以降の失敗」にはこの余裕が必須でした。今後のアップデートで改善されるかもしれませんが、当面はこれでいきます。

上級者の方は1分近い動画やそれを超える数分単位、かつ複数の流れを盛り込んだ驚異的な動画を生成されていますが、私の頭ではとてもまだ理解できません。当面は、数秒~数十秒程度のエロ動画生成で自己満生活を送ります(笑)。理解するのに人の数倍かかるので、のんびり情報収集しながら楽しみます。

【当方のPC環境(2024年12月購入)】
CPU: Core-i7 14700F
メモリ: 96GB (DDR5 16Gx2 + 32Gx2)
GPU: GeForce RTX 4070 Ti SUPER (16GB)

メモリ高騰前に32GBx2枚を買っておいて本当に良かったです。16ギガx2枚で5万超とか・・。30年前のパソコンでメモリ買うような感覚に近いですかね。micronの撤退は流石に驚きましたが、ヤフコメで誰かつぶやいていた、日本メモリ産業の復権、期待したいですね。コンシューマによりそう部分からコツコツと積み重ね、昔世界を席巻した日本業界が復権する姿を見てみたいものです。


[おまけ]リソース

1. Civitai

2. Tits in Tops

wan2.2 現状動画

コメント

  1. より:

    workflowの配布はしていないですか?

    • blackheart blackheart より:

      civitaiにて公開している動画にはフロー込みが多いのですが、
      別途ファイル掲載しますね。
      元のworkflowはsebgau33さん動画より拝借した物であり、
      知識の無い当方が無理やり調整加えた部分もありますので、
      正しい内容では無くなっている部分もあると思います。
      ご希望ですので後ほどサイト内に追加しますが、出来れば
      他の優れたクリエイターの物を利用された方がよろしいかとは
      思います。。

タイトルとURLをコピーしました