概要
https://ascii.jp/elem/000/004/316/4316418/
詳細内容
## 動画生成AI「Wan2.2」の進化が凄い アリババが無料AIモデルの牽引者に
https://ascii.jp/elem/000/004/316/4316418/
アリババは、動画生成AI「Wan2.2」とその派生モデルをオープンソースとして提供し、精密なモーション制御やローカル実行を可能にすることで、AI動画生成の民主化を加速させます。
**Content Type**: ⚙️ Tools
**Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:3/5
**Main Journal**: 78/100 | **Annex Potential**: 77/100 | **Overall**: 76/100
**Topics**: [[動画生成AI, Alibaba Wan2.2, オープンソースAI, モーション制御, ローカルAI]]
アリババが動画生成AI分野で目覚ましい進展を見せ、最新モデル「Wan2.2」、派生モデル「Wan 2.2 Fun Control」、そして音声・画像からの動画生成に対応する「Wan2.2 S2V」を相次いでリリースしました。これらはいずれも高性能でありながらオープンモデルとして提供され、特に量子化モデルはローカルPCでの実行も可能である点が開発者にとって重要です。
「Wan 2.2 Fun Control」は、参照動画や画像を用いることで、ControlNet(Canny、Depth、OpenPose、Trajectory Control)を活用した極めて精密な動きの制御を実現します。これにより、キャラクター画像と参照動画から棒人間のようにポーズを抽出し、その動きを忠実に再現した動画を生成できます。既存の動画AIモデルでは困難だった、複雑なダンスや特定のアクションを高い精度でトレースできる点は画期的であり、クリエイティブな表現の幅を大きく広げます。
ローカル実行にはRTX 4090クラスのVRAM 24GB以上を推奨する高いスペックが求められますが、ComfyUIのワークフローや「LightX2V Lora」といった工夫により、一般のエンジニアでも先進的な動画生成AIを身近な環境で試せるようになります。「Sliding Context」のような手法を用いることで2分間の長尺動画生成も可能になり、WaveSpeedAIのようなクラウドサービスも登場し、高品質な動画生成へのアクセスがさらに容易になっています。
これにより、ウェブアプリケーションエンジニアは、動的なユーザーコンテンツ生成、インタラクティブなアニメーション、広告クリエイティブの自動生成など、これまで手の届かなかった領域でAIを活用する新たな可能性を獲得します。ただし、FunControlが一度に参照できる画像が1枚のみという制約は、キャラクターの一貫性維持において考慮すべき課題となります。アリババのこの動きは、高性能な動画生成AIがオープンソース化され、ローカル環境や手軽なクラウドサービスを通じて利用可能になることで、生成AIを活用した開発競争をさらに加速させるでしょう。