掲載済み (2025-08-30号)
#215 409文字 • 3分

## 筋トレのお手本動画をLLMで生成したい -Sora, Veo, Kling, Seedance, Wan を比べてみた-

掲載情報

概要

https://zenn.dev/tomo25/articles/167fec10e30d6c

詳細内容

## 筋トレのお手本動画をLLMで生成したい -Sora, Veo, Kling, Seedance, Wan を比べてみた- https://zenn.dev/tomo25/articles/167fec10e30d6c 主要な動画生成LLMを比較検証し、筋トレのお手本動画作成における現在の限界と実用化への課題を明らかにした。 **Content Type**: 🔬 Research & Analysis **Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:3/5 | Anti-Hype:5/5 **Main Journal**: 80/100 | **Annex Potential**: 81/100 | **Overall**: 80/100 **Topics**: [[動画生成AI, LLM応用, AIモデル比較, ヒューマンモーション生成, 開発者ワークフロー改善]] 筆者は、筋トレメニューの未知の種目を調べる手間を省くため、動画生成AIによる解説動画作成の可能性を検証した。Google Veo 3, Kling AI, Bytedance Seedance, OpenAI Sora, Alibaba Wan2.2 Plusといった主要モデルを対象に、「Walking Lunges」と「Single Arm Kettlebell Hang Clean」のデモンストレーション動画生成を試み、モーション品質、プロンプト追従性、美的品質に加え、特に「ワークアウト品質(正しいフォーム)」を評価した点が重要だ。 結果として、Google Veo 3が映像のリアリティと美しさでは他を圧倒したものの、どのモデルも正確なフォームの再現には失敗。Walking Lungesが歩行動作を伴わず、Kettlebell Hang Cleanが不自然な動きになるなど、基本的な運動でも誤った解釈が見られた。特に、AI特有の重力や物体の変形、不自然な体の動きが散見され、現状では実用的な筋トレのお手本動画を生成するには至らないことが明確になった。 この分析は、単にAIの限界を示すだけでなく、生成AIを物理世界や精密な人間動作に応用する際の根深い課題を浮き彫りにする。美しい映像を生成できても、その背後にある物理法則や目的とする動作の意味を正確に捉え、一貫して再現する能力が決定的に不足している。webアプリケーションエンジニアとしては、見た目の派手さに惑わされず、AIが生成するコンテンツの「内容の正確性」や「実世界での適用性」を厳しく評価する必要があることを示唆している。今後の展望として、詳細なコンテキストの付与や既存動画の参照による精度向上が期待されるが、現状では正しいフォームを学ぶにはYouTubeなどの人間が監修したリソースに頼るべきという、手堅い結論が示された。これは、生成AIの現状と向き合う上で非常に実践的な知見だ。