概要
https://www.techno-edge.net/article/2025/12/08/4761.html
詳細内容
## 音声から映像まで“ほぼAIで制作”。地上波テレビ番組AIタイムスリップ企画をどう作ったか(CloseBox)
https://www.techno-edge.net/article/2025/12/08/4761.html
筆者は、日本テレビの番組「沸騰ワード10」のAIタイムスリップ企画において、音声から映像まで「ほぼAI」で制作した舞台裏を詳細に解説しています。
**Content Type**: ⚙️ Tools
**Language**: ja
**Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:4/5
**Main Journal**: 80/100 | **Annex Potential**: 80/100 | **Overall**: 80/100
**Topics**: [[AI音声生成, AI動画生成, メディア制作ワークフロー, ボイスクローン技術, AIツール活用]]
テクノエッジのシニアエディターである松尾公也氏は、日本テレビのバラエティ番組「沸騰ワード10」のAI企画「AIの真骨頂!写真1枚で昭和へタイムスリップ!AI映像で蘇る!?」の制作にクリエーターとして関わった経験を共有しています。この約10分間のコーナーは、人間のナレーションとスタジオのリアクションを除き、基本的にAI生成によって作られました。筆者は「AI音声のプロ」として、登場人物や歴史上の人物の音声を、指定された脚本に基づいてAIで生成する役割を担いました。
音声生成には、AIスタートアップ「クリスタルメソッド」が開発中のボイスクローンTTS「Sakura Speech」を主に使用。このツールは、短い音声から声質や話し方を模倣し、自然な感情表現とクリアな音質、少ない読み間違いや不自然なイントネーションで高品質な音声を生成できる点が評価され、番組での採用に至りました。急なセリフ修正にもAIで迅速に対応できるため、タレントの貴重な時間を節約できるメリットが強調されています。アクセントや間の微調整には、Logic ProのFlex Pitchを活用し、話し言葉のピッチや音素ごとの長さ、音量を調整することで、より自然な仕上がりを実現しました。故・美空ひばりさんの16歳当時の声を再現する大役も担当し、参照音声の品質確保の重要性も指摘されています。
さらに筆者は、音声納品後に急遽、1950年代や1990年代を再現するAI映像制作も担当しました。画像生成にはMidjourney、動画生成にはNano Banana、Seedream 4.0、Sora 2 Pro、Grok Imagine、Kling 2.5、Hailuo Framesといった複数のAIツールを駆使し、数百本のクリップを制作。GrokのImage to Videoの速さやSora 2 Proの高い時代的解像度、日本語音声生成機能が特に評価されています。俳優の板垣李光人さんらを当時の若者集団に紛れ込ませるなど、本人らしさを維持しつつ時代感を出す難しさも語られています。
このプロジェクトは、AIツールが映像制作のワークフローに革新をもたらし、迅速な修正対応やクリエイティブな可能性(例:エキストラ的な音声やカメラワーク指示のAI生成)を広げることを実証しています。ウェブアプリケーションエンジニアの視点からは、多様なAIツールの連携とそれによる新たな生産プロセスの構築、そしてメディア制作におけるAIの具体的な能力と課題を理解する上で重要な事例となります。