## 高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開

概要

https://gigazine.net/news/20251128-alibaba-z-image/

詳細内容

## 高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開 https://gigazine.net/news/20251128-alibaba-z-image/ Alibabaの研究者が、リアリティのある高品質な画像を高速生成できるAIモデル「Z-Image(造相)」を開発しました。 **Content Type**: News & Announcements **Language**: ja **Scores**: Signal:5/5 | Depth:3/5 | Unique:3/5 | Practical:4/5 | Anti-Hype:3/5 **Main Journal**: 77/100 | **Annex Potential**: 71/100 | **Overall**: 72/100 **Topics**: [[画像生成AI, Alibaba, 高速推論, テキスト描画, 画像編集]] Alibabaの研究チームが、高速かつ高品質な画像生成AIモデル「Z-Image(造相)」を開発し、その中でも特に効率的な「Z-Image-Turbo」を公開しました。このモデルは、わずか60億という比較的少ないパラメータ数でありながら、主要な競合モデルと同等以上のフォトリアリスティックな画像を生成できるとされています。 Webアプリケーションエンジニアの視点からは、Z-Image-Turboの「わずか8回の関数評価回数(NFE)で高性能を発揮する」点と、「NVIDIA H800上で1秒未満の推論レイテンシを実現し、16GB VRAM搭載のコンシューマーデバイスにも対応する」点が特に重要です。これにより、リソースが限られた環境や、リアルタイム性が求められるアプリケーションへの組み込みが現実的になります。さらに、英語と中国語の二言語テキストレンダリングに優れ、プロンプトに堅牢に従う特性は、多言語対応のコンテンツ生成やユーザーインターフェース設計において大きな利点となります。派生モデルである「Z-Image-Edit」は、自然言語プロンプトに基づく精密な画像編集タスクに対応し、クリエイティブなimage-to-image生成をサポートします。これは、ユーザーがテキスト指示で画像を自由に加工できる機能を持つアプリケーション開発に役立つでしょう。デモ版では日本語テキスト生成に課題が見られたものの、画像の内容推論機能も備えており、単なる画像生成にとどまらない多角的な活用が期待されます。主要モデルとの評価試験で同等の性能を示していることから、この新しい高速画像生成AIは、今後のウェブサービス開発において効率的なビジュアルコンテンツ生成の強力なツールとなる可能性を秘めています。

元記事を読む他のサマリーを見る