## FLUX.2：最先端のビジュアルインテリジェンス

概要

https://bfl.ai/blog/flux-2

詳細内容

## FLUX.2：最先端のビジュアルインテリジェンス https://bfl.ai/blog/flux-2 **Original Title**: FLUX.2: Frontier Visual Intelligence Black Forest Labsは、画像生成と編集の性能を大幅に向上させ、キャラクターの一貫性、テキストレンダリング、高解像度を実現した最先端のビジュアルインテリジェンスモデル「FLUX.2」を、APIとオープンウェイトモデルとしてリリースしました。 **Content Type**: News & Announcements **Language**: en **Scores**: Signal:5/5 | Depth:4/5 | Unique:3/5 | Practical:5/5 | Anti-Hype:4/5 **Main Journal**: 88/100 | **Annex Potential**: 82/100 | **Overall**: 84/100 **Topics**: [[画像生成モデル, 画像編集, オープンウェイトモデル, クリエイティブワークフロー, テキストレンダリング]] Black Forest Labsは、ビジュアルインテリジェンスモデルの最新版「FLUX.2」を発表しました。この新モデルは、デモ目的ではなく、実際のクリエイティブな制作ワークフロー向けに設計されており、特にウェブアプリケーション開発者にとって重要な機能強化が複数含まれています。 FLUX.2の主要な改善点として、最大10枚の参照画像からキャラクターやスタイルの一貫性を維持した高精度な画像を生成できる「マルチリファレンスサポート」が挙げられます。これは、ブランドガイドラインの遵守、一貫した製品画像生成、ストーリーテリングにおけるキャラクター表現など、継続的なビジュアル要素が必要とされる場面で非常に有用です。また、これまでの画像生成モデルの課題であった、画像内の複雑なタイポグラフィ、インフォグラフィックス、UIモックアップなどのテキストを判読可能にレンダリングする能力が大幅に向上しており、ウェブコンテンツの自動生成やマーケティング素材作成における生産性向上に直結します。さらに、FLUX.2は最大4メガピクセル（MP）の画像編集が可能で、詳細と整合性を保ちながら高品質なアセットを作成できます。このモデルは、潜像フローマッチングアーキテクチャに基づき、Mistral-3 24Bビジョン言語モデルとrectified flow transformerを組み合わせることで、現実世界の知識と空間的・構成的論理をより正確に捉えることができます。 Black Forest Labsは「オープンコア」アプローチを掲げており、商用APIとして提供される「FLUX.2 [pro]」や詳細なパラメータ制御が可能な「FLUX.2 [flex]」に加え、強力なオープンウェイトモデル「FLUX.2 [dev]」およびApache 2.0ライセンスの「FLUX.2 [klein]」（近日公開）も提供しています。特に「FLUX.2 [dev]」はHugging Faceで公開されており、NVIDIAやComfyUIとの協力により消費者向けGPUでも最適化されたfp8実装でローカル実行が可能であるため、開発者はコストを抑えつつモデルの内部を調査し、独自のアプリケーションに組み込むことができます。これにより、開発者は自社のWebサービスやアプリケーションに、高い品質と柔軟性を持つ画像生成・編集機能を統合する新たな選択肢を得られます。このリリースは、画像生成技術が単なる視覚効果から、実際のプロダクションにおける「不可欠なインフラ」へと進化していることを示しており、開発者はこの最先端技術を活用して、より洗練されたクリエイティブなWeb体験を提供できるようになるでしょう。

元記事を読む他のサマリーを見る