掲載済み (2025-08-30号)
#231 443文字 • 3分

## Google、画像生成AI「nano-banana」発表 画像内の人やモノの一貫性保つ性能強化 編集も自然言語で自在に

掲載情報

概要

https://www.itmedia.co.jp/aiplus/articles/2508/27/news072.html

詳細内容

## Google、画像生成AI「nano-banana」発表 画像内の人やモノの一貫性保つ性能強化 編集も自然言語で自在に https://www.itmedia.co.jp/aiplus/articles/2508/27/news072.html Googleは、画像内の人物やオブジェクトの一貫性を大幅に向上させ、自然言語による高度な編集が可能な新しい画像生成AIモデル「Gemini 2.5 Flash Image(nano-banana)」を発表しました。 **Content Type**: 📰 News & Announcements **Scores**: Signal:4/5 | Depth:3/5 | Unique:3/5 | Practical:4/5 | Anti-Hype:4/5 **Main Journal**: 75/100 | **Annex Potential**: 73/100 | **Overall**: 72/100 **Topics**: [[画像生成AI, Gemini, 自然言語処理, AI画像編集, Google AI Studio]] Googleが発表した画像生成AI「Gemini 2.5 Flash Image(通称:nano-banana)」は、Webアプリケーション開発者にとって画期的な進化を遂げています。従来の画像生成AIが苦手としていた、複数の画像間で人物やオブジェクトの外観の一貫性を保つ能力が大幅に強化されました。これは、例えばECサイトでの商品バリエーション表示や、ユーザーアバターの多様なポーズ生成など、特定の被写体を用いた動的なコンテンツを扱う際に、品質と効率を飛躍的に向上させます。開発者は、一貫性の維持にかかる手作業や後処理を削減し、より信頼性の高い画像を素早くアプリケーションに組み込めるようになるでしょう。 さらに、「nano-banana」は自然言語の指示による高度な画像編集機能を備えています。背景のぼかし、被写体のポーズ変更、モノクロ写真の着色といった多様な操作を、ユーザーが自然な言葉で指示できるようになります。これにより、開発者は複雑な画像編集UIを構築することなく、ユーザーに直感的で強力な画像加工体験を提供できます。複数の入力画像を結合して新しいシーンを生成する機能(例:ベッドルームにスタンドライトを追加)も、パーソナライズされたコンテンツ生成や新たなクリエイティブ表現の可能性を広げます。 また、Gemini LLMの活用により、現実世界の物理的な認識能力も向上しており、より論理的で整合性の取れた画像を生成することが期待されます。このモデルは、GeminiのAPI、Google AI Studio、Vertex AIを通じて提供され、100万出力トークンあたり30ドル、1枚の画像出力につき0.039ドルという価格設定で利用可能です。これらの機能強化は、Webアプリケーションにおける画像生成・編集のUXを根本から変え、開発者がよりリッチでインタラクティブなサービスを提供するための強力な武器となるでしょう。