## Gemini 3 Pro＋Nano Banana ProでAWS構成図をどこまで読み書きできるか試してみた

概要

https://blog.serverworks.co.jp/gemini-3-pro-nano-banana-pro-aws-diagram

詳細内容

## Gemini 3 Pro＋Nano Banana ProでAWS構成図をどこまで読み書きできるか試してみた https://blog.serverworks.co.jp/gemini-3-pro-nano-banana-pro-aws-diagram Google DeepMindの最新AIモデルGemini 3 Proと画像生成AI Nano Banana ProがAWS構成図の読み書きにどこまで活用できるかを検証し、その実力と課題を明らかにする。 **Content Type**: Tools **Language**: ja **Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:5/5 **Main Journal**: 82/100 | **Annex Potential**: 83/100 | **Overall**: 84/100 **Topics**: [[Gemini 3 Pro, Nano Banana Pro, AWS構成図自動生成, LLMマルチモーダル機能, CloudFormation]] サーバーワークスの椿山氏が、Google DeepMindが発表した最新の生成AIモデル「Gemini 3 Pro」と画像生成AI「Nano Banana Pro」を組み合わせ、AWSインフラ構成図の「読み取り」「既存図の修正・加工」「新規作成」がどこまで可能かを検証した。Nano Banana Proは日本語テキストを含む画像の生成品質が飛躍的に向上し、「霞ヶ関風ポンチ絵」のようなインフォグラフィックも実用レベルで生成できるようになった点が注目される。検証では、まず既存のAWS構成図をGemini 3 Proに読み込ませたところ、構成概要の把握とテキスト化の精度は高く、日本語OCRの能力も向上していると評価された。次に、既存の構成図から「性能・拡張性」や「セキュリティ」といった特定の観点に関する要素のみを抽出し、強調する修正・加工を試みたが、指示通りに動作しない不安定な挙動も見られ、実用にはあと一歩という印象を受けた。最もチャレンジングなゼロからの新規作成では、テキスト情報からの生成は「構成図ガチャ」の要素が強く、特に通信経路の描画で誤り（ハルシネーション）が多く見られた。修正指示を繰り返す手間を考えると、人間が描く方が早い場面も多いという。CloudFormationテンプレートからの生成はテキスト情報よりも精度が向上したものの、やはり通信経路の描画は苦手で、間違った情報が生成される傾向があった。著者である椿山氏は、現時点のGemini 3 ProとNano Banana Proは完璧な構成図を自動生成する「魔法の杖」ではないと結論付けている。しかし、情報の整理やビジュアル化のたたき台を作成する「アシスタント」としては非常に有用であり、エンジニアの作業をサポートする可能性を秘めていると指摘する。今後の生成AIの進化速度を考えると、今回課題となった点も遠くない未来に解消されるだろうと期待を寄せ、引き続き実務への適用を模索していくとしている。この検証は、ウェブアプリケーションエンジニアが日々の業務で直面する構成図作成の課題に対し、最新のAIツールがどこまで現実的なソリューションを提供できるかを示している点で重要だ。

元記事を読む他のサマリーを見る