概要
https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/
詳細内容
## 600以上の画像生成を行い、AIモデルを比較
https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/
**Original Title**: We ran over 600 image generations to compare AI models
LateNiteSoftは、600以上の画像生成テストを通して、OpenAI、Gemini、Seedreamの各AIモデルが画像編集のどの用途に最適かを詳細に比較・評価した。
**Content Type**: Research & Analysis
**Language**: en
**Scores**: Signal:4/5 | Depth:4/5 | Unique:4/5 | Practical:5/5 | Anti-Hype:4/5
**Main Journal**: 83/100 | **Annex Potential**: 82/100 | **Overall**: 84/100
**Topics**: [[AI画像生成, AIモデル評価, 画像編集, プロンプトエンジニアリング, 開発ツール選定]]
長年iOS向け写真アプリを開発してきたLateNiteSoftが、OpenAI (gpt-image-1)、Gemini (gemini-2.5-flash-image)、Seedream (seedream-4-0-250828) の主要AI画像生成モデルの比較テストを実施しました。同社は、ベンチャーキャピタルに頼らず、ユーザーに公正な料金体系を提供するため、クレジットベースの「従量課金」システムを構築しており、この背景から費用対効果を重視したモデル選定の必要性を感じていました。
テストでは、ペット、子供、風景、車、製品写真といった一般的な被写体に対し、平均的なユーザーが使用するであろう「素朴なプロンプト」を用いて600以上の画像生成が行われました。モデルの生成時間は、OpenAIが80秒(高品質)、Geminiが11秒、Seedreamが9秒と、SeedreamとGeminiが高速である点が目立ちました。
比較結果から、各モデルには明確な得意分野があることが示されました。
* **クラシックフィルター(写真加工)**: Geminiは元の画像のディテールを保ち、ハルシネーション(幻覚)を最小限に抑え、フォトリアリズムに優れる一方で、効果の強さや創造性に欠ける傾向があります。特に人物写真では編集を拒否するような強い写実性バイアスが見られました。OpenAIはディテールを改変し、「AI的な崩れ」が生じやすく、人物の顔などでは致命的となることがあります。Seedreamはその中間に位置します。
* **背景除去**: OpenAIはディテールの改変により背景除去には不向きでした。Geminiはオブジェクトの特定に関する質問を返すことがあり、より高度な処理が可能です。
* **レンズ効果**: OpenAIは画像を再生成し、ディテールをハルシネーションする傾向がありますが、GeminiとSeedreamはオリジナルに忠実で、実際のレンズ効果に近い結果を生成します。特にSeedreamはボケ効果で優れた性能を発揮しました。
* **スタイル変換**: 創造的なスタイル変換においてはOpenAIが他を凌駕し、Studio Ghibli風などのプロンプトで最高の品質を示しました。Geminiは人物写真でスタイル適用に失敗するなど、過度に保守的な傾向があります。Seedreamは一部のスタイル(浮世絵、ローポリ)で優れた結果を出しました。
* **生成的な編集(創造性)**: より創造的で変形的な編集では、OpenAIが圧倒的な強さを見せ、画像全体を再構築する能力に優れています。Geminiは現実的ですが創造性は低く、Seedreamは現実性とハルシネーションが混在する結果となりました。
結論として、AI画像生成には「万能なモデルは存在しない」と述べています。完全に変形的なフィルターや創造的な生成アプリケーションにはOpenAIが適しており、より写実的な編集にはGeminiが優れています。Seedreamは両者の中間に位置し、価格と性能のバランスからOpenAIの代替となり得ると評価されました。記事では、これらの特性に基づき、芸術的なプロンプトをOpenAIに、写実的なプロンプトをGeminiに自動的に振り分ける「プロンプト分類器」の開発に関心があることを示唆しており、開発者がAIモデルを選択する上での実用的な指針を提供しています。