## Why language models hallucinate

概要

https://openai.com/index/why-language-models-hallucinate/

詳細内容

## Why language models hallucinate https://openai.com/index/why-language-models-hallucinate/ OpenAIが発表した研究論文は、言語モデルのハルシネーションが、不確実性を示すよりも推測を報酬とする標準的な評価方法と、低頻度の任意事実を予測する次単語予測の統計的限界に起因すると解明する。 **Content Type**: 🔬 Research & Analysis **Scores**: Signal:5/5 | Depth:4/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:5/5 **Main Journal**: 87/100 | **Annex Potential**: 87/100 | **Overall**: 88/100 **Topics**: [[LLMハルシネーション, モデル評価, 次単語予測, 信頼性, 不確実性]] OpenAIが公開した最新の研究論文は、言語モデルが自信満々に誤った情報を生成する「ハルシネーション」の根本原因と、その対策の重要性をWebアプリケーションエンジニアの視点から深く掘り下げています。この問題は、AIを活用したアプリケーションの信頼性に直結するため、開発者にとって避けて通れない課題です。論文は、ハルシネーションの主な原因を二つ挙げています。一つは、**現在のモデル評価方法が「不確実性を示す」よりも「推測する」ことを報酬としてしまうインセンティブ設計**にあると指摘します。正答率のみを重視する評価基準では、モデルはたとえ知識がなくても推測して回答するよう学習し、結果として誤り（ハルシネーション）の発生率が高まります。実際、OpenAI自身のモデル比較（GPT-5 thinking-miniとo4-mini）では、前者が高い「回答拒否率」を示すことで精度はわずかに劣るものの、決定的に重要な「エラー率」は後者より大幅に低いことが示されています。これは、モデルが「知らない」と正直に伝えることの価値を明確に示しています。もう一つの原因は、**次単語予測というモデルの基本的な学習メカニズム**にあります。スペルや括弧のような一貫性のあるパターンは大規模なデータから正確に学習されますが、特定の人物の誕生日といった「低頻度で本質的にランダムな事実」はパターンとして予測が難しく、必然的にハルシネーションを引き起こしやすくなります。この研究が示唆するのは、「ハルシネーションはAIの成長とともに自然に解決される」という安易な考えが誤りであり、根本的な解決には**評価指標そのものの見直しが必要**だということです。自信のある誤答にはより厳しいペナルティを課し、不確実性表明には部分的な報酬を与えるような評価システムへ移行すること。これにより、モデルは推測ではなく、自身の知識の限界を認識する「謙虚さ」を学習するようになります。 Webアプリケーションエンジニアは、この「なぜ」を理解することで、単に高精度なモデルを求めるだけでなく、モデルの不確実性を適切に扱うUI/UXの設計や、Retrieval-Augmented Generation（RAG）などのハルシネーション抑制技術をより効果的に導入する戦略を立てる上で、重要な洞察を得られます。それは、アプリケーションの信頼性を根本から高めるための、エンジニアリング的アプローチの転換を促すものです。

元記事を読む他のサマリーを見る