掲載済み (2025-08-23号)
#119 478文字 • 3分

## GPT-5やGrok 4など各種AIのIQテスト対決の結果が公開中&各AIが政治的に左寄りなのか右寄りなのかテストした結果も公開中

掲載情報

概要

https://gigazine.net/news/20250819-ai-iq-test-political-replies/

詳細内容

## GPT-5やGrok 4など各種AIのIQテスト対決の結果が公開中&各AIが政治的に左寄りなのか右寄りなのかテストした結果も公開中 https://gigazine.net/news/20250819-ai-iq-test-political-replies/ Maxim Lott氏の「Tracking AI」が、GPT-5 Proを含む主要AIモデルのIQテスト結果と政治的偏りを客観的に分析し、AIの性能進化と一貫した左寄り傾向を明らかにしました。 **Content Type**: Research & Analysis **Scores**: Signal:4/5 | Depth:3/5 | Unique:4/5 | Practical:4/5 | Anti-Hype:4/5 **Main Journal**: 74/100 | **Annex Potential**: 75/100 | **Overall**: 76/100 **Topics**: [[AI性能評価, AIのIQテスト, AIの政治的偏り, LLMベンチマーク, GPT-5]] Maxim Lott氏が公開したウェブサイト「Tracking AI」は、主要なAIモデルのIQテスト結果と政治的偏りを客観的に分析しています。ウェブアプリケーションエンジニアにとって、このデータはAIモデル選定とバイアス対応における重要な示唆を与えます。 IQテストでは、オンライン上にはない独自テストとメンサのテストを使用。OpenAIのGPT-5 Pro(画像読み取り機能付きモデル)がメンサテストでIQ138と最高スコアを記録し、GPT-4oのIQ65から大幅な性能向上を示しました。世界最強を謳うGrok 4もIQ125と健闘。さらに、Claude 3.7 ExtendedやClaude 3.5 Sonnetのようなモデルが1ヶ月でIQを大幅に向上させている点も注目され、AIの進化速度が極めて速い現状を浮き彫りにしています。これは、AIを活用したアプリケーション開発において、常に最新のモデル性能を把握し、適切なモデル選定を行うことの重要性を物語っています。 また、政治的偏りの調査では、テスト対象となった全てのAIが「左寄りの経済政策とリベラルな社会政策」を支持する傾向にあることが判明しました。Bing Copilotが顕著に左寄りである一方、Phi-4は中立に近いという興味深い違いも見られました。このバイアスは、AIが生成するコンテンツや意思決定に影響を及ぼす可能性があり、特にユーザー向けの機能やセンシティブな情報を扱うアプリケーションにおいては、意図しない偏りを避けるための調整やフィルタリングが不可欠です。エンジニアは、AIの回答が持つ政治的・イデオロギー的偏りを理解し、アプリケーションの設計段階で公平性確保の対策を講じる必要があります。 これらの客観的なベンチマークデータは、漠然としたAIの「性能向上」や「知能」を具体的に数値化し、開発者がより情報に基づいた意思決定を下すための貴重なツールとなります。AIの進化と潜在的なバイアスという両面を理解することは、信頼性の高いAIシステムを構築する上で不可欠です。