掲載済み (2026-03-07号)
#130 136文字 • 1分

ゲイリー・マーカスのAI予測をLLMで検証:2,218件の主張を分析したデータセット「marcus-claims-dataset」

原題: Systematic extraction and analysis of every testable AI claim Gary Marcus made on his Substack (2022-2026). Dual-pipeline analysis by Claude and ChatGPT with hybrid reconciliation.

英語

掲載情報

概要

著名なAI懐疑論者ゲイリー・マーカス氏が2022〜2026年に行った2,218件の予測をLLMで自動検証し、技術的指摘の正確性と市場予測の乖離を明らかにしたデータセット。

詳細内容

このリポジトリは、AI懐疑論者の代表格であるゲイリー・マーカス氏がSubstackで発表した474件の記事から、検証可能な2,218件の主張を抽出し分析した結果を公開しています。ClaudeとChatGPTを組み合わせたデュアルパイプライン分析により、2026年3月時点のエビデンスに基づき各主張を「支持」「混合」「矛盾」で評価。結果として、主張全体の59.9%が支持され、特にLLMの脆弱性や動画生成の信頼性といった技術的欠陥に関する指摘は極めて正確(支持率90-100%)でした。一方で、氏のライフワークとも言える「AIバブルの崩壊」などの市場予測については、的中率が最も低いクラスター(矛盾27%)となっており、技術的な正しさと経済的な予測の難しさが対照的に示されています。