## 2025年LLM年間レビュー

概要

https://karpathy.bearblog.dev/year-in-review-2025/

詳細内容

## 2025年LLM年間レビュー https://karpathy.bearblog.dev/year-in-review-2025/ **Original Title**: 2025 LLM Year in Review アンドレイ・カーパシーが、2025年にLLM分野で起きた6つの画期的なパラダイムシフトを、強化学習の進化から新しいプログラミング手法、AIとの人間らしいインタラクションまで、その意義を深く分析し提示する。 **Content Type**: Opinion & Commentary **Language**: en **Scores**: Signal:5/5 | Depth:5/5 | Unique:5/5 | Practical:4/5 | Anti-Hype:4/5 **Main Journal**: 93/100 | **Annex Potential**: 93/100 | **Overall**: 92/100 **Topics**: [[強化学習, LLMエージェント, Vibe Coding, LLMアプリケーション, LLM GUI]] アンドレイ・カーパシーは、2025年がLLM分野における強力かつ波乱に富んだ進歩の年であり、風景を一変させた「パラダイムシフト」が数多くあったと指摘している。ウェブアプリケーションエンジニアにとって重要な変化は以下の6点に集約される。まず、「検証可能な報酬からの強化学習（RLVR）」が新たな主要な訓練ステージとして確立された。これは数学やコードパズルといった自動検証可能な環境でLLMを訓練することで、人間が「推論」と見なすような戦略（問題解決の分解や試行錯誤）を自発的に開発することを可能にする。既存のSFTやRLHFよりもはるかに長い最適化が可能で、高い能力対費用効果をもたらし、プリトレーニングに充てられていた計算資源がRLVRに振り向けられたという。次に、LLMの知能の「形」に対する理解が深まった。「動物を育てている」のではなく、「幽霊を召喚している」という認識だ。LLMは人間のテキスト模倣やパズル解決に特化して最適化されており、人間とは異なる「ぎざぎざな」能力特性を示す。ベンチマークは検証可能な環境であるため、RLVRや合成データ生成によって「ベンチマックス」されやすく、真の汎用知能とは異なる進歩を見せると警鐘を鳴らしている。「Cursor」に代表される新しい「LLMアプリ」のレイヤーも注目に値する。これらのアプリは、特定の垂直分野向けにLLM呼び出しをバンドル・オーケストレーションし、「コンテキストエンジニアリング」や複雑なDAG（有向非巡回グラフ）でのLLM連携、アプリケーション固有のGUI、そして「自律性スライダー」を提供する。LLMラボが「一般的に有能な大学生」のようなモデルを輩出する一方、LLMアプリはそれらを特定の専門分野で活躍するプロフェッショナルへと「アニメート」する役割を担うと著者は見ている。さらに、「Claude Code」は、ローカル環境で動作する最初の説得力のあるLLMエージェントとして登場した。これは、ツール利用と推論をループ状に繋げて長期的な問題解決を行うAIであり、開発者のコンピューター上で、既存の環境、データ、コンテキスト、そして低遅延なインタラクションを活用する。カーパシーは、OpenAIがクラウドでのエージェント展開に注力したのに対し、Anthropicがローカルでの実装という優先順位を正しく理解したと評価し、AIとの新たな対話パラダイムを提示したと述べた。「Vibe coding」は、AIが英語だけで印象的なプログラムを構築できる能力の閾値を超えたことを指す。プログラミングが専門家だけのものではなくなり、誰でも可能になった。これにより、正規のプロフェッショナルも、これまで書かれなかったであろうソフトウェアを大量に「vibe coded」できるようになった。コードは突然、自由で、一時的で、柔軟で、使い捨て可能になり、ソフトウェア開発と職務記述を根本から変革するだろうと予測している。最後に、Google Gemini Nano bananaに示された「LLM GUI」の可能性だ。LLMが次なる主要なコンピューティングパラダイムであるとするならば、GUIのようなUI/UXイノベーションも必然である。現在のチャット形式は1980年代のコンソールコマンドに似ており、人間が好む視覚的・空間的な情報消費形式に合わせた、画像、インフォグラフィック、ウェブアプリなどでLLMが対話する未来を示唆している。これはテキスト生成、画像生成、世界知識がモデル内で絡み合った複合的な能力として実現されるだろう。 2025年は、LLMが予想以上に賢く、同時に予想以上に愚かという、新しい種類の知能として出現した年であり、その潜在能力の10%も実現されていないと締めくくられている。

元記事を読む他のサマリーを見る