概要
https://simonwillison.net/2025/Dec/31/the-year-in-llms/
詳細内容
## 2025年のLLM:推論、エージェント、そして「Vibe Coding」が開発を変えた1年
https://simonwillison.net/2025/Dec/31/the-year-in-llms/
**Original Title**: 2025: The year in LLMs
LLMが「数学的パズルを解く段階」から「ツールを駆使する自律的なエージェント」へと進化し、Web開発者のワークフローがCLIやスマホ経由の非同期コーディングへと劇的に移行した2025年を振り返る。
**Content Type**: 🔬 Research & Analysis
**Language**: en
**Scores**: Signal:5/5 | Depth:4/5 | Unique:5/5 | Practical:4/5 | Anti-Hype:4/5
**Main Journal**: 88/100 | **Annex Potential**: 82/100 | **Overall**: 88/100
**Topics**: [[Claude Code, Coding Agents, Vibe Coding, DeepSeek, MCP]]
2025年は、LLMが単なるチャットUIを越え、Web開発における実用的な「エージェント」として定着した年であった。著者のSimon Willisonによれば、この1年の最大の転換点は2025年2月に登場した「Claude Code」である。これはLLMがコードを書き、実行し、修正を繰り返す「コーディングエージェント」の時代の幕開けを象徴しており、開発者はCLI(コマンドライン)を通じてLLMに複雑なタスクを丸投げできるようになった。
特に筆者が注目しているのは、Web版のClaude CodeやCodex Cloudのような「非同期コーディングエージェント」の台頭だ。これにより、開発者はスマホからでも指示を出し、エージェントがバックグラウンドでプルリクエストを生成するのを待つという、並列的なワークフローが可能になった。筆者は2025年だけで110以上のツールを「Vibe Coding(詳細なコード理解より直感的なプロンプトを優先する手法)」で構築しており、プログラミングが「コードを書く作業」から「AIの出力を監督し、テストスイートで検証する作業」へと変質したと指摘している。
また、技術面ではOpenAIのo1やDeepSeek R1に代表される「推論モデル(RLVR:検証可能な報酬による強化学習)」が、ツールの計画的な実行において真の価値を発揮した。モデルの勢力図も大きく塗り替えられ、DeepSeekやQwenといった中国勢のオープンウェイトモデルが、米国製モデルに匹敵、あるいは凌駕する性能を低コストで実現した。一方で、セキュリティ面では「逸脱の正常化(Normalization of Deviance)」という概念を引き合いに出し、プロンプトインジェクションの脆弱性を抱えたまま、サンドボックス化されていない環境でエージェントを動かすリスクが、なし崩し的に受け入れられている現状に強い警鐘を鳴らしている。
結論として、2025年はAIの誇大広告(Hype)が削ぎ落とされ、開発者にとって「Bashを実行できるエージェントこそが最強のツールである」という現実が明確になった年であった。MCP(Model Context Protocol)のような標準規格の普及も進んだが、最終的には「CLIを自在に操るAI」が、Web開発の生産性を物理的なデバイスの制約から解放したと筆者は分析している。