autoresearch: Andrej KarpathyによるAIエージェント自律研究システム

概要

AIエージェントが5分間のトレーニングとコード改変を自律的に繰り返し、LLMのアーキテクチャや最適化手法を自動で改善していく研究用フレームワーク。

詳細内容

Andrej Karpathy氏が公開した本プロジェクトは、人間がコードを直接書くのではなく、「AIエージェントに研究を行わせるための指示（program.md）」を記述することで、LLMのトレーニングプロセスを自動化する実験的な試みです。システムは5分間という固定の時間枠でトレーニングを実行し、検証データのbits-per-byte (bpb) を指標にモデルの性能を評価します。エージェントは `train.py` 内のモデル構造、ハイパーパラメータ、オプティマイザ（MuonやAdamW）などを自由に改変し、改善が見られればその変更を保持、失敗すれば破棄するというサイクルを繰り返します。これにより、特定のハードウェア環境において最適なモデル構成を人間が介在せずに「進化」させることが可能になります。現在は単一のNVIDIA GPU環境を対象としていますが、コミュニティによってMacOSやWindowsへの移植も進んでいます。

元記事を読む他のサマリーを見る