モデル評価をClaude Code x Agent Skillsを使って完全自動運転した話
日本語掲載情報
2026年2月28日土曜日号
アネックス掲載
概要
Claude CodeのSkill機能を活用し、モデルの調査からクラウドGPUでのベンチマーク、レポート生成までを自律的に完結させる「agentic-bench」の開発記録。
Claude CodeのSkill機能を活用し、モデルの調査からクラウドGPUでのベンチマーク、レポート生成までを自律的に完結させる「agentic-bench」の開発記録。