概要
https://speakerdeck.com/izumin5210/jsconf-jp-2025-sponsor-session
詳細内容
## Web エンジニアが JavaScript で AI Agent を作る / JSConf JP 2025 sponsor session
https://speakerdeck.com/izumin5210/jsconf-jp-2025-sponsor-session
WebエンジニアがJavaScriptを用いてAIエージェント開発に参入するための技術的な変化、課題、そして解決策を提示します。
**Content Type**: Tutorial & Guide
**Language**: ja
**Scores**: Signal:4/5 | Depth:4/5 | Unique:3/5 | Practical:5/5 | Anti-Hype:4/5
**Main Journal**: 85/100 | **Annex Potential**: 79/100 | **Overall**: 80/100
**Topics**: [[AIエージェント開発, JavaScript, 永続ワークフロー, LLM可観測性, AIエージェント評価]]
LayerXのizumin5210氏によるこのプレゼンテーションは、WebエンジニアがJavaScriptと既存のスキルを活かしてAIエージェント開発にどう取り組むべきかを解説しています。LLM(大規模言語モデル)の登場により、AIモデルがREST APIとして提供されるようになったことで、従来の機械学習エコシステムへの依存が低減し、JavaScript/TypeScriptでの開発が主流になりつつあると著者は強調します。これは、WebエンジニアにとってAIエージェント開発への参入障壁が下がり、慣れ親しんだステートレスなJSONのやり取りでAI機能を扱えるようになったことを意味します。
著者は、AIエージェントがLLMによって自身のプロセスとツール利用を動的に指示するシステムであり、「Agent Loop」という振る舞いをすると説明します。しかし、AIエージェント開発には「確率的挙動」という特有の課題があり、同じ入力でも出力が変わる可能性があります。この課題に対し、Webエンジニアに馴染み深い「Observability(可観測性)」と「テスト・評価(Evals)」の概念を援用した解決策を提示しています。
Observabilityの改善策として、LLMの呼び出しをトレースし、コスト、レイテンシ、トークン数、ツール呼び出し履歴などを可視化できるLangfuseの活用を提案しています。これはOpenTelemetryでも計測可能で、APMツールと同様の感覚で運用できると述べています。一方、テスト・評価の課題に対しては、確率的挙動のため単純なアサートが難しいため、「評価駆動開発(Eval-driven Development)」の重要性を説きます。具体的には、ローカルでデータセット、タスク、スコアラーを定義して評価を行うevaliteや、LLM自体に評価させる「LLM-as-a-Judge」のアプローチを紹介し、これによりTDDのようにデータ追加とロジック改善のサイクルを回せると説明しています。
さらに、AIエージェント開発におけるWebエンジニアの専門性が活かされる技術領域として、以下のポイントを挙げています。
1. **UI/UX**: 数秒から数分かかるロングランニング処理に対するUI設計や、Human-in-the-Loop (HITL) 体験の最適化。
2. **技術選定**: Vercel AI SDKやOpenAI Agents API、LangGraph.jsなどTypeScriptで利用可能なフレームワークが存在するものの、まだデファクトスタンダードは存在せず、これは最先端を走るチャンスであると指摘しています。
3. **耐久性のあるワークフロー実行**: サーバー再起動時でも処理を継続し、リトライ、タイムアウト、ステート管理、イベント待ちによる中断・再開が可能な「耐久性(Durability)」と「中断・再開可能(Resumable)」なワークフロー実行基盤の必要性を説き、TemporalやVercel Workflowの採用を推奨しています。特にVercel WorkflowはAI機能以外にも汎用的なバックグラウンドジョブ基盤として優れていると補足しています。
4. **Agent向けツール/API設計**: 既存APIを単にラップするのではなく、LLMが解釈しやすいようにAgentの特性に合わせたAPI設計が重要であると強調しています。
5. **認証・認可**: B2B SaaSにおけるAIエージェントの認可課題として、ID-JAGのような中央集権的な認可管理の必要性にも言及しています。
著者は、LLMの登場が「できること」にどう変化をもたらし、システム設計・アーキテクチャにどう影響するかをWebエンジニアが理解することが極めて重要であり、自分たちの専門領域に新たな技術的チャレンジが多数発生していることを総括しています。