GPT-5.3-Codex-Spark のご紹介：リアルタイムコーディング向けの超高速モデル

概要

OpenAIは、Cerebrasの高速推論基盤を活用し、毎秒1000トークン以上の生成速度と超低レイテンシを実現したリアルタイムコーディング特化型モデル「GPT-5.3-Codex-Spark」を発表しました。

詳細内容

OpenAIが発表した「GPT-5.3-Codex-Spark」は、GPT-5.3-Codexの小型版であり、特に開発者とのリアルタイムな対話を重視した研究プレビューモデルです。CerebrasのWafer Scale Engine 3上で動作することで、従来比で大幅な高速化を達成しています。主な特徴は以下の通りです： - **圧倒的なパフォーマンス**: 毎秒1000トークン以上の生成速度を誇り、最初のトークンが表示されるまでの時間を50%削減、通信オーバーヘッドを80%削減しました。 - **コーディング能力**: SWE-Bench Pro等のベンチマークで高い性能を示し、瞬時の編集やロジック再構成、UI改善の即時反映が可能です。 - **インフラの進化**: 永続的なWebSocket接続を導入し、推論スタックを刷新。Cerebrasの低レイテンシハードウェアと既存のGPU基盤を組み合わせたハイブリッドな最適化が行われています。 - **提供状況**: 128kのコンテキストウィンドウに対応し、ChatGPT Proユーザー向けにCodexアプリやVS Code拡張機能を通じて提供が開始されました。今後は、長期的な推論を行う大規模モデルと、このSparkのような高速モデルを連携させ、バックグラウンド処理とリアルタイム共同作業をシームレスに融合させるエージェント体験の構築を目指しています。

元記事を読む他のサマリーを見る