Grok 4 Fast - GenAI週刊

概要

xAIは、コスト効率に優れた推論モデル「Grok 4 Fast」を発表し、既存のGrok 4に匹敵する性能を維持しつつ、トークン効率を大幅に向上させ、SOTAの検索機能と統一アーキテクチャを提供します。

詳細内容

xAIは、コスト効率と性能を両立させた最新の推論モデル「Grok 4 Fast」を発表しました。このモデルは、Grok 4に匹敵するフロンティアレベルの性能を維持しつつ、推論に必要な「思考トークン」を平均40%削減。これにより、Grok 4と同等の性能を98%低い価格で提供可能となり、AI APIを利用するウェブアプリケーション開発者にとって、運用コストの劇的な削減とアクセシビリティの向上が期待されます。 Grok 4 Fastの重要な特長は、最先端のツール利用と検索機能です。強化学習によってウェブやXのブラウジング、コード実行などのツールをシームレスに使いこなし、リアルタイムデータを活用して複雑なクエリを強化します。リンクをたどり、画像や動画を含むメディアを取り込み、光速で情報を統合するこのエージェント能力は、例えば高度な情報検索や動的なコンテンツ生成機能を組み込む開発者にとって、大きな価値をもたらします。さらに、2Mトークンの広範なコンテキストウィンドウと、推論モード（詳細な思考連鎖）と非推論モード（迅速な応答）を単一モデルで処理する統一アーキテクチャを導入。システムプロンプトを通じてこれらの挙動を柔軟に調整できるため、リアルタイムアプリケーションにおけるエンドツーエンドのレイテンシとトークンコストを削減し、パフォーマンスと効率を両立させることが可能です。 GPQA DiamondやAIME 2025、LiveCodeBenchといった主要ベンチマークで高いスコアを記録し、特にLMArenaのSearch Arenaでは競合モデルを抑えてトップに立つなど、そのインテリジェンス密度は独立機関の評価でも確認されています。ウェブアプリケーションエンジニアは、この高性能かつ低コストのモデルを活用し、より洗練されたAI駆動型機能の実装や、新しいユーザー体験の創出を加速できるでしょう。

元記事を読む