GPT-OSS Swallow の公開: 日本語能力と思考力を強化した 20B/120B 推論型LLM

概要

東京科学大学と産総研が、OpenAI GPT-OSSをベースに日本語能力と高度な推論力を強化したApache 2.0ライセンスの推論型LLM「GPT-OSS Swallow」(20B/120B)を公開。

詳細内容

東京科学大学と産業技術総合研究所の研究チームは、OpenAIのGPT-OSSをベースとした最新の推論型大規模言語モデル「GPT-OSS Swallow」の20Bおよび120Bモデルを公開した。本モデルはApache 2.0ライセンスを採用し、商用・研究・個人利用が自由。400Bトークンの継続事前学習（CPT）、教師ありファインチューニング（SFT）、そして検証可能な報酬を用いた強化学習（RLVR/GRPO）の3段階で構築されている。ベンチマークでは、20B/120B共に同規模のオープンモデルの中で最高性能を達成。特に120Bモデルは日本語MT-Benchで0.916を記録し、GPT-5.1 ThinkingやGemini 3 Proなどの商用最新モデルに匹敵する対話・推論能力を示している。学習面ではFP8 GEMMの採用により計算効率を20%向上させている点も特徴。

元記事を読む他のサマリーを見る