GLM-5の性能がすごい。大手商用モデルに追いついてきた。 - きしだのHatena

概要

Zhipu AIの最新モデルGLM-5を多角的に検証し、コーディング、論理性、日本語表現のすべてにおいて大手商用モデルに匹敵する実力を持つことを確認した評価レポートです。

詳細内容

Zhipu AIから登場した最新LLM『GLM-5』の実力検証記事です。本モデルは744B（Active 40B）のMoE構成とされ、Hugging Faceで重みも公開されています。著者はチャットインターフェースを通じて、パストレーシングの実装やSpring BootによるTODOアプリ制作、複雑な論理パズル、日本語の創作・要約などをテストしました。結果として、複雑なプログラミング指示への対応はClaude 3 Opus級の安心感があり、Deep Think機能により難解な数学的思考も正確にこなすことが判明しました。日本語の機微やロールプレイ（ギャル風など）の再現性も高い一方、日本のローカル知識については一部ハルシネーションが見られるなど、商用モデルと同様の弱点も併せ持っています。総合的に、APIやチャットでの実用においてトップクラスの選択肢になり得ると結論づけています。

元記事を読む他のサマリーを見る