GPT-5.2やGemini 3 Proに匹敵するオープンソースAIモデル「Kimi K2.5」をMoonshot AIがリリース

中国のAIスタートアップ・Moonshot AIがオープンソースのAIモデル「Kimi K2.5」をリリースしました。ベンチマークではOpenAIの「GPT-5.2」やAnthropicの「Claude 4.5 Opus」、Googleの「Gemini 3 Pro」を上回るスコアも記録しています。
Kimi K2.5: Visual Agentic Intelligence | Technical Report
Moonshot AI Unveils Kimi K2.5 Open-Source Model, Claiming to Beat Claude Opus 4.5 on Agentic Benchmarks - WinBuzzer
https://winbuzzer.com/2026/01/27/moonshot-ai-kimi-k2-5-open-source-model-xcxwbn/
Kimi K2.5は2025年7月に発表された「Kimi K2」をベースに、およそ15兆のビジュアル・テキスト混合トークンで継続的事前学習が行われたモデルです。
GPT-4.1超えの中国製AIモデル「Kimi K2」が無料公開される、複数のテストでGPT-4.1やClaude 4 Opusを打ち負かしエージェントタスクもこなす - GIGAZINE

Moonshot AIの示したベンチマーク結果はこんな感じ。Kimi K2.5とGPT-5.2、Claude 4.5 Opus、Gemini 3 Proを比較したもので、AIエージェントに関するベンチマークではほか3モデルを上回るスコアを記録。コーディング、画像、動画に関してもオープンソースモデルながらいい戦いをしていることが示されています。

Kimi K2.5の特徴の1つは最大100のサブエージェントに自ら指示を出し、最大1500のツールのワークフローを並列実行できる点です。単一エージェントの場合と比べて、実行速度が最大4.5倍に向上するとのこと。サブエージェントは事前に作ったり設定したりする必要はなく、Kimi K2.5が自動的に作成・調整します。
以下はコストパフォーマンス比較の図。縦軸がパフォーマンス(上が高性能)、横軸がコスト(右が高価)で、青丸で示されたGPT-5.2に匹敵する性能をKimi K2.5が低コストで実現していることを示しています。

Kimi K2.5は「kimi.com」で実際に試すことが可能です。
Kimi AI with K2.5 | Visual Coding Meets Agent Swarm
https://www.kimi.com/

また、KimiのアプリやAPI、Kimi Codeでも利用可能です。
