AIモデルの性能ランキングサイト「Arena」が商用サービス開始から8カ月で年換算収益1億ドル(約162億円)を突破したとTechCrunchが報じました。Arenaはアメリカのカリフォルニア大学バークレー校発の研究プロジェクトから始まったAI評価プラットフォームで、企業向け評価サービスでも急速に存在感を高めています。

Arena, the AI leaderboard everyone uses, is now a $100M business | TechCrunch

https://techcrunch.com/2026/06/29/arena-the-ai-leaderboard-everyone-uses-is-now-a-100m-business/

ChatGPTやClaude、Geminiなどさまざまな生成AIが登場しており、多数のベンチマークの結果も公表されています。ベンチマークテストは現実世界の課題を模した問題で構成されているとはいえ、「人間にとって読みやすい文章を生成する」とか「人間が高品質と感じる画像を生成する」といった主観的な性能を測定するのは困難です。このため、ユーザーからしてみると「このAIモデルはベンチマークスコアは高いけど、実際に使ってみると微妙な性能」というパターンが発生しがちです。

Arenaは「ユーザーのプロンプトを複数のAIモデルに入力し、AIモデルの名前を伏せた状態で各AIの出力の勝敗をユーザーに決めさせる」という手法でAIモデルの性能ランキングを作成しており、「人間が実際に使って高性能と感じたモデル」ほど上位にランクインする仕組みです。モデル名を伏せた状態で人間に比較させることで、ブランド名や評判に引っ張られにくい評価を集められる点が特徴。なお、Arenaは以前「LMArena」という名称で知られていましたが、2026年1月28日に「Arena」へ名称を変更しました。

Arenaのランキングは「テキスト生成」「ウェブ開発」「画像生成」「動画生成」などいくつかの分野に分かれており、分野ごとにAIの優劣を確認できる仕組みです。記事作成時点ではAnthropicのClaude Fable 5がテキスト生成やウェブ開発の分野でトップでした。



こうしたArenaでの「実際のユーザーがどちらの回答を好むのか」という情報は、AI開発企業にとってはモデル改善のための重要な手掛かりになります。

Arenaが2025年9月に発表した商用サービス「AI Evaluations」は、企業やAIモデル開発企業向けにコミュニティから集まったフィードバックを分析して提供するサービスです。単なるランキング表示ではなく、モデルの強みや弱点、用途ごとの向き不向き、評価データの代表サンプル、評価結果の納期保証などを提供することで、AIモデルの改善や導入判断に使える情報へ変換しているとのこと。一般向けランキングは無料のまま維持されており、企業向けの詳細分析サービスが収益源になっています。

なお、今回Arenaが発表した「年換算収益(ARR)」は一般的なSaaSで使われる「毎年繰り返し入ってくる契約収益」とは少し意味が異なるとのこと。Arenaの共同創業者兼CEOであるアナスタシオス・ニコラス・アンゲロプロス氏はTechCrunchに対し、顧客への課金は利用量に基づくものであり、厳密には継続収益ではないと説明しています。



Arenaは2026年1月に1億5000万ドル(約243億円)のシリーズA資金調達を発表した際、年換算収益が3000万ドル(約49億円)だったとTechCrunchは報じています。約半年で年換算収益が3倍超になった背景には、AIモデルの基礎的な学習が終わった後に回答の質を調整する「ポストトレーニング」需要の高まりがあるとのこと。モデルを一度作って終わりにするのではなく、人間の評価や追加データを使って回答の質を調整する工程が一般的になり、評価分析サービスの需要が高まっているとみられます。

Arenaはテキスト、コード、画像認識、画像生成といった分野のランキングに加え、長時間かかる複雑な作業を評価する「Agent Mode」も導入しています。Agent Modeは調査、レポート作成、ウェブサイト作成、コード修正といった複数ステップの作業でAIモデルを試すための機能で、従来型の固定ベンチマークでは見えにくい「最後まで作業を終えられるか」「事実と異なる内容を混ぜないか」といった点を測るために使われます。Arenaによると、Agent Modeはリリースから約1カ月で月間500万ターン超に達し、週10%のペースで伸びているとのこと。

記事作成時点のAgent Modeのランキングはこんな感じ。推論設定をHighにしたClaude Fable 5がトップで、平均よりも13.34%高いパフォーマンスを記録しています。



Arenaによると、記事作成時点でプラットフォームには累計7億件超の会話、8200万件超の投票、月間1000万人超の訪問者が集まっているとのこと。アンゲロプロス氏は「多くの人はArenaが収益を上げていることすら理解しておらず、今でもオープンソースプロジェクトだと思っている」とTechCrunchに述べています。Arenaは今後もarena.aiの開発に投資し、よりよい機能、より多くのツール、AIを使って作業する新しい方法を作っていくと説明しています。