2026.06 リサーチ資料

LM Arena 完全ガイド
AIの実力を“投票”で決めるサイト

最新AIを無料で試せて、しかも世界ランキングに貢献できる — その仕組みを丸ごと解説

600万+

これまでの投票数

300+

ランキング対象モデル

ジャンル別ランキング

🏟️

そもそも LM Arena とは？

ひとことで言うと、「AIモデルの実力を、人間の投票で決める」世界最大のランキングサイトです。

従来のベンチマークとは“逆”の発想

これまでAIの強さは「テスト問題を解かせて点数をつける（ベンチマーク）」が主流でした。でもこの方法、テスト向けに最適化されたAIが有利になりがちで、“実際に使って気持ちいいか”とはズレることがあります。

LM Arena は逆。普通のユーザーが「どっちの回答が良いか」を投票し、その積み重ねでランキングが決まります。だから“リアルな使用感”に近い評価が得られるのが最大の特徴です。

元はUC Berkeleyの研究プロジェクト

2023年に「Chatbot Arena」として誕生 → 2024年「LMArena」→ 2026年1月28日から正式名称は「Arena（arena.ai）」にリブランド。アカデミックな実験が、いまやAI業界の“公式スコアボード”的な存在になっています。

⚙️

仕組み — チェスの強さの測り方をAIに応用

質問を入力する

あなたが普通に質問やお願いを打ち込む

名前を伏せた2つのAIが回答

どっちがGPTでどっちがClaudeか、この時点では分からない

良かった方に投票

投票するとモデル名が判明。完全に中立な評価ができる

Eloレーティングで集計

チェスの強さを測る仕組みを応用。強い相手に勝てば大きく加点、格下に負ければ大きく減点

💡 「Elo（イロ）レーティング」って？

もともとチェスプレイヤーの強さを数値化する仕組み。AIにも同じ考え方を使い、対戦結果から各モデルの点数を更新していきます。世界中のユーザーが投票を繰り返した結果、600万票以上・300以上のモデルがランキング化されています。

🎮

4つのモード

⚔️

看板機能

Battle Mode

匿名2体を対決させて投票。ランキングの源になる、中立な実力比較モード。

🤖

自律実行

Agent Mode

複雑なタスクを丸投げできる。AIが自分で考えて最後まで作業をやり遂げる。

💬

指名比較

Side by Side

自分で選んだ2つのモデルを並べて比較。名前が分かった状態で見比べられる。

🗨️

お試し

Direct

1つのモデルと普通に会話。最新AIを無料でサッと試したいときに便利。

🗂️

文章だけじゃない — 9ジャンルのランキング

テキストAIだけでなく、画像生成・動画生成のランキングまでそろっているのがポイント。

📝 テキスト 💻 コード 👁️ 画像認識（Vision） 🌐 WebDev 🖼️ 画像編集 🖼️ 複数画像編集 🔍 検索 🎬 テキスト→動画 🎞️ 画像→動画

🦄

裏話 — 無料サイトが“ユニコーン企業”に

時価総額約1,700億円（17億ドル）

ただの研究サイトかと思いきや、2025年5月に約600億円評価で100億円を調達、さらに2026年1月には時価総額約1,700億円のユニコーン企業に。「無料で使える比較サイト」が、実は超巨大ビジネスになっています。投資家には a16z など著名VCも名を連ねます。

🤖

続き：Agent Mode 徹底解説

「丸投げで全部やる」最新モードの使い方とエンジン指定の話

→