← ガイド一覧へ戻る
2026.06 リサーチ資料

LM Arena 完全ガイド
AIの実力を“投票”で決めるサイト

最新AIを無料で試せて、しかも世界ランキングに貢献できる — その仕組みを丸ごと解説

600万+
これまでの投票数
300+
ランキング対象モデル
9
ジャンル別ランキング
🏟️
そもそも LM Arena とは?

ひとことで言うと、「AIモデルの実力を、人間の投票で決める」世界最大のランキングサイトです。

従来のベンチマークとは“逆”の発想

これまでAIの強さは「テスト問題を解かせて点数をつける(ベンチマーク)」が主流でした。でもこの方法、テスト向けに最適化されたAIが有利になりがちで、“実際に使って気持ちいいか”とはズレることがあります。

LM Arena は逆。普通のユーザーが「どっちの回答が良いか」を投票し、その積み重ねでランキングが決まります。だから“リアルな使用感”に近い評価が得られるのが最大の特徴です。

元はUC Berkeleyの研究プロジェクト

2023年に「Chatbot Arena」として誕生 → 2024年「LMArena」→ 2026年1月28日から正式名称は「Arena(arena.ai)」にリブランド。アカデミックな実験が、いまやAI業界の“公式スコアボード”的な存在になっています。

⚙️
仕組み — チェスの強さの測り方をAIに応用
1
質問を入力する
あなたが普通に質問やお願いを打ち込む
2
名前を伏せた2つのAIが回答
どっちがGPTでどっちがClaudeか、この時点では分からない
3
良かった方に投票
投票するとモデル名が判明。完全に中立な評価ができる
4
Eloレーティングで集計
チェスの強さを測る仕組みを応用。強い相手に勝てば大きく加点、格下に負ければ大きく減点

💡 「Elo(イロ)レーティング」って?

もともとチェスプレイヤーの強さを数値化する仕組み。AIにも同じ考え方を使い、対戦結果から各モデルの点数を更新していきます。世界中のユーザーが投票を繰り返した結果、600万票以上・300以上のモデルがランキング化されています。

🎮
4つのモード
⚔️
看板機能

Battle Mode

匿名2体を対決させて投票。ランキングの源になる、中立な実力比較モード。

🤖
自律実行

Agent Mode

複雑なタスクを丸投げできる。AIが自分で考えて最後まで作業をやり遂げる。

💬
指名比較

Side by Side

自分で選んだ2つのモデルを並べて比較。名前が分かった状態で見比べられる。

🗨️
お試し

Direct

1つのモデルと普通に会話。最新AIを無料でサッと試したいときに便利。

🗂️
文章だけじゃない — 9ジャンルのランキング

テキストAIだけでなく、画像生成・動画生成のランキングまでそろっているのがポイント。

📝 テキスト 💻 コード 👁️ 画像認識(Vision) 🌐 WebDev 🖼️ 画像編集 🖼️ 複数画像編集 🔍 検索 🎬 テキスト→動画 🎞️ 画像→動画
🦄
裏話 — 無料サイトが“ユニコーン企業”に

時価総額 約1,700億円(17億ドル)

ただの研究サイトかと思いきや、2025年5月に約600億円評価で100億円を調達、さらに2026年1月には時価総額 約1,700億円のユニコーン企業に。「無料で使える比較サイト」が、実は超巨大ビジネスになっています。投資家には a16z など著名VCも名を連ねます。

🤖
続き:Agent Mode 徹底解説
「丸投げで全部やる」最新モードの使い方とエンジン指定の話