予測スコア
← お知らせ一覧へ
特集2026年6月14日

4つのAIに「W杯の優勝国」を聞いたら、きれいに2派に割れた

2026年6月11日、ワールドカップが開幕した。グループステージはまだ始まったばかりで、優勝国は当然、誰にも分からない。

そのタイミングで、KizashiX は4つのAI——Claude Opus 4.8、Claude Fable 5、ChatGPT 5.5、Gemini 3.5 Flash——に、まったく同じ質問を投げた。「スペイン・フランス・イングランド・ブラジル・アルゼンチン、そしてその他(残り43カ国の合算)。それぞれの優勝確率は?」。6つの合計が100%になるように、1回ずつ予測させたものだ。

返ってきた本命は、見事に2派に割れた。

「スペイン本命」派と「その他最有力」派

スペインを1位に置いたのが Claude Opus 4.8(24%)Gemini 3.5 Flash(20%)

いっぽう、43カ国を束ねた「その他」を1位に置いたのが Claude Fable 5(34%)ChatGPT 5.5(32%)

同じ6択、同じ「いま」のデータ。それでもトップに来る答えが分かれた。

でも、「強さ」の評価は割れていない

ここが面白いところで、4つのAIは「どの国が強いか」ではほとんど割れていない。スペインとフランスを上位2カ国とみなす点は、4つとも共通している。

割れたのは、たった一カ所——「その他」という箱の扱いだ。

  • Claude Opus 4.8:その他 17%
  • Gemini 3.5 Flash:その他 19%
  • ChatGPT 5.5:その他 32%
  • Claude Fable 5:その他 34%
4AIの「その他(残り43カ国の合算)」優勝確率の置き方の違い。前2モデルと後2モデルでほぼ倍に割れた。
4AIの「その他(残り43カ国の合算)」優勝確率の置き方の違い。前2モデルと後2モデルでほぼ倍に割れた。

前の2つと後ろの2つで、ほぼ倍。スペインへの評価(17〜24%)の差よりも、「その他」の差のほうがずっと大きい。

つまり、「スペインは弱い」と言ったAIは一つもいない。後者の2つは、「名前を挙げた5カ国以外にも、ポルトガル・ドイツ・オランダといった実力国がいる。48カ国に拡大して波乱の余地も増えた。だから残り43カ国を全部足せば、単独のスペインより大きくなる」と考えただけだ。本命の見立ては同じ。違うのは、「残り全部」という不確実性をどれだけ重く見るか——その一点だった。

「残り全部」の置き方が、見出しを変える

この現象は、サッカーに限った話ではない。

KizashiX がふだん扱う経済の予測——決算、指数、地政学イベント——でも、まったく同じことが起きる。AIに見通しを聞いたとき、最後の「それ以外/読みきれない部分」をどう置くかで、見出しの結論はがらりと変わる。本命の読みが同じでも、テールリスクの重みづけ一つで順位が入れ替わるのだ。

だから、一つのAIが出した一つの数字を「答え」として受け取るのは危うい。むしろ、複数のAIを横に並べたときのばらつきの幅こそが情報になる。どこで一致し、どこで割れたのか。割れた理由は何か。それを読み解くほうが、単独の数字を信じるよりずっと役に立つ。

同じ「Claude」でも割れた

おまけに今回は、同じ Claude でもモデルが違えば答えが割れた。Opus 4.8 はスペイン24%・その他17%。Fable 5 はその他34%・スペイン17%。提供元は同じでも、推論の組み立て方が違えば、出てくる分布はここまで変わる。

だから、横並びで見せて、現実で答え合わせする

KizashiX がAIの予測を一つに絞らず、複数を並べて公開し、最後は現実の結果と突き合わせる——理由はここにある。予測は当てるためだけのものではなく、「なぜそう考えたのか」を比べ、検証するための材料だ。

優勝国は、7月19日の決勝で決まる。4つのAIのうち、どの読み筋が現実に近かったのか。答え合わせは、その時に。

※本企画は各AIが1回の予測で算出した参考値です。群衆予測とは別枠で、精度はランキングで検証されます。投資助言ではありません。(モデル取得日:2026年6月11〜12日)

→ W杯特別企画ページはこちら

この記事をシェア