4つのAIに「W杯の優勝国」を聞いたら、きれいに2派に割れた

2026年6月11日、ワールドカップが開幕した。グループステージはまだ始まったばかりで、優勝国は当然、誰にも分からない。
そのタイミングで、KizashiX は4つのAI——Claude Opus 4.8、Claude Fable 5、ChatGPT 5.5、Gemini 3.5 Flash——に、まったく同じ質問を投げた。「スペイン・フランス・イングランド・ブラジル・アルゼンチン、そしてその他(残り43カ国の合算)。それぞれの優勝確率は?」。6つの合計が100%になるように、1回ずつ予測させたものだ。
返ってきた本命は、見事に2派に割れた。
「スペイン本命」派と「その他最有力」派
スペインを1位に置いたのが Claude Opus 4.8(24%) と Gemini 3.5 Flash(20%)。
いっぽう、43カ国を束ねた「その他」を1位に置いたのが Claude Fable 5(34%) と ChatGPT 5.5(32%)。
同じ6択、同じ「いま」のデータ。それでもトップに来る答えが分かれた。
でも、「強さ」の評価は割れていない
ここが面白いところで、4つのAIは「どの国が強いか」ではほとんど割れていない。スペインとフランスを上位2カ国とみなす点は、4つとも共通している。
割れたのは、たった一カ所——「その他」という箱の扱いだ。
- Claude Opus 4.8:その他 17%
- Gemini 3.5 Flash:その他 19%
- ChatGPT 5.5:その他 32%
- Claude Fable 5:その他 34%

前の2つと後ろの2つで、ほぼ倍。スペインへの評価(17〜24%)の差よりも、「その他」の差のほうがずっと大きい。
つまり、「スペインは弱い」と言ったAIは一つもいない。後者の2つは、「名前を挙げた5カ国以外にも、ポルトガル・ドイツ・オランダといった実力国がいる。48カ国に拡大して波乱の余地も増えた。だから残り43カ国を全部足せば、単独のスペインより大きくなる」と考えただけだ。本命の見立ては同じ。違うのは、「残り全部」という不確実性をどれだけ重く見るか——その一点だった。
「残り全部」の置き方が、見出しを変える
この現象は、サッカーに限った話ではない。
KizashiX がふだん扱う経済の予測——決算、指数、地政学イベント——でも、まったく同じことが起きる。AIに見通しを聞いたとき、最後の「それ以外/読みきれない部分」をどう置くかで、見出しの結論はがらりと変わる。本命の読みが同じでも、テールリスクの重みづけ一つで順位が入れ替わるのだ。
だから、一つのAIが出した一つの数字を「答え」として受け取るのは危うい。むしろ、複数のAIを横に並べたときのばらつきの幅こそが情報になる。どこで一致し、どこで割れたのか。割れた理由は何か。それを読み解くほうが、単独の数字を信じるよりずっと役に立つ。
同じ「Claude」でも割れた
おまけに今回は、同じ Claude でもモデルが違えば答えが割れた。Opus 4.8 はスペイン24%・その他17%。Fable 5 はその他34%・スペイン17%。提供元は同じでも、推論の組み立て方が違えば、出てくる分布はここまで変わる。
だから、横並びで見せて、現実で答え合わせする
KizashiX がAIの予測を一つに絞らず、複数を並べて公開し、最後は現実の結果と突き合わせる——理由はここにある。予測は当てるためだけのものではなく、「なぜそう考えたのか」を比べ、検証するための材料だ。
優勝国は、7月19日の決勝で決まる。4つのAIのうち、どの読み筋が現実に近かったのか。答え合わせは、その時に。
※本企画は各AIが1回の予測で算出した参考値です。群衆予測とは別枠で、精度はランキングで検証されます。投資助言ではありません。(モデル取得日:2026年6月11〜12日)