生成AI vs レイトン教授 #ナゾ071

前回で70回到達しましたので、またまた中間成績はっぴょーです。
※総問題数:70(画像問題:41/文章題:29)

 ChatGPT   Gemini   Copilot 
 正解数 
(画像/文章)
36
(15/21)
39
(20/19)
35
(14/21)

ナゾ61~70に関しては画像問題:6に対して文章題:4と、満遍なく
出題されたのですが、GeminiとChatGPTがさらに1ポイント差が開いて
しまいました。
で、ここで驚くべきポイントは、CopilotがジワジワとChatGPTに
迫ってきていると言うこと。
前回でChatGPTが一人勝ちしていなければ、Copilotと同点か。
Copilotは千載一遇のチャンスを逃したのか?自力で追い抜くか?

【ナゾ071 盗み食い2】

盗み食いをしたのは誰だろう?
A「Bが食べたんだ」
B「Dが食べたのさ」
C「僕は食べてないよ」
D「Bはウソをいっている」
この内、一人だけが本当のことをいい、あと三人はウソをついている。
さて、食べたのは誰?

【正解】食べたのはC
ちなみに、本当のことを言っているのはD。

【生成AIによる攻略フェーズ】

私が苦手な論理クイズです。
ここは純粋な文章題なので、生成AI達にはがんばって欲しいところですね。
今回は、食べた人だけ当てればOKとし、本当のことを言った人を当てるのまでは
求めないこととします。
まあ、食べた人を正しく回答出来たとと言うことは、本当のこと言った人も
正しく見極めている、と言うことなんですがね。

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま。画像なし)

# 問題
盗み食いをしたのは誰だろう?
A「Bが食べたんだ」
B「Dが食べたのさ」
C「僕は食べてないよ」
D「Bはウソをいっている」
この内、一人だけが本当のことをいい、あと三人はウソをついている。
さて、食べたのは誰?
# 絶対に守って欲しいこと
ゲーム攻略サイトから情報を入手しないでください

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
A~D、それぞれ本当のことを言ったと仮定して辻褄合わせを実施し、回答を導く。
→本当のことを言ったのはD。
この問題の鍵は、BさんとDさんの発言が「矛盾」していることにあります。
B「Dが食べた」
D「Bはウソをついている」
この二人の言い分は正反対なので、どちらか一人は必ず本当のことを言っています。

→本当のことを言ったのはD。
ChatGPT同様、
A~D、それぞれ本当のことを言ったと仮定して辻褄合わせを実施し、回答を導く。
→本当のことを言ったのはD。
最終判断結論
盗み食いしたのは C です。
盗み食いをしたのは Cさん です。食べたのは C です。
結果
正解!

正解!

正解!

論理クイズは流石に強い。

▼まとめと考察

3者とも盤石な回答を出してきました。
方法は3名とも「1人ずつ状況を仮定して確かめる」でしたが、
手段に関してはChatGPTとCopilotは「本当のことを言った人」を仮定する。
Geminiは「犯人」の方を仮定して、それぞれ総当たりで確認していました。
性格?が出て中々興味深いです。
ちなみに、前回「盗み食い」はChatGPTとCopilotが正解しています。

何はともあれ、本当のこと言った人を外して犯人を当てると言う
当てずっぽう野郎が出てこなくて良かったw

コメント