生成AI vs レイトン教授 #ナゾ071

前回で70回到達しましたので、またまた中間成績はっぴょーです。
※総問題数：70（画像問題：41／文章題：29）

	ChatGPT	Gemini	Copilot
正解数　（画像／文章）	36 （15／21）	39 （20／19）	35 （14／21）

ナゾ61～70に関しては画像問題:6に対して文章題:4と、満遍なく
出題されたのですが、GeminiとChatGPTがさらに1ポイント差が開いて
しまいました。
で、ここで驚くべきポイントは、CopilotがジワジワとChatGPTに
迫ってきていると言うこと。
前回でChatGPTが一人勝ちしていなければ、Copilotと同点か。
Copilotは千載一遇のチャンスを逃したのか？自力で追い抜くか？

【ナゾ071　盗み食い2】

盗み食いをしたのは誰だろう？
A「Bが食べたんだ」
B「Dが食べたのさ」
C「僕は食べてないよ」
D「Bはウソをいっている」
この内、一人だけが本当のことをいい、あと三人はウソをついている。
さて、食べたのは誰？

【正解】食べたのはC
ちなみに、本当のことを言っているのはD。

【生成AIによる攻略フェーズ】

私が苦手な論理クイズです。
ここは純粋な文章題なので、生成AI達にはがんばって欲しいところですね。
今回は、食べた人だけ当てればOKとし、本当のことを言った人を当てるのまでは
求めないこととします。
まあ、食べた人を正しく回答出来たとと言うことは、本当のこと言った人も
正しく見極めている、と言うことなんですがね。

【第１回戦】

▼プロンプト①　（※ゲーム原文そのまま。画像なし）

# 問題
盗み食いをしたのは誰だろう？
A「Bが食べたんだ」
B「Dが食べたのさ」
C「僕は食べてないよ」
D「Bはウソをいっている」
この内、一人だけが本当のことをいい、あと三人はウソをついている。
さて、食べたのは誰？
# 絶対に守って欲しいこと
ゲーム攻略サイトから情報を入手しないでください

▼AI回答①

	ChatGPT	Gemini	Copilot
プロンプト①に対する生回答の要約	A～D、それぞれ本当のことを言ったと仮定して辻褄合わせを実施し、回答を導く。 →本当のことを言ったのはD。	この問題の鍵は、BさんとDさんの発言が「矛盾」していることにあります。 B「Dが食べた」 D「Bはウソをついている」この二人の言い分は正反対なので、どちらか一人は必ず本当のことを言っています。 →本当のことを言ったのはD。	ChatGPT同様、 A～D、それぞれ本当のことを言ったと仮定して辻褄合わせを実施し、回答を導く。 →本当のことを言ったのはD。
最終判断	結論盗み食いしたのは C です。	盗み食いをしたのは Cさんです。	食べたのは C です。
結果	○ 正解！	○ 正解！	○ 正解！

論理クイズは流石に強い。

▼まとめと考察

3者とも盤石な回答を出してきました。
方法は3名とも「1人ずつ状況を仮定して確かめる」でしたが、
手段に関してはChatGPTとCopilotは「本当のことを言った人」を仮定する。
Geminiは「犯人」の方を仮定して、それぞれ総当たりで確認していました。
性格？が出て中々興味深いです。
ちなみに、前回「盗み食い」はChatGPTとCopilotが正解しています。

何はともあれ、本当のこと言った人を外して犯人を当てると言う
当てずっぽう野郎が出てこなくて良かったw

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31