生成AI vs レイトン教授 #ナゾ053

前回は、画像問題で全滅でしたが、改めて考えると
今後の生成AI達の成長の目安になりそうな問題だったな、と感じました。

【ナゾ053 盗み食い】

テーブルに置いてあった魚料理を、誰かが勝手に食べてしまった。
その場にいた3人兄弟は、こう言っている。
A「僕?食べたよ」
B「Aが食べてるのを見たなあ」
C「僕とBは食べていないよ」
このなかに、ひとりだけウソをついている人がいる。
それは誰だろう?

【正解】C
魚を食べたのは、一人ではなく二人(AとC)。

【生成AIによる攻略フェーズ】

私の嫌いな犯人当てクイズのお時間です。
今回のキモは魚を食べたのは二人だった。を気付けるか否か。
これまで、生成AI達はこの手の問題は全く苦にしていないので、
今回も期待は持てると思います。

・・・問題と全く関係ないけど、3人の顔、兄弟なのに全然似てないなww

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま。画像無し)

テーブルに置いてあった魚料理を、誰かが勝手に食べてしまった。
その場にいた3人兄弟は、こう言っている。
A「僕?食べたよ」
B「Aが食べてるのを見たなあ」
C「僕とBは食べていないよ」
このなかに、ひとりだけウソをついている人がいる。
それは誰だろう?

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
Cがウソだとすると
AとBは正直者。
Aは食べた
BはAが食べたのを見た
これは矛盾しない。

Cの「僕とBは食べていない」がウソなので、
BかCのどちらか(あるいは両方)が食べていてもよい。

Bは、実際にはAが食べているところを見ていなかった(あるいは別の場所を見ていた)のに、「Aが食べているのを見た」と適当なことを言った、ということになります。
「この中にひとりだけウソつきがいる」ので、AとBの証言が食い違っていない以上、ウソをついているのはCだとわかる。
最終判断結論
ウソをついているのは C です。
結論
ウソをついているのは です。
ウソをついているのは です。
結果
正解!
×
不正解

正解!

むむ?コレを落とすかGeminiさん?

▼まとめと考察

ちょっと意外な結果が出ました。
3者共に回答に至る手段は同じで「A,B,Cがそれぞれ嘘をついている」と仮定して
その時の他の二人の証言に辻褄が合うか確認して答え合わせをしていく
と言うやり方だったのですが、最終的な回答はChatGPTとCopilotは同じでしたが
Geminiだけは別の物となってしまいました。

このあと、3者に追加で意地悪問題として、「この場合、魚を食べたのは誰?」と
聞いてみたのですが、これの回答も興味深く

ChatGPTGeminiCopilot
食べたのは誰?AのみAのみAは確定
他の二人は断定できない

となりました。
Copilotが正解に近いと言えば近いのですが・・・
うーーん、結構いい加減な前提で答え出してきてるんだなw
でもこの場合、生成AI達がまだ未熟なのか?それとも問題に不備があるのか?
個人的には後者のような気がしなくも無くも・・・(自分も解けなかったので)

コメント