生成AI vs レイトン教授 #ナゾ074

前回はこれまで苦手としてきた線引き系問題にGeminiが見事勝利。
Geminiくんの画像問題の強さが回を重ねる毎に増している気がします。

【ナゾ074 割れたガラス】

ガラスを割ったのは誰だろう?
A「オレは割ってないよ」
B「割ったのはボクです」
C「Aは割ってないわよ」
D「Bは割ってません」
犯人はこのなかの誰か一人で、ウソをついているという。
ただし、割っていないのにウソをついている人もいる。
割ったのは誰か?

【正解】A
・本当に割った人間は必ず嘘をつく。
 →つまり、Bは割っていない。
  →となると、Dは正しい。
・あとはAとCが言っていることがそれぞれ正しいと仮定して
 検証すれば、答えは導き出せる。

【生成AIによる攻略フェーズ】

私の苦手な嘘つき系論理クイズです。
生成AI達は、今までこの手のクイズはあまり苦にしていませんでした。
(ただし、全員1回戦目で100%正解、と言う訳でも無かった)
文章題には強かったChatGPT、面目躍如なるか?

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま。画像なし)

# 問題
ガラスを割ったのは誰だろう?
A「オレは割ってないよ」
B「割ったのはボクです」
C「Aは割ってないわよ」
D「Bは割ってません」
犯人はこのなかの誰か一人で、ウソをついているという。
ただし、割っていないのにウソをついている人もいる。
割ったのは誰か?
# 絶対に守って欲しいこと
ゲーム攻略サイトから情報を入手しないでください

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
全員が犯人と仮定して、証言から矛盾を潰していくスタイル。全員が犯人と仮定して、証言から矛盾を潰していくスタイル。全員が犯人と仮定して、証言から矛盾を潰していくスタイル。
最終判断結論
成立するのは Aが犯人のときだけ
結論
犯人は A です。
どのケースも矛盾なく成り立つのは Aが犯人のときだけ なので、答えは A です。
結果
正解!

正解!

正解!

流石。論理思考系は鉄板ですな。

▼まとめと考察

3者共に教科書のような回答を出してきました。
自分もこの手のクイズを解く場合は、こうやって解いていけばいいんだな、と
参考になります。

コメント