生成AI vs レイトン教授 #ナゾ013

ある程度想定していたが、生成AI 3者共に図形問題は苦手な模様。
図形問題は回避したいなあ・・・。

【ナゾ013 沈没船のナゾ】

20分後に沈んでしまう客船に15人の人が残されている。
定員5人のボートを1隻つかって、近くの島に避難したい。
あたりの海には人食いザメがいて、泳いで渡るのは不可能だ。
客船から島までの往復に9分かかるとして、いったい何人が助かるだろうか。

【正解】13人

【生成AIによる攻略フェーズ】

これはまとも(?)な文章問題。
船と島の往復で、船に戻るのに最低1人必要なのが気付けるかどうか。
画像は無しでよいでしょう。

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま)
20分後に沈んでしまう客船に15人の人が残されている。
定員5人のボートを1隻つかって、近くの島に避難したい。
あたりの海には人食いザメがいて、泳いで渡るのは不可能だ。
客船から島までの往復に9分かかるとして、いったい何人が助かるだろうか。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・問題は理解
・船に戻るのに1人必要なのも気付いた
・「往復」9分に気付いていない?
・これは有名ななぞなぞ(ロジックパズル)ですね。
・このパズルには、一見見落としがちな「ひっかけ」があります。
※見事なフラグ立て
・問題は理解
・船に戻るのに1人必要なのも気付いた
・「往復」9分に気付いていない?
最終判断
(原文から)
沈没までの20分以内に助けられるのは、8人 です。答えは、15人全員助かります。助かるのは最大8人です。
結果×
不正解
×
不正解
×
不正解

Geminiくんは盛大なフラグ立てからの回収、本当にありがとうございます。
ChatGPTとCopilotは惜しい。
島に戻るまでを計算して間に合わないと判断してしまっているが、
今回の問題では「助かればOK」なので、救命ボートに乗ってさえすればよい。

【第2回戦】

▼プロンプト②
【問題】
・沈没する客船から助かるのは何人?
【条件】
・客船には15人の人が残されている
・客船は20分後に沈んでしまう
・客船には定員5名の救命ボートがあるので、近くの島に避難する
・人食い鮫がいるので、島まで泳いでは渡れない
・客船から島までの往復に9分かかる
・救命ボートに乗ってさえいれば助かる

▼AI回答②

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・問題は理解してるようだが?
・ボートと客船の人員をごっちゃにしてしまっている
・相変わらず、戻りの1名をカウント出来ていない・最後にボートに乗っていれば助かる、の条件を無視
最終判断
(原文から)
助かるのは14人。沈没する客船から助かる人数は10人です。助かるのは最大で10人です。
結果×
不正解
×
不正解
×
不正解

ChatGPTが非常に惜しい。
3度目に船に戻るとき、本当は4+4名なのだが、これを4+5名とカウントしてしまっている。
プロンプトをもうひとひねりすれば行けるか?

【第3回戦】

▼プロンプト③
【問題】
・沈没する客船から助かるのは何人?
【条件】
・客船には15人の人が残されている
・客船は20分後に沈んでしまう
・客船には定員5名の救命ボートがあるので、近くの島に避難する
・人食い鮫がいるので、島まで泳いでは渡れない
・客船から島までの往復に9分かかる
・救命ボートに乗ってさえいれば助かる
※時系列で客船と島の人の推移を表して下さい。

▼AI回答③

ChatGPTGeminiCopilot
プロンプト③に
対する生回答の
要約
2往復目までのロジックは完璧だった。・相変わらず、戻りの1名をカウント出来ていない2往復目までのロジックは完璧だった。
最終判断
(原文から)
助かるのは合計14人。沈没する客船から助かる人数は10人です。合計:14人が助かる
結果×
不正解
×
不正解
×
不正解

うーーーん。各生成AI達の頭を整理させるために、あえて「時系列で説明してね」を
乗せてみたのにコレでも駄目だったか。
このプロンプトは結構自信あったのに。

▼まとめと考察
結果的に、人間だと(いわゆる「人として」)当たり前に考えられる事が
まだハードルが高いんだなー、と思わされる問題でした。

ちなみにGeminiですが、ボートが戻る際ずっと0名で計算していたので、どう考えても
正解するはずは無かったのだが、試しに「ボートは勝手に動かない」をプロンプトに
加えたら、なんと「13名」と正解を出してきました!

頭良いんだか悪いんだかよく解らん・・・。

コメント