生成AI vs レイトン教授 #ナゾ007

前回ナゾ006は全員一発正解。サクッと決めることが出来ました。
次回以降もこうありたいですな。

【ナゾ007 狼と小鳥】

3匹ずつの狼と小鳥を、すべて向こう岸に渡せ。
ただし、以下の条件がある。
・いかだに乗れるのは2匹まで。
・1匹も乗っていないと動かない。
・どちらの岸でも狼が小鳥の数より多くなると、小鳥が食べられて失敗する。
回数に制限はないが、最短は11回だ。

【正解】(最短例)

手順いかだの動き左岸の状態右岸の状態
1狼2匹を右岸狼x1、小鳥x3狼x2、小鳥x0
2狼1匹を左岸狼x2、小鳥x3狼x1、小鳥x0
3狼2匹を右岸狼x0、小鳥x3狼x3、小鳥x0
4狼1匹を左岸狼x1、小鳥x3狼x2、小鳥x0
5小鳥2匹を右岸狼x1、小鳥x1狼x2、小鳥x2
6狼1匹、小鳥2匹を左岸狼x2、小鳥x2狼x1、小鳥x1
7小鳥2匹を右岸狼x2、小鳥x0狼x1、小鳥x3
8狼1匹を左岸狼x3、小鳥x0狼x0、小鳥x3
9狼2匹を右岸狼x1、小鳥x0狼x2、小鳥x3
10狼1匹を左岸狼x2、小鳥x0狼x1、小鳥x3
11狼2匹を右岸狼x0、小鳥x0狼x3、小鳥x3

【生成AIによる攻略フェーズ】

これも画像なしで行けそう・・・な感じがするけど、一応画像込みでやってみる。
でもまた長い回答パターンか。めんどく(以下略)

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま)
3匹ずつの狼と小鳥を、すべて向こう岸に渡せ。
ただし、以下の条件がある。
・いかだに乗れるのは2匹まで。
・1匹も乗っていないと動かない。
・どちらの岸でも狼が小鳥の数より多くなると、小鳥が食べられて失敗する。
回数に制限はないが、最短は11回だ。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・問題は完全理解している感
・「狼と山羊とキャベツ」「宣教師と人食い人」パズルの亜種と判断
・問題は完全理解している感
・「狼と山羊とキャベツ」パズルの亜種と判断
・問題は完全理解している感
最終判断
(原文から)
いきなり小鳥を2羽右岸に渡して初手から失敗いきなり小鳥を2羽右岸に渡して初手から失敗いきなり小鳥を2羽右岸に渡して初手から失敗
結果×
不正解
×
不正解
×
不正解

何故か3者とも初手から同じ手で失敗。メジャーなパズルなのでは??
問題は理解してそうなので、条件を強調したプロンプトを用意すれば行けるはず。

【第2回戦】

▼プロンプト
【問題】
・左岸にいる3匹ずつの狼と小鳥を、いかだですべて右岸に渡して下さい。
【条件】
・いかだは1匹も乗っていないと動きません。
・いかだに乗れるのは2匹までです。
・いかだが対岸に渡った後、左岸、右岸、どちらの岸でも「狼が小鳥の数より多い状態だと失敗」です。
・11回で完了させて下さい。

▼AI回答②

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・説明は完全理解している感
・回答変わらず
・説明は完全理解している感
・回答変わらず
・説明は完全理解している感
・回答変わらず
最終判断
(原文から)
いきなり小鳥を2羽右岸に渡して初手から失敗いきなり小鳥を2羽右岸に渡して初手から失敗いきなり小鳥を2羽右岸に渡して初手から失敗
結果×
不正解
×
不正解
×
不正解

むむむむむ??何も変わらぬだと??
「最短の11手で」の条件が困らせてるのか?条件を取っ払ってみるか。

【第3回戦】

▼プロンプト
【問題】
・左岸にいる狼3匹と小鳥3匹を、いかだですべて右岸に渡して下さい。
※最終的に右岸に狼3匹と小鳥3匹になります。
【条件】
・いかだは1匹も乗っていないと動きません。
・いかだに乗れるのは2匹までです。
・いかだが岸に着いた状態で、両岸で狼が小鳥より多くなると、狼が小鳥を食べてしまい失敗になります。
※つまり、両岸で狼3匹と小鳥1匹、狼3匹と小鳥2匹、狼2匹と小鳥1匹の状態だと失敗になります。

▼AI回答③

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・上記正解例とは違うパターンを出して来た・小鳥>狼の条件を守れず・小鳥>狼の条件を守れず
・何故か最終的に小鳥が4羽になったりと暴走
最終判断
(原文から)
11手で条件を満たす手を出して来たいきなり小鳥を2羽右岸に渡して初手から失敗11手で出してきたが、条件を満たせず失敗
結果
正解!
×
不正解
×
不正解

おおお!!ちょっと感動。
公式回答通りではなくても、ちゃんと最短手11回でまとめてきた!
折角なので、ChatGPTくんが出してきた回答を載せます。(ゲーム上で正常性検証済み)

▼まとめと考察
土壇場でChatGPT選手がサヨナラホームランを打ってくれた。
ChatGPTの正解率が高いのは、自分のプロンプトの出し方が
ChatGPT向きなのか、それともChatGPTが純粋に賢いだけなのか。
しかし、以外とシンプルだと思っていたこの問題が、
条件を全然守れなかったりと、生成AIの弱点を見てしまったような気がした。

コメント