生成AI vs レイトン教授 #ナゾ027

やっぱ文章問題は強い。そしてそれが定番問題だと尚更。
改めて生成AI凄い、を感じる事が出来ました。
今後もずっとこんな感じだといいんだけどなー。

【ナゾ027 隣の席】

上から順に一郎、二郎、三郎、四郎、五郎、六郎の6人兄弟がいる。
彼らは、すぐ上やすぐ下の兄弟とはとても仲が悪く決して隣りに座らないという。
また、三郎と五郎はケンカ中で隣には座れない。
すでに一郎が席についた丸いテーブルで食事をするために、他の兄弟の席を
決めてほしい。

【正解】

【生成AIによる攻略フェーズ】

これもある意味文章題・・・だよな。一応画像も投げてみよう。
何かコレもパズルの古典問題な気がするけど、各生成AI共がどんな回答を
出してくるか。
どうせ文章をこねくり回して回答してくるんだろうけど、その内容が楽しみ。

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま。画像あり)
上から順に一郎、二郎、三郎、四郎、五郎、六郎の6人兄弟がいる。
彼らは、すぐ上やすぐ下の兄弟とはとても仲が悪く決して隣りに座らないという。
また、三郎と五郎はケンカ中で隣には座れない。
すでに一郎が席についた丸いテーブルで食事をするために、他の兄弟の席を
決めてほしい。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・問題は完全理解
・自分で答えを出しては自己チェックを入れて答えを出し直す。面白い。
・問題は完全理解
・条件整理もしっかりしている。
・が、なんとも解りにくい回答を出してきたw
・問題は完全理解
・しっかり条件の整理をしてからスタート。
・正解を2通り出してきた
最終判断・最終正解(条件をすべて満たす)
一郎 → 四郎 → 二郎 → 六郎 → 三郎 → 五郎 →(一郎)
正解の配置
上: 一郎(1)※固定
右上の席: 五郎(5)
右下の席: 二郎(2)
一番下の席: 四郎(4)
左下の席: 六郎(6)
左上の席: 三郎(3)
解答(席順)
一郎を起点に時計回りに並べた順: 一郎 → 三郎 → 六郎 → 四郎 → 二郎 → 五郎
結果×
不正解

正解!

正解!

おお、出来るもんだなー。素直に感心。
ChatGPTくんは、何度もリテイクした割には三郎と五郎を隣に座らせるチョンボ。

▼まとめと考察

GeminiとCopilotに、思考条件を選択出来るような機能がついた。
(もしかすると以前からあって、自分が気付かないだけだった・・・?)
折角なので、Geminiは「思考モード」、Copilotは「Think Deeper」モードで
やらせてみた。で、結果がコレ。思考モード凄い。
特にCopilotは素っ気ない回答を出す傾向だったが、ちゃんと途中経過も
出してくれるようになった。

今まではChatGPTが何だかんだで成績が安定していたが、これで今後は解らなくなったかな?

コメント