生成AI vs レイトン教授 #ナゾ002

前回の【ナゾ001】から、イイ意味で生成AIのポテンシャルを確認出来たので
調子に乗って、ナゾ002も攻略していきます。

【ナゾ002】
ハンドルが差し込めないと、橋を渡ることができない!
ハンドルを差し込む部分の形状に合った穴を見つけよう。

【正解】
正解は①


【生成AIによる攻略フェーズ】
人間様から見れば、一目瞭然の①が正解なのだが、これを説明するとなると
とたんにハードモードになる。生成AIの観点はいかに?

【第1回戦】
▼プロンプト① (※ゲーム原文そのまま)
ハンドルが差し込めないと、橋を渡ることができない!
ハンドルを差し込む部分の形状に合った穴を見つけよう。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・画像2つまでしか受け付けてくれない・・・(非課金)
・ので、画像BとCを投入
・画像は非課金でも4つUP可能。
・問題そのものは理解しているっぽい。(空間認識モノ)
・画像は非課金でも4つUP可能。
・問題そのものは理解しているっぽい。(空間認識モノ)
最終判断
(原文から)
ぴったり合うのは ②番のハンドル です。したがって、選ぶべきハンドルは です。この形状に最も合っているのは、選択肢3です。
結果×
不正解
×
不正解
×
不正解

全員不正解。雲行きが怪しくなってきた・・・。
では次からプロンプトを変えていく。
画像の上の方の形と、下の方の形に合う物を組合わせてくれるよう指示してみる。
あ、間違っていた場合、答えを誘導する事になるので、
プロンプトに「その答えは間違っているよ」は禁句とする。

【第2回戦】
▼プロンプト
・各画像の上がハンドルの画像です。
・ハンドルは各画像同じものの別確度の画像になります。
・このハンドルと同じ形状の穴を持つのは①、②、③のどれでしょうか?
▼AI回答②

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・説明は通っているっぽい・こちらのプロンプトに理解無し。
・考察無しでいきなり答えから出してくる。頑固野郎。
・説明は通っているっぽい
最終判断
(原文から)
したがって、ハンドルの形と最も一致するのは③番 ですしたがって、このパズルに合うハンドルは です。この形状に最も合っているのは、選択肢3です。
結果×
不正解
×
不正解
×
不正解

おいおいマジか。Copilotなんて「空間認識モノは得意です!」とか言ってるのにコレ?
Gemini以外はこちらの説明が通っているような応答をしているだけに、難しくなってきた。
ハンドルの簡単な形状を説明に加えてみる。

【第3回戦】
▼プロンプト
・各画像の上がハンドルの画像です。
・ハンドルは各画像同じものの別確度の画像になります。
・ハンドルは、丸柱の1段目の上に正五角形柱の2段目が付いています。
・その正五角形柱の頂点や辺に、三角形や四角形の突起が3つ付いています。
・その正五角形柱の頂点に突起が付いている場合と、辺に突起が付いている場合があります。
・穴の絵には、段差を表す陰影があります。
・このハンドルの2段目が入る穴は①、②、③のどれでしょうか?
▼AI回答

ChatGPTGeminiCopilot
プロンプト③に
対する生回答の
要約
・説明は凄く理解してくれている・相変わらずの。頑固野郎。
・人の話を聞け
・説明は凄く理解してくれている
最終判断
(原文から)
したがって、ハンドルの形と最も一致するのは②番 ですしたがって、このパズルに合うハンドルは です。この形状に最も合っているのは、選択肢3です。
結果×
不正解
×
不正解
×
不正解

ここまでやってもダメ??マジで??
あああああ、これで3アウト。2問目にして早くも白旗です。


▼まとめと考察
説明はちゃんと通って理解しているようなリアクションがあるだけに悔しい。
おそらくだが、3者共に頑なに①を選択しないところを見ると、下段の穴のイラストの
立体を表す「陰」が悪さをしているような感じがする。
ChatGPTは画像2枚で勝負したが、4枚投入でも結果は変わらない気がする。
でも、これで【ナゾ001】の邪推であった攻略サイトから直接答えを引っ張ってきている説は
無くなったのかな?と見ていいのかも。

あと、Geminiは本当に頑固野郎。

これはプロンプトスクリプトを鍛えてから、後でリベンジしようと思う。

コメント