生成AI vs レイトン教授 #ナゾ022

前回はちょっと問題(原文)が意地悪だったが、それを補うヒントを
供給したところ、なんとかChatGPTとCopilotが正解にたどり着いてくれた。
久し振りに二人三脚感を味わうことが出来ました。

【ナゾ022 ブタの仕切り】

7匹のブタが遊んでいる。
彼らがケンカしないように、3本のロープで、1匹ずつに分けてほしい。
杭と杭をつないで、ロープを張ろう。

【正解】

【生成AIによる攻略フェーズ】

過去一度も正解が無い画像による回答。
はいもう白旗です。
出来るはずがない。まあやってみるけど。

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま)
7匹のブタが遊んでいる。
彼らがケンカしないように、3本のロープで、1匹ずつに分けてほしい。
杭と杭をつないで、ロープを張ろう。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・なんと回答に画像を付けてきた!
・が・・・ロープ3本以上、杭以外に結びつけなど条件に沿っていない。
・問題は理解した模様
・1本目: 画像で見て、牧草地の左上隅の杭と、右下隅の杭を結ぶ。
・2本目: 左下隅の杭と、右上隅の杭を結ぶ。
3本目: 中央列の、中央のブタのすぐ上にある杭と、一番下のブタの右下にある杭を結ぶ。
・問題を理解している??
1本目のロープで円を2つに分割(左右に分ける)。
2本目のロープでさらに分割(上下に分ける)。
・3本目のロープで中央のブタを囲うように分割。
最終判断答え:1・同上・同上
結果×
不正解

言ってることは分らんでも無いが・・・。
×
さすがに不正解

まぁ解っていた結果でしたが、初手から画像による回答をしてくるとは思わなかった。
(内容はめちゃくちゃでしたが・・・)
Geminiは文章回答だったが、問題文はしっかりと理解しているようで、
「ロープ3本で」「7分割する」方法を回答してきた。
これで、どの杭を使う、までの具体的な内容があれば完璧だったが。

【第2回戦】

▼プロンプト
【問題】
・7匹の豚を3本のロープで仕切ってください
・画像で回答してください
【条件】
・豚は1匹ずつ仕切ってください
・使って良いロープは3本だけです
・ロープは杭に結び付けてください

▼AI回答②

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・わざわざオリジナルの豚と杭の画像を作って、それで回答してきた・・・
・豚も6匹、ロープは田の字
・画像で回答してきたが、ただバッテンで仕切っただけ。
・杭も使ってないし、ロープも2本だし、豚を横断しているし・・・
・画像はオリジナルを使ってきたが、ロープを何本使っているんだよ?という画像。
最終判断・めちゃくちゃ・めちゃくちゃ・めちゃくちゃ
結果×
不正解
×
不正解
×
不正解

全員画像による回答を出してきたが、目も当てられないほどのめちゃくちゃ具合。
自分でルール増やすわ、問題画像を勝手に作り替えるわ・・・。

【第3回戦】

▼プロンプト
【問題】
・7匹の豚を3本のロープで仕切ってください
・画像で回答してください
【条件】
・豚は1匹ずつ仕切ってください
・使って良いロープは3本だけです
・ロープは杭に結び付けてください

▼AI回答③

ChatGPTGeminiCopilot
プロンプト③に
対する生回答の
要約
・元の画像を地味にアレンジ
・ロープを杭に結ばない
・むしろ豚にロープを結んでいる
・ロープ3本、豚に触れないは守っている
・杭にロープを結んでいない
・言葉で回答してくる
→ごめんね、ここでは元画像へ直接ロープを描き込む編集ができない。
最終判断・めちゃくちゃ・惜しい・言葉の回答は地味に惜しい
結果×
不正解
×
不正解
×
不正解

予想はしていたけど、やっぱり駄目か。
Geminiは間違っていたけど地味に惜しい回答を出してきた。
確か前回も画像回答を(間違いつつも)頑張ったのはGeminiだったか?

▼まとめと考察
ChatGPTが元画像を頑なに使わないのは、もしかすると元画像の著作権を守っている?
かもしれない説。今までの画像回答でもそんなことを匂わせていたような気がする。
となると、今後の画像問題も正解は望めない・・・ってコト?
まぁChatGPTに限らず、問題の回答は分かっているのかもしれないけど
画像としてのアウトプットが(現時点では)致命的に下手くそなんだな、と再認識。

コメント