生成AI vs レイトン教授 #ナゾ014

前回は行けると思った文章題でも全員失敗。
このまま「所詮AI、人としての常識力を持つのは無理」となってしまうのか?

【ナゾ014 イス選び】

パーティから室内スポーツまで、様々な用途で利用できるホールを
作ることになった。
そこで使用するイスのデザインを公募したところ、5つの応募が
あったのだが、まともに使えるものは1つしかなかった。
それはA~Eのうち、どれだろうか。

【正解】E(積み重ね収納出来るから)

【生成AIによる攻略フェーズ】

今回のナゾはクイズ的な要素も引っかけも無く、実務的な「問題」になります。
絵から「重ねることが出来るイスか?」を見分けることができるか否か?
「画像解析」から「形状から積み重ねをイメージ出来るか」がカギとなります。
これまでの生成AIの挙動から、まだこのレベルには達していない気はしますが・・・。

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま)
パーティから室内スポーツまで、様々な用途で利用できるホールを
作ることになった。
そこで使用するイスのデザインを公募したところ、5つの応募が
あったのだが、まともに使えるものは1つしかなかった。
それはA~Eのうち、どれだろうか。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
B: 金属フレーム+プラスチック座面のようなデザイン。軽くて丈夫そうで、スタッキング(重ねて収納)もできそう。多目的ホール向き。
・E: シンプルな木の椅子。軽いが、重ねて収納はできなさそう。
E (シンプルなスタッキングチェア)
スタッキング(積み重ね)が可能なデザインであり、収納性に優れています。
・シンプルな4本脚、軽量そう、背もたれあり
・スタッキング可能な形状
最終判断
(原文から)
正解:B正しく使用できるイスはEです。結論:選ぶべき椅子は「E」
結果×
不正解

正解!

正解!

おおお!今回は私がフラグを立ててしまったようです。
なんと一発正解。問題理解も回答理由もバッチリです。
(Gemini、Copilot両名にごめんなさい)
ChatGPTだけ不正解、このパターンは初めてかも。

▼まとめと考察
完全に生成AIをナメていました。見直しました。
正しい理由付け(形状からのスタッキング可不可)まで出してきましたよ。
3者ともA~Eまでのイスの形状、ある程度の特徴までちゃんと把握もしていました。

まさか画像から形を認識して、積み重ねが可能かどうかまで導き出すとは。
ChatGPTだけ不正解でしたが、その判断理由は「Eは積み重ね出来ないでしょ」
だったので、積み重ねという概念は根底にあった訳です。

ナゾ002では手も足も出なかった空間認識能力。今回は何かAIに本気スイッチを
入れさせるプロンプト命令が潜んでいたのかもしれません。

コメント