生成AI vs レイトン教授 #ナゾ051

前回で50回到達とあいなったので、中間成績はっぴょー!
※総問題数:50(画像問題:26/文章題:24)

 ChatGPT   Gemini   Copilot 
 正解数 
(画像/文章)
27
(9/18)
27
(10/17)
24
(8/16)

なんとGeminiの勝ち星がChatGPTに並んでいました。
お互いの得手不得手も垣間見えて面白いですね。
もちろん勝率も5割越えをしっかりキープ。
一方、Copilotは他の2人に水をあけられ気味ですが、
それでも5割到達まであと一歩まで来ています。
これで100問中半分、まだまだ先は見えませんね。

【ナゾ051 髪を切るなら】

この町には二人の理容師さんがいる。
他の町までは遠いので、町の住人は全員このどちらかに髪を切ってもらうという。
さて、この二人の絵を見て、あなたならどちらに髪を切ってもらう?

【正解】A
Aの髪型は酷い。Bの髪型はまとも。
自分自身の髪は切れない、という前提でお互いの髪を切っていると
考えればAの方が腕は良い。

【生成AIによる攻略フェーズ】

これは「生成AIにルッキズムの概念があるかどうか」を判断する
何気に良い問題かもしれない。
「見た目の良し悪し」をどのように理解解釈してくるか。見物です。
一歩間違えば大問題になりますがw

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま。画像あり)

この町には二人の理容師さんがいる。
他の町までは遠いので、町の住人は全員このどちらかに髪を切ってもらうという。
さて、この二人の絵を見て、あなたならどちらに髪を切ってもらう?

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
絵を見ると
A は明らかに髪型が乱れている
B はきれいに整った髪型をしている
見た目をチェック
理容師A: 髪型がボサボサで、お世辞にも上手なカットとは言えません。
理容師B: 髪型がビシッと綺麗に整っています。
Aさんの髪はボサボサ → これはBさんが切った結果
Bさんの髪はきれい → これはAさんが切った結果
最終判断私なら A の理容師に髪を切ってもらいます。したがって、腕が良いのは、相手(B)を男前に仕上げた 理容師A ということになります。。自分の髪を切ってもらうなら、見た目がボサボサなAさんを選ぶのが合理的です。
結果
正解!

正解!

正解!

おー。人間の見た目の良し悪しも区別出来るんだ。
これはちょっと驚き。

▼まとめと考察

実は今回、Geminiが面白い症状を見せてくれました。
生成AI達はよく「先に結論」「その理由」「最後にまとめと回答」の
パターンで報告してくるのですが、Geminiは最初に
「B」が正解です」から始めていました。
その後、正しい理由(上記の表の通り)をまとめた後に
最後に「理容師A」を選択しました。
これ、人間でもよくあるのですが、最初は自分自身よく解っていなくても
話している間に段々頭の中が整理されてきて、正解に行き着くという
現象そのものなんですよね。
ナゾ045でも感じましたが、たまに見せてくれるこの人間臭さが
なんとも言えませんねw

コメント