生成AI vs レイトン教授 #ナゾ005

前回ナゾ004で正解したので、一応五分には持ち込んでいる。

【ナゾ005 デジタル時計】

図のようなデジタル時計の時間表示で、同じ数字が連続して
三つ以上並ぶのは、一日のうちで何分間あるだろうか。
ただし、このデジタル時計は12時間表示式で、
正午、真夜中の十二時は12:00と示すものとする。

【正解】
答えは「34分間」

【生成AIによる攻略フェーズ】
今回は今までに無いパターン。今までとは逆で、人間様がちょっと苦労するヤツ。
こういうのを待っていた。
絵をAIに渡さなくてもプロンプトだけでいけそう?

【第1回戦】

▼プロンプト① (※ゲーム原文そのまま)
図のようなデジタル時計の時間表示で、同じ数字が連続して
三つ以上並ぶのは、一日のうちで何分間あるだろうか。
ただし、このデジタル時計は12時間表示式で、
正午、真夜中の十二時は12:00と示すものとする。

▼AI回答①

ChatGPTGeminiCopilot
プロンプト①に
対する生回答の
要約
・問題はしっかり理解してそう
・導き方もほぼ完成
・問題はやや理解している模様
・0が連続するのをカウント出来ていない?
・問題が理解出来ていない?
・「同じ数字が3つ以上」の判定がおかしい。
最終判断
(原文から)
最終答え:1日のうちで 32分間答えは、一日のうちで14分間です。一日のうちで、同じ数字が3つ以上連続して並ぶ時間は「128分間」ある。
結果×
不正解
×
不正解
×
不正解

ChatGPTがあと一歩及ばなかった。と言うか回答への過程を見ていると、
「そこまで解っていて何故それを見落とす??」があった。(ちなみに01:11が抜けていた)
正解が目の前なんだけど、次のプロンプトはChatGPT贔屓にならないようにしないと・・・。

【第2回戦】
▼プロンプト

【問題】
・デジタル時計の表示内で、「同じ数字が3つ以上」並ぶ分数を求めたい
【条件】
・デジタル時計は、4桁表示(時間2桁、分2桁)です
・デジタル時計は、12時間表記なので、正午、真夜中の十二時は12:00と表示されます。

▼AI回答②

ChatGPTGeminiCopilot
プロンプト②に
対する生回答の
要約
・問題はしっかり理解している
・導き方もほぼ完成
・なんかもう解っていた
 コイツは自分の回答を曲げない
・問題は理解出来た模様
・なんかプログラム組んできたよ?
最終判断
(原文から)
最終答え:1日のうちで 32分間答えは、一日のうちで14分間です。一日のうちで、同じ数字が3つ以上連続して並ぶ分数は「68分間」である。
結果×
不正解
×
不正解
×
不正解

プロンプトを変えたけど、元々の出題内容のフォーマットが変わったくらいで
あまりヒントにはならなかったか?
答えを変えてきたのはCopilotだけ。これがちょっと惜しい。
Geminiは本当に頑固。自分の間違いを認めない。

【第3回戦】
▼プロンプト

【問題】
・デジタル時計の表示で「同じ数字が3つ以上」並ぶ分数を求めてください
【条件】
・デジタル時計は、4桁表示(時間2桁、分2桁)です
・デジタル時計は、12時間表記なので、正午、真夜中の十二時は12:00と表示されます。
・表示例として、1時台は「01:00~01:59」になります。
・時計表示で存在しない時間表示は正解に含まれません。(例えば09:99)

▼AI回答③

ChatGPTGeminiCopilot
プロンプト③に
対する生回答の
要約
・問題はしっかり理解している
・導き方も完璧だったが・・・?
・はいはい、もういいです・あれあれあれ???
最終判断
(原文から)
最終答え:1日のうちで 32分間答えは、一日のうちで14分間です。一日のうちで、同じ数字が3つ以上含まれる時刻表示は「252分間」ある。
結果
不正解?
×
不正解
×
不正解

これまでの導き方の経緯から、ChatGPTとCopilot救済のためのプロンプトのつもりだったけど、
Copilotくんはますます混乱してしまった模様・・・ごめんよ。
その替り、ChatGPTくんはバッチリ回答を出して来た。来たんだけど・・・。

表(赤点線枠)では「1分x7 + 10分」をしっかり出せているのに(ちなみにこれが正しい)
下の合計計算(青点線枠)では何故か「1分x6 + 10分=16分」で計算してしまっている。
※この分数を午前午後分で倍にすると、答えになる。17x2=34分が正解。
こんなことってある???

▼まとめと考察
ChatGPTは戦いに勝ったのに結果で負けた。部分点は出してあげたい。
つーか、生成AIがこんな人間くさい間違いをしてくるとは思わなかった。

コメント