2023年12月頃から「ChatGPTが質問に答えてくれない」という現象が複数報告されており、OpenAIが調査を開始する事態に発展しています。新たに、ChatGPTの性能低下は「冬は休むもの」ということをAIが学習しているからではないかという説が浮上しています。

As ChatGPT gets “lazy,” people test “winter break hypothesis” as the cause | Ars Technica

https://arstechnica.com/information-technology/2023/12/is-chatgpt-becoming-lazier-because-its-december-people-run-tests-to-find-out/

ChatGPTの性能が低下しているという報告は2023年12月頃から寄せられるようになりました。具体的には「ChatGPTに質問をしても答えようとしない」「ChatGPTが質問に興味がないような反応を示す」「ChatGPTが『そのタスクは自分で解決できますよね?』と言ってくる」といった現象が発生している模様。ChatGPTの開発元であるOpenAIも「ChatGPTが怠惰になっている」という報告を受けているようで、問題修正に向けて取り組んでいることを明かしています。





そんな中、AI研究者のロブ・リンチ氏が「GPT-4 Turboに『今は5月』もしくは『今は12月』というシステムプロンプトを与えた場合、『今は12月』というシステムプロンプトを与えた方が応答が有意に短くなる」という実験結果を報告しました。





リンチ氏による検証前からインターネット上には「ChatGPTが『人間がホリデーシーズンに仕事量を減らす』という事実を学習しており、ホリデーシーズンが近づくと反応が悪くなる」という「冬休み仮説」が存在していたのですが、リンチ氏の検証によって冬休み仮説がさらに補強されることとなりました。





一方で、リンチ氏と同様の実験を行ったというAI研究者のイアン・アラーホ氏は「シャピロ-ウィルク検定で実験データが正規分布していないことが確かめられたため、(正規分布を前提としている)t検定を用いて有意差を見いだすことはできない」と指摘し、冬休み仮説を否定しています。





記事作成時点ではOpenAIはChatGPTの性能低下に関する公式見解を示していません。

なお、ChatGPTの性能の変化を巡っては、「数学の問題の正答率が数カ月で98%から2%に悪化した」という研究結果も報告されています。

ChatGPTの知能が急激に低下しているとの研究結果、単純な数学の問題の正答率が数カ月で98%から2%に悪化 - GIGAZINE