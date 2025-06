2025年5月、スイスの研究チームが学術誌のCommunications Psychologyに発表した論文で、ChatGPTやGeminiなどの大規模言語モデルが心の知能(emotional intelligence、EI)を測定するテストで人間より高いパフォーマンスを発揮すると報告しました。この結果はAIが人間よりも感情をより良く理解している可能性を示唆していますが、専門家からは疑念の声も上がっています。

スイスのジュネーブ大学とベルン大学の研究チームは、EIの測定に広く使用されているSituational Test of Emotion Management(STEM)やGEMOK-Blendsなどのテストを用いて、ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Claude 3.5 Haiku、Copilot 365、DeepSeek V3をテストしました。人間の専門家により検証された答えと比較してみたところ、大規模言語モデルはEIテストで「正しい」反応を選択する割合が平均で81%に達し、人間の56%を上回りました。また、ChatGPTに対して新しいEIテストの作成を依頼したところ、人間の評価者はChatGPT製テストが元のテストと同等の難易度であり、かつ内容を言い換えただけのものではないと評価しました。研究チームは、「これらの結果はChatGPTのような大規模言語モデルが、従来は人間にしか可能ではないとみなされてきた社会感情的なタスクにおいて、少なくとも人間と同等か場合によってはそれ以上の能力を有することを示す証拠の蓄積に貢献しています」「これらの発見は、大規模言語モデルを社会的エージェントとして活用するだけでなく、社会感情的スキルを評価する活用法にも重大な示唆をもたらします」と結論付けました。しかし、科学系メディアのLive Scienceが複数の専門家に意見を聞いたところ、専門家らはテストの方法論について念頭に置く必要があると指摘しました。一般的に使用されているEIテストは選択式であり、これはあらゆる可能性がある現実世界のシナリオにそのまま適用できるものではないとのこと。情報セキュリティ専門家のタイムール・イジュラル氏は、「人間は他人の感情について必ずしも意見が一致するとは限らず、たとえ心理学者であっても感情のシグナルについて異なる解釈をすることがあるという点に注目するべきです。このようなテストで人間に『勝った』からといって、必ずしもAIの洞察が深いということにはなりません。これが意味するのは、統計的に予想される答えをより頻繁に出したということです」と述べています。メンタルヘルス専門家向けのAI文書管理ツール・CliniScriptsの創業者であるナウマン・ジャファー氏は、「AIシステムはパターン認識に優れており、特に感情的な手がかりが表情や言語的シグナルのような認識可能な構造に従っている場合、特にその能力は顕著です」「しかし、それを人間の感情に対する深い『理解』と同一視することは、AIの実際の機能を過大評価するリスクがあります」と指摘。研究で明らかになったのはAIが持っているEIではなく、パターン認識能力だろうとの見方を示しました。ほとんどの専門家は、AIが人間よりも感情をより良く理解しているという主張には難があると考えていました。しかし、ブラジルのAI開発企業・HAL-AIのマルコス・アウヴェスCEOは、HAL-AIが開発したトラック運転手向けの会話型AIであるAíltonが、運転手とのリアルタイムの会話における感情識別能力が人間よりも優れていると主張しています。あるケースでは、同僚が事故で死亡して取り乱しているドライバーに対し、Aíltonは迅速かつ的確に繊細なニュアンスを込めたお悔やみの言葉を送りました。また、メンタルヘルスリソースにアクセスできることを伝えたほか、車両管理者にも自動のアラートを発したとのことです。アウヴェス氏は、膨大な文章や音声会話を吸収する大規模言語モデルの能力により、人間が見逃しがちな微細なイントネーションを読み取れると考えています。Aíltonのデータは、大多数の人間よりも優れた感情の検出と応答能力を有しており、大規模なスケールで共感をもたらすことができると主張しました。