「AIvs東大入試」数学満点で首席合格レベルの「チャッピー」 得点急進のワケと意外な“苦手”科目は?
AIベンチャーのライフプロンプトでは、今年2月に実施された東京大学などの2次試験問題をChatGPT(OpenAI)など複数の生成AIに解答させる実験を行った。
■今年の東大首席はチャッピー!?
AIベンチャーのライフプロンプトでは、今年2月に実施された東京大学などの2次試験問題をChatGPT(OpenAI)など複数の生成AIに解答させる実験を行った。
驚くべきは、今年、ChatGPTは、文系・理系いずれの試験でも受験者の中での最高得点である452点(文系)、503点(理系)(いずれも550点満点)をたたき出し、実際の合格者の成績と比較した場合、首席で東大に合格するレベルとなった。これは、歴代の東大合格者と比べても最も高い点数だったという。
AIの解答の採点は、科目ごとに大手予備校・河合塾の現役講師が協力した。
■約30分で満点を取れる実力
東大の一般入試は、1次試験となる大学共通テスト(110点満点)と2次試験としている東大の一般入試問題(440点満点)の合計点である550点満点で採点される。
ライフプロンプトは、今年、ChatGPTの他に、ClaudeやGeminiの生成AIに東大の試験問題を画像で読み込ませた。
難関とされる東大の理系数学(120点満点)では、試験時間が2時間半にもかかわらず、ChatGPTは37分、ClaudeやGeminiは、わずか15分ほどで解答。点数もChatGPTとGeminiが満点をたたき出し、Claudeも86点と、約7割の正答率だった。
同じAIでも点数に差が生まれることについては、ライフプロンプトの遠藤聡志代表は「AIの作り手のこだわりによって得意・不得意分野が生まれている」との見解を示す。
◇

■生成AIの得意分野が英語から数学に
ライフプロンプトでは、AIに東大の入試問題を解かせるのは2026年で3回目だという。
ChatGPTにおいては、去年まで英語が強く、数学が伸び悩んでいたのに対して、今年は英語は108点と9割の点数にとどまり、数学が1年で38点から満点に躍進した結果となった。
これは、1年間で3倍以上も得点がのびたことになる。
遠藤代表は、数学がのびた理由の1つとして、「数学力が高まるような推論をChatGPTが何度も学習してきたことで、仮説の精度が向上し、結果的に筋道を立てて思考できる高度な数理思考能力が身についたのではないか」と推察する。
■AIの苦手な分野も…
一方、今回503点のスコアだった理系分野に対して、文系分野は452点とやや低めの点数となった。
例えば、国語や歴史などは問題の中にさまざまな要素が多く、AIは文章を組み立てづらい。
さらに、解答欄には「1行で述べよ」などの文字制限もあるため、短い文章でコンパクトにまとめるという表現方法の壁にぶつかっているという。
■いずれ全科目で満点に?
自身も2017年東大の理科一類に合格している遠藤代表は、こうしたAIの進化に対して「うれしい気持ちでいっぱい」「筋道を立てて論理的に物事を考えられる思考が可能なAIはかなり人に近くなっている」と話す。
今後、東大入試ですべての科目で満点を目指せるのではと、来年の「AIvs東大入試」への挑戦に期待をにじませていた。