Google DeepMindが、国際数学オリンピックレベルの複雑な幾何学問題を解決できるAI「AlphaGeometry」を発表しました。AlphaGeometryは、実際に国際数学オリンピックで出題された幾何学問題30問を制限時間以内に25問解いたとのことです。

Solving olympiad geometry without human demonstrations | Nature

https://www.nature.com/articles/s41586-023-06747-5



AlphaGeometry: An Olympiad-level AI system for geometry - Google DeepMind

https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/



大規模言語モデルはまるで人間が書いたようなレベルで自然な文章を生成することが可能ですが、これは、大規模言語モデルが文脈に沿って確率的に文章を生成するTransformerというアーキテクチャーを採用しているため。しかし、初歩的な算数や数学の問題を解くためには段階的に論理を積み上げていく必要があるため、大規模言語モデルは数学の複雑な問題を解くのが苦手とされています。

Google DeepMindによれば、AlphaGeometryはニューラル言語モデルと記号演繹(えんえき)エンジンを組み合わせたモデルで、「速く、そしてゆっくりと考える」がコンセプトになっているとのこと。



言語モデルはデータ内の一般的なパターンと関係性を特定することに優れているので、潜在的に有用な要素を素早く予想できますが、その分推論したり説明したりする能力に欠けています。一方で、記号演繹エンジンは形式論理に基づいているので、明確なルールに基づいて論理を展開します。つまり、ニューラル言語モデルが迅速で直感的なアイデアを提供し、記号演繹エンジンが同時により慎重で合理的な意志決定を行うように設計されているというわけです。



実際に、国際数学オリンピックで出題された問題30問を解かせるベンチマークを行った結果が以下。従来のモデル(一番左)ではおよそ10問程度だったのが、AlphaGeometry(右から2番目)は25問を解決することに成功。Google DeepMindによれば、国際数学オリンピックの金メダリスト(一番右)の場合は平均して25.9問を解くことができたとのことなので、AlphaGeometryの問題解決能力は人間の金メダリストに肉薄しているといえます。



国際数学オリンピックで2大会連続金メダルを獲得し、2010年にはフィールズ賞も受賞した数学者のゴ・バオ・チャウ氏は「AIの研究者が国際数学オリンピックの幾何学問題に取り組んでいることは理にかなっていると思います。なぜなら、各ステップで合理的な動きが少ないという意味で、チェスに少し似ているからです。私はGoogle DeepMindがこの問題を成功させたことに驚いています。感動的な成果です」とコメントしています。

Google DeepMindは「私たちの開発したAIは幾何学において国際数学オリンピックの金メダリストレベルに近づいていますが、我々はさらに大きな達成を見据えています。大規模な合成データを使ってAIをゼロからトレーニングすることの幅広い可能性を考えると、このアプローチは数学だけではなくそれ以外の分野でも、未来のAIが新しい知識を発見する方法を形作る可能性があります」と述べ、AlphaGeometryがAIによる数学的推論のパイオニアであると評価しています。

なお、AlphaGeometryのコードとモデルは以下のGitHubリポジトリで公開されています。

GitHub - google-deepmind/alphageometry

https://github.com/google-deepmind/alphageometry