実はDeepMindの囲碁AI「AlphaGo」や進化版である「AlphaZero」のコア部分はひっそりとオープンソース化されている

AI開発企業のDeepMindが開発し、人間のトップ棋士を打ち負かしたことで話題を呼んだ囲碁AIの「AlphaGo」や、あらゆるボードゲームを学習できる進化版AIの「AlphaZero」のコアとなる部分が、実はひっそりとGitHubでオープンソース化されていると指摘されています。
Do you know that DeepMind has actually open-sourced the heart of AlphaGo & AlphaZero?
It’s hidden in an unassuming repo called “mctx”: https://t.co/GpNtwH9BxA
It provides JAX-native Monte Carlo Tree Search (MCTS) that runs on batches of inputs, in parallel, and blazing fast.
???? pic.twitter.com/nscU17HCUV— Jim Fan (@DrJimFan) February 14, 2023
NVIDIAのAI研究者であるJim Fan氏が「AlphaGoやAlphaZeroのコア部分」だと主張しているのは、DeepMindがGitHubで公開しているJAXネイティブ実装を備えたライブラリの「Mctx」です。Mctxは入力に対して並行かつ超高速で実行されるJAXネイティブのモンテカルロ木探索を提供し、アクセラレーターを最大限に活用してパラメーター化された学習環境モデルでアルゴリズムを動作させられるとのこと。
https://github.com/deepmind/mctx

モンテカルロ木探索は、ランダムなシミュレーション結果を基にして探索木を構築し、短時間である程度のレベルで正解に近い答えを出すヒューリスティクスなアルゴリズムです。
モンテカルロ木検索は囲碁やチェスといったターン制ゲームで最良の手を導き出すために有用であり、Fan氏は「これは間違いなくAlphaGoの最も複雑なコンポーネントであり、これを効率化することはさらに重要です」と述べています。
MCTS is a search algorithm that solves for the best move in turn-based games by selecting → expanding → simulating → updating the nodes in a strategy tree.
It is arguably the most complex component of AlphaGo - and making it efficient is even more nontrivial.
2/ pic.twitter.com/t8bdInouxZ— Jim Fan (@DrJimFan) February 14, 2023
DeepMindのMctxライブラリはAlphaGoだけでなく、囲碁以外の将棋やチェスといったボードゲームにも対応しているAlphaZeroや、ルールがわからない状態からでも「パックマン」などのゲームでハイスコアが出せるMuZeroにも対応しているとのことです。
DeepMind’s mctx library powers not just AlphaGo, but also AlphaZero (plays Go, Chess, and Shogi from scratch) and MuZero (AlphaZero + also solving Atari games).
AlphaZero: https://t.co/LVENeLcJvy
MuZero: https://t.co/FS6FfBKLA3
3/— Jim Fan (@DrJimFan) February 14, 2023
