Google DeepMindが2018年に開発した、アミノ酸の配列情報からタンパク質の立体構造を予測するAI「AlphaFold」は、多くの重要な分野での研究を加速させることを目的に、2021年にオープンソース化されました。2024年5月にはより多くの生命分子の構造と相互作用を予測できるAIモデル「AlphaFold 3」をリリースし、当初は完全なモデルを公開していませんでしたが、前モデルに続いてAlphaFold 3もオープンソース化しました。

AI protein-prediction tool AlphaFold3 is now open source

https://www.nature.com/articles/d41586-024-03708-4



タンパク質は筋肉の収縮・血液の輸送・光の感知・食物のエネルギー変換など、ほぼすべての生物学的プロセスに関連する物質ですが、人間が発見した2億を超えるタンパク質のほとんどはアミノ酸配列しか判明していないほど複雑な構造を持っています。アミノ酸配列から立体構造を推測することは「タンパク質のフォールディング問題」と呼ばれ、長年にわたり生物学上の大きな問題となってきました。従来では時間とコストがかかりすぎるタンパク質の立体構造解析をAIで大きく改善したのが、Google DeepMindのAlphaFoldです。

タンパク質の立体構造を予測するAI「AlphaFold」はどのように生物学の世界を変えているのか? - GIGAZINE



2018年にAlphaFoldがリリースされた後、2020年にはタンパク質の構造予測において根本的な進歩を遂げたAlphaFold 2がリリースされました。そして2024年5月に発表されたAlphaFold 3は、タンパク質だけでなく広範囲の生命分子を扱うことが可能になり、再生可能材料や回復力のある作物の研究から医薬品設計やゲノミクス研究まで、幅広い分野で科学的革新を後押しすることを期待されています。

そして2024年11月11日、Google DeepMindはAlphaFold 3を前モデルに続いてオープンソース化しました。AlphaFold 3のソフトウェアコードはGitHubで公開され、誰でもダウンロードして使用することができます。



Google DeepMindの創設者であるデミス・ハサビス氏と共に2024年度のノーベル化学賞を受賞したシニア・リサーチ研究者のジョン・M・ジャンパー氏は、AlphaFold 3のオープンソース化にあたって「人々がこれを使って何をするかを見るのがとても楽しみです」と語りました。また、Google DeepMindのコンピューターサイエンティストであるプッシュミート・コーリ氏はXで「AlphaFold 3のモデルコードとウェイトが学術目的で利用可能になりました。私たちGoogle DeepMindは、研究コミュニティが生物学の未解決問題や新しい研究分野に取り組むためにAlphaFoldをどのように活用していくのか楽しみにしています」と投稿しています。



Google DeepMindは当初、研究目的でのアクセスを可能にすることと商業的利益を保護することの適切なバランスを取るために、AlphaFold 3をウェブサーバー経由でのみ利用できるようにしていました。しかし、論文を公開したNature誌が定める公開性や査読の標準に反していたことや、コードやモデルのウェイト、タンパク質構造やその他のデータでソフトウェアをトレーニングして得られるパラメータを抜きでAlphaFold 3を公開したことは「構造解析の再現性を損なう」として、科学者から強い批判を受けていました。そこでGoogle DeepMindは方針を転換し、リリースから半年程度でAlphaFold 3のオープンソース版を提供しました。

AlphaFold 3は誰でもGitHubからダウンロードできますが、記事作成時点では、安定した構造解析に必要なトレーニングウェイトにアクセスするためには、学術機関に所属する科学者がリクエストする必要があります。GitHubでは、「AlphaFold 3モデルパラメータへのアクセスをリクエストするには、フォームを送信してください。アクセスはGoogle DeepMindの独自の裁量で許可されます」と記載されています。