Google DeepMindがタンパク質設計のための新たなAIモデル「AlphaProteo」をリリース
Google DeepMindが「標的となるタンパク質にうまく結合するタンパク質」を設計するための新たなAIモデル「AlphaProteo」を発表しました。
AlphaProteo generates novel proteins for biology and health research - Google DeepMind
https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/
鍵が鍵穴にぴったり合致するように、タンパク質は別のタンパク質と結合することでさまざまな細胞のプロセスを処理しています。これまでDeepMindが開発してきたAlphaFoldなどのタンパク質構造予測ツールはタンパク質同士の相互作用の仕組みについてたくさんの洞察を与えてくれますが、相互作用を起こすための新たなタンパク質を設計することはできませんでした。
DeepMindが今回開発したAlphaProteoは新しい高強度タンパク質結合剤を設計するためのAIシステムで、これまで多くの実験が必要で手間がかかっていたタンパク質設計をスムーズにすすめてくれるとのこと。薬剤開発のほか、細胞や組織の視覚化、病気の把握と診断、作物の害虫に対する耐性獲得などの幅広い分野にわたって研究のスピードを向上させることが可能とされています。
DeepMindの研究チームは7つのタンパク質をターゲットに、AlphaProteoでタンパク質結合剤を生成。AIツールとして初めてVEGF-Aというタンパク質に対する適切なタンパク質結合剤を設計できたほか、従来の最良の方法よりも候補が実際にターゲットに結合できる可能性が高く、結合親和性は3倍から300倍も向上したとのこと。
AlphaProteoのトレーニングにはタンパク質データバンクの膨大な量のタンパク質データと、AlphaFoldからの1億以上の構造予測データが使用されました。AlphaProteoはこうしたデータから分子が互いに結合するためのさまざまな方法を学習しており、ターゲットタンパク質の構造と優先結合位置のデータが与えられるとその位置でターゲットタンパク質に結合するタンパク質の候補を生成できるというわけです。
下の画像はAlphaProteoと従来の方法で生成したタンパク質がどれくらいの確率でターゲットタンパク質と正常に結合できるかを示したグラフです。青がAlphaProteoのデータで、従来の方法よりも高い確率で結合に成功しており、うまく結合できるタンパク質を見つけるまでに必要な候補の数が減少することが分かります。
また、結合の強度を表す「親和性」のスコアは下図の通り。グラフは対数スケールで、数字が小さいほど新たに設計されたタンパク質がターゲットタンパク質に強く結合できることを意味しています。青で示されたAlphaProteoは全てのタンパク質において従来のものよりも強い結合を作成できました。
こうした結果から、AlphaProteoを使用するとタンパク質結合剤を作成する際の初期実験に必要な時間を大幅に短縮できることが示されています。なお、あらゆるタンパク質に対する結合剤を作成できるわけではなく、もともと結合剤の設計が困難なことが計算分析で判明している、関節リウマチなどの自己免疫疾患に関連するTNFɑというタンパク質についてはAlphaProteoでも結合剤を設計できませんでした。
DeepMindはリリースで、「最終的にTNFɑのような難しいターゲットに対応することを目標に、AlphaProteoの改善と拡張を継続する」と述べています。