大谷翔平や藤井聡太のような、同じ人間とは思えない卓越した能力は、どうしたら得られるのでしょうか? 生まれつき決まっているのでしょうか? それとも努力や環境しだいなのでしょうか?

近年、発達著しいゲノムサイエンスによって個人の遺伝的素質がすべて暴かれるようになり、「遺伝と能力」についての研究は一気に加速しました。その数々の成果は、これまで誤解だらけだった「遺伝」そして「能力」の正体を明らかしつつあります。

今回は、能力の遺伝からの影響を説明する客観的事実をどう示すか、という問題について取り上げます。遺伝子上の個人差を探すよりも、もっと有効な母データの発見で、遺伝行動学は飛躍的に発展したのです。

心理的形質に影響する「遺伝子探し」の始まり

行動遺伝学の時代はすでに長く、ゴールトンにさかのぼれば150年、行動遺伝学会設立から数えても50年になり、再現性のある結果を出しつづけている。

しかし、そのほとんどは、双生児法をはじめとした血縁者間の表現型の類似性に、量的遺伝学のモデルを当てはめ、遺伝率の推定や遺伝・環境構造のモデル化を行ってきただけであった。そこに具体的な遺伝子の特定がともなってきたのは、1996年である。

それまでは、心理的形質に与える遺伝の影響を、どれだけ大規模な双生児プールを用い、膨大な統計量をもって推定しても、それが遺伝率何パーセントだとか、知能と学業成績の間には遺伝相関があるとか、発達によって遺伝率が変化したというような報告は、行動遺伝学のモデルを熟知しない人からは、残念ながら少なからず疑いの目で見られてきた。

具体的な遺伝子を特定することなしに、いくら遺伝の影響はあると叫んでも、信頼性は低く受けとめられがちだった。

それが1996年に、「新奇性追求」とDRD4(出典1) 、「不安」と5HTT(出典2)との関連が相次いで『Nature Genetics』誌や『Science』誌に報告されたことで、潮目が変わった。新奇性追求と不安といったあいまいな、本当にそれが実体としてあるのか気のせいなのかわからない心の動きについて、具体的な遺伝子が見つかったのである。ここから一気に、心理的形質の遺伝子探しが始まった。

単一の候補遺伝子探しでは、見つからなかった

とはいえ、しばらくはモノジェニック、つまり単一の候補遺伝子探しが続き、かえってその寄与率の低さや、説明力の弱さが印象づけられた(出典3)。一つ一つの遺伝子の多型の説明率は0.01%台から0.1%台程度にすぎず、それをいくつか足し合わせても、その心理的形質の個人差を十分に説明できたというにはほど遠かった。

たとえば、初めて「知能の遺伝子」として報告されたIGF2Rという神経の成長因子の遺伝子(出典4)のある多型では、平均的知能のグループがそのタイプを15%持つのに対して、高い知能のグループは30%持つという程度の差でしかなく、しかもその研究はすぐに再現されないことがわかった。

そうした状況は、遺伝子の単位ではなく1塩基の違い、すなわちSNP*探しになってもあまり変わることはなかった。2013年の論文では23万人のサンプルで、わずか3ヵ所のSNPしか基準に引っかからず、その知能の説明率は2.6%程度だった(出典5)。

*SNP:「一塩基多型」のことで、遺伝子上にある個々の塩基の違い(これが個人差となる)

2016年の論文は30万人弱のサンプルでIQ関連のSNPを特定しようとしたものの74個程度しか特定できず、その説明率は6%だった。サンプルを40万人に増やし、関連するSNP数が162個になっても、説明率は7%弱であった(出典6)。

しかし、2018年にサンプル数が100万人を超えたとき、説明率は一気に10%を超えた(出典7)。

ターニングポイントとなった「学歴データ」

これは、このとき(調査自体は2017年)に実測した知能検査の得点(IQ)ではなく、UKバイオバンクなどにある「教育年数」、すなわちフルタイムでの学校教育を何年過ごしたかという、いわば「学歴」のデータを、知能の代替指標として使えることに気づいたからだ。

わが国の国勢調査でも、最終学歴は誰もが提供する「ありきたりの調査変数」である。中卒か高卒か大卒か大学院まで進学するかは、主として経済的事情や本人の進学意志によって決まるもので、頭のよさとも多少は関係するかもしれないが誤差が多そうで、それがIQと直結するとはあまり考えない。そこが盲点だった。

実際のところ、学歴とIQの間には、0.6程度という中程度の相関がある。そしてサンプル数が100万の規模になると、誤差を考慮してもなお知能の代替指標としてSNP探しに有効に使えることがわかったのだ(図4-1)。まさに数の勝利である(出典8)。

教育年数を指標として見出された「10個の遺伝子」

さらに、教育年数を指標として見つけ出された10個の遺伝子から算出されたポリジェニック・スコア(PGS)**は、学歴の長さを説明するだけでなく、それ以上にIQのばらつきをも説明できることがわかった(このことは、また稿をあらためてご説明しよう)。

**ポリジェニック・スコア(PGS):関連のあることがわかったたくさんのSNPの効果を足し算することで、遺伝的な形質がどの程度現れるか、数値化すること。ポリジェニック・インデックスとも。例えば、ある疾患にかかわるSNPが発見された時に、その疾患にどれくらいかかりやすいか、どの程度の高さの素因を持つかを数値化することなど。このように、疾患を発症するリスクに関わる場合は、ポリジェニック・リスク・スコアとも言う。

そしてサンプル数が300万人になったとき、その説明力は13%から16%に達した(出典9)。サンプル数と説明率はリニア(直線的)な関係にはないが、着実に関連SNP数とその説明率を増やしていることは図「PGS による教育年数の説明率と、サンプルの大きさとの関係」を見れば明らかである。

PGS による教育年数の説明率と、サンプルの大きさとの関係(Okbay, A.et al.(2022))

これは、GEAS(genome-wide association study)、すなわち全ゲノム関連解析によって突きとめられている塩基配列の、数万ヵ所から数百万ヵ所の塩基の違い(つまりSSNP)を、DNAマイクロアレイを用いて大量に検出する手法から得られた産物である。

さて、こうしたPGSだが、どのように求めるのだろうか。じつは、意外に単純な方法で求められる。続いて、PGSの求め方をご説明しよう。

