「進化」はどのように観測できるか。


 こんにちは、小谷太郎です。今日のテーマは宇宙物理ではなくヒトについてです。

 19世紀は化学が飛躍的に進歩した時代で、化学の世紀と呼ばれました。

 20世紀は物理の世紀でした。相対性理論は宇宙の見方を変え、量子力学の生みだしたエレクトロニクスや原子力などのテクノロジーが人々の生活や戦争の形態を変えました。

 では21世紀は何の時代になるのでしょうか。その17%が経過した現時点で展望すると、これは確実に、分子生物学の圧倒的な発展の世紀となるでしょう。

 2003年にヒトの全遺伝情報(ゲノム配列)が読み取られました。これを皮切りに、ゲノム読み取り技術はさらに進歩を遂げ、現在では、ヒト1個体分のゲノム配列なら、ほんの1日で解読できるところまできています。(もっとも、解読した断片の配列をつなげていく時間は別に必要ですが。)

 この技術は、生物学、医学、犯罪捜査、人類学などなどに計り知れないインパクトを与えつつあります。20世紀の手法に比べ、ゲノム解析からもたらされる情報は革新的です。これらの分野の教科書は、ゲノム解析技術によって書き換えられている最中です。学校で習った常識はどんどん時代遅れになりつつあります。

 先日2018年4月24日、理化学研究所などのグループが、「全ゲノムシークエンス解析で日本人の適応進化を解明」という発表を行ない、話題となりました。これは日本人2234人のゲノム配列データを解析し、この数千年間に進行した進化の痕跡を探した研究結果です。

【参考】
http://www.riken.jp/pr/press/2018/20180424_2/
https://www.nature.com/articles/s41467-018-03274-0

 この研究結果を紹介するとともに、分子生物学の新しい常識を解説しましょう。

[JBpressの今日の記事(トップページ)へ]

ゲノムって何だっけ

 遺伝情報、つまり生物の体の設計図は、「DNA」という長い長い鎖状の分子に記録されています。どれほど長いかというと、例えばヒトの細胞1個の中に収納されているDNAをほぐして全部1列に並べると、約2mにもなります。

 このうち半分の1m分は父親から、もう1m分は母親から受け継いだものです。この1m分の遺伝情報を「ゲノム」と呼びます。生物のゲノムの1セットには、生物の体の設計図が一通りそろっています。

 DNAは「アデニン(A)」「グアニン(G)」「シトシン(C)」「チミン(T)」という4種の「塩基」という部品が連なってできています。(長い長い焼き鳥を思い浮かべてください。)遺伝情報はA、G、C、Tという4文字で書かれた文書といえます。ACGTCC・・・という具合に続く文書です。(焼き鳥なら砂肝、ネギ、モモ、シイタケ、ネギ、ネギ、・・・という感じでしょうか。)

 ゲノムという文書は、「遺伝子」という文の集合です。ヒトのゲノムは2万〜2万5000の遺伝子からなります。遺伝子の1文は、「タンパク質分子」の1種類を表すと考えても、まあ大体合ってます。詳細は省きますが、生物の細胞はあるタンパク質分子が必要になると、ゲノム中でそのタンパク質分子の作り方が記述されている1文を参照して、その文にしたがってタンパク質分子を製造します。ヒトの体内では2万種〜2万5000種のタンパク質分子が製造され、働いています。

 またゲノム中には、過去のコピーミスのために使えなくなってしまった遺伝子や、同じ文字列が繰り返し書いてある部分や、過去にウイルスが勝手に挿入した部分や、タンパク質分子ではなく「RNA」の設計図や、結局何の役に立つのか分からない意味不明の文字列や、とてもここに全部は紹介できない誠にさまざまな落書きがひしめいています。

 それら全部を引っくるめて、ヒトのゲノムは約30億字ほどです。30億「塩基対」という言い方をします。情報量にして1ギガバイト弱です。

新常識その1:ゲノム配列データはすごい勢いで成長中

 ゲノム配列を読み取る技術を手に入れたら、これでどんどんゲノムを読み取りたくなるのが人間というものです。アリが好きな研究者はアリを捕まえてはすりつぶして読み取り装置にかけ、山芋が好きな研究者は山芋をすっては読み取り装置にかけ、化石人骨が好きな研究者はネアンデルタール人の骨や歯を削っては読み取り装置にかけ、食中毒菌が好きな保健所の人は患者の排泄物を読み取り装置にかけ、犯罪者が好きなお巡りさんは犯行現場に残された痕跡を読み取り装置にかけ、そういう調子で世界中であらゆる生物のゲノム配列データがすごい勢いで成長中です(が、最後のデータは研究用には公開されていません)。

 生物種の中でも、特にヒトのゲノム配列は、大変熱心にコレクションされています。日本列島人のデータだけでも約20万人分以上あります。さらに、英国では50万人規模のバイオバンクの構築が、米国では100万人規模のイニシアチブが開始されています。

新常識その2:現在進行中の進化が観測・測定されている

 ゲノムは、生物個体ごとに微妙に違います。例えば、ある箇所にAという文字(塩基)が書かれているゲノムを持つ個体と、そこにCと書かれているゲノムを持つ個体が集団内にいたりします。

 このように、ある1塩基が異なるゲノムが集団内に混じっている現象を、「一塩基多型(single nucleotide polymorphism)」と言います。「SNP」と書いて「スニップ」とカッコよく読みます。

 SNPは、製造されるタンパク質分子に違いをもたらし、個体の「形質」を変える場合があります。一方、形質に影響しない、サイレントなSNPもあります。

 形質を変えて、生存率や繁殖率を上げるような有利なSNPは、子孫に伝わる確率が高く、集団内に広まる傾向があります。一方、不利なSNPは、集団に占める割合が徐々に少なくなる傾向があります。これは「適応進化」です。

 みなさんの中には、学校で、「進化は長期間かかるもので、進化の進行を観測することはできない」と教わった方がいるかもしれません。筆者もそう教育されました。

 しかし現在では、生物集団のゲノム配列を解析することで、どのSNPが集団内にどんな速さで広まりつつあるのか、どのSNPがどれほどの速さで割合を少なくしつつあるのか、判定できるのです。つまり、進化を観測し、測定できるのです。

 あるSNPの進化を測定するには、そのSNPが集団に占める割合を単純に測定するだけでは駄目で、ゲノム上の他の箇所のSNPとの相関を調べるなどの高度な解析テクニックが必要です。

 そういう解析テクニックのひとつは、2016年に提案された「シングルトン・デンシティ・スコア」というものです。今後、こうした高度な解析テクニックは増えていくでしょう。

日本列島人集団の適応進化

 先日2018年4月24日、理化学研究所などのグループは、「全ゲノムシークエンス解析で日本人の適応進化を解明」したと発表しました。この研究は、日本列島人集団を研究対象にした点、シングルトン・デンシティ・スコアなどの新しい解析テクニックを用いた点、それによって約100世代(2000〜3000年)という人類の歴史の中では比較的最近のSNPの変化を検出した点などに新味があります。

 進化が検出された遺伝子領域は、「ADH1B遺伝子」「MHC領域」「ALDH2遺伝子」「SERHL2遺伝子」の4箇所です。

 ADH1B遺伝子は、アルコールを代謝するタンパク質分子「アルコール脱水素酵素」を作る遺伝子です。効率のよいADH1B遺伝子を持つ個体は酒に強いといえます。

 アルコールは代謝されると「アセトアルデヒド」という物質に変わります。アセトアルデヒドは毒で、頭痛や吐気といった症状を引き起こします。つまりこれが二日酔いの原因です。このアセトアルデヒドをさらに代謝する「アセトアルデヒド脱水素酵素」を作るのがALDH2遺伝子です。効率のよいALDH2遺伝子を持つ個体は、二日酔いになりにくく、やはり酒に強いといえます。

 MHC領域は、「ヒト白血球抗原」を決める遺伝子領域で、ある種の病気への耐性を左右します。病気への耐性が高いSNPが、適応進化の結果として広まっていくことは、納得できます。

 SERHL2遺伝子は、「セリン加水分解酵素」のようなタンパク質分子を作りますが、その役割はまだよく分かっていません。

 一見不可解なのは、アセトアルデヒド脱水素酵素とアルコール脱水素酵素の適応進化です。この研究結果は、活性が低く効率が悪い脱水素酵素ほど、過去100世代で日本列島人集団内に広まってきたことを示しています。乱暴に表現すると、酒に弱い個体ほど、生存率や繁殖率が高いのです。さまざまなヒト集団について調べた他の研究でも、北京集団や台湾集団などの東アジア人に同じ傾向が出ています。

 アルコール依存症患者の集団を調べたところ、効率のよいADH1B遺伝子やALDH2遺伝子を持つ確率が高いという調査結果があるので、酒に強い人はアルコール依存症患者になりやすい傾向があるのではないか、と考えられています。また、飲酒傾向が食道ガンのリスクを高めるためかもしれません。

 ちなみに筆者の個人情報を暴露すると、ADH1BALDH2も、高活性型をホモで持っています。さらに、麦芽の香り(イソブチルアルデヒド)の受容体遺伝子NDUFA10の高感度型をホモで持っているので、生まれつきのビール好きといってもいいでしょう。(アルコール依存の危険性には気をつけないといけません。)

新常識その3:化石人骨のゲノム配列が読み取られている

 また、有意な新発見は今回ありませんでしたが、この日本列島人集団のゲノム配列はネアンデルタール人のゲノム配列と比較されました。

 ネアンデルタール人(ホモ・ネアンデルターレンシス)は、私たちと同じヒト属(ホモ)の生物種です。ヒト属の生物種は、現在では私たちヒト属ヒト(ホモ・サピエンス)しか存在しませんが、過去にはホモ・ネアンデルターレンシス、ホモ・エレクトスなど、複数いたのです。

 ネアンデルタール人のゲノム配列などというものがどこから来たかというと、化石からです。驚いたことに、現在では、条件がよければ化石からもゲノム配列が読み取れるのです。

(変わってない)常識その4:遺伝子のほとんどは正体不明

 このように急速に理解が進んできた分子生物学ですが、まだ分かっていないことがたくさんあります。ヒトも他の生物種も、遺伝子のほとんどは未解明だということは、どこかでお聞きになったかもしれません。残念なことに、今でもその状況は変わっていません。

 人類は膨大なゲノム配列データを手に入れつつあるわけですが、その暗号文がどんなタンパク質分子を記述しているのかは、まだほとんど判明していません。2万〜2万5000種のタンパク質は、それぞれどんな機能を持ち、どんな場面で役立つのでしょうか。それが分からないうちは、読めない言語で書かれた文書をコレクションしているようなものです。

 しかし21世紀中に、この状況は劇的に改善されると予想されます。この分野の研究が極めて大きな成果をもたらすことは確実です。莫大な努力がそのために注ぎ込まれています。

 ヒトや他の生物種の遺伝子の機能が解明されれば、難病の治療法や老化の予防法が見つかるかもしれません。医療の夢は広がります。

 生物の作るタンパク質分子や酵素は、工業や農業に利用できます。未解明の遺伝子の中には、新素材や新薬を作るものがあるかもしれません。廃棄物や有害物質を分解するものが発見を待っているかもしれません。

 この産業革命はまさしく進行中です。物理の世紀は終わりました。

 大急ぎで子供に分子生物学を習わせましょう。

筆者:小谷 太郎