後期更新世から完新世までのアジア東部北方の人口史(追記有)
追記(2024年1月10日)
指摘を受けて福建省の前期新石器時代遺跡(Qihe)の漢字表記を斎河から奇和洞に訂正し、要約を新たに掲載しました。
後期更新世から完新世までのアジア東部北方の人口史に関する研究(Mao et al., 2021)が公表されました。この研究はオンライン版での先行公開となります。
●要約
北京の南西56km にある田园(田園)洞窟(Tianyuan Cave)で発見された個体により示されたように、アジア東部北方は現生人類(Homo sapiens)により早くも4万年前頃には居住されていました。本論文はアムール地域の33600~3400年前の25個体から得られたゲノム規模データを用いて、田園個体関連祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)が最終氷期極大期(Last Glacial Maximum、略してLGM)前にアジア東部北方に拡大していた、と示します。LGM亜氷期の終わりに、最初のアジア東部北方人がアムール地域に出現し、この人口集団は古代アジア東部北方人の基底部です。アムール地域の人口集団は14000年前から遺伝的継続性を維持しており、これら初期の住民は古代旧シベリア人の既知の最も近いアジア東部供給源を表します。本論文は、エクトジスプラシンA受容体(ectodysplasin A receptor、略してEDAR)遺伝子のV370Aアレル(対立遺伝子)がLGM後に高頻度に上昇した可能性が高いことも観察し、その選択の可能性のある時期を示唆します。本論文は、アジア東部北方の人口動態を詳しく調べます。
●研究史
現生人類(Homo sapiens)は早くも4万年前頃にはアジア東部北方に存在していました(関連記事)。アジア東部北方の定義には、モンゴル高原と中国北部と日本列島と朝鮮半島とロシア極東山岳地域が含まれ、その全てはヨーロッパ中央部および南部と類似の緯度の範囲に位置します。ヨーロッパでは、人口集団の移動と規模は氷期の気候変動の影響を受け、たとえば人口規模は30000~13000年前頃に13万人~41万人の範囲で変動しました(関連記事1および関連記事2)。これらの気候変動は、海洋酸素同位体ステージ(MIS)3(57000年前頃以降)と2(29000年前頃以降)におけるモンゴルでの人類居住の間隙を示唆する考古学的知見により明らかなように、アジアの高緯度地域および高地帯の人口史に同様の影響をもたらしたかもしれません。
いくつかの研究により、9000年前頃から歴史時代にかけてのアジア東部古代人に関する理解が進展してきましたが(関連記事)、26500~19000年前頃となる最終氷期極大期(Last Glacial Maximum、略してLGM)よりも古い人類のゲノムデータは、北京の南西56km にある田园(田園)洞窟(Tianyuan Cave)で発見された4万年前頃の男性個体(関連記事)と、モンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された34950~33900年前頃となる人類の頭蓋冠(関連記事)の2点しか報告されていません。したがって、LGM亜氷期の前後のアジア東部北方の人口集団構造はほとんど知られておらず、アジア東部北方の40000~9000年前頃となる人類化石の欠如により、この先史時代の重要期間の理解が妨げられています。
●標本と古代DNA分析
アジア東部北方の深い人口史を調べるため、アムール川地域の黒竜江省の松嫩平原(Songnen Plain)で発見された古代人25個体のゲノム規模データが生成されました。この25個体の放射性炭素年代は33590~3420年前です(以下、基本的に較正年代です)。この25個体は、考古学的文脈のない建設現場、もしくは夏の雨季に松花江(Songhua River)と嫩江(Nen River)の沖積堆積物に形成された、侵食された小峡谷や小さな渓谷で発見されました。これら25個体からDNAが抽出され、120万ヶ所の参照一塩基多型を用いて濃縮されたデータの網羅率は0.002~14.453倍です。1親等もしくは2親等の親族関係にある個体と、一塩基多型が25000ヶ所未満の個体を除外すると、20個体の採集データセットが得られました。一塩基多型が5万ヶ所未満の2個体には「_LowCov」という接尾辞がつきます。
これら20個体は年代で5区分され、各集団内で類似のゲノム特性は人口集団として扱われます。その5集団とは、(1)更新世でもLGM前となるより早期(34324~32360年前頃)の1個体(AR33K)、(2)LGM末期の19587~19175年前頃となる1個体(AR19K)、(3)最終氷期末の14932~14017年前頃となる2個体(AR14.5KとAR14.1K、AR14Kと表記)、(4)12735~10302年前頃の4個体(AR13-10Kと表記)、(5)9425~3360年前頃の12個体(各表記は、AR9.2K_oが1個体、ARpost9Kが9個体、AR7.3K_LowCovが1個体、AR3.4K_LowCovが1個体)です(図1A)。以下は本論文の図1です。
●LGM前に時空間的に広範囲に存在した田園個体関連祖先系統
LGM亜氷期以前の更新世後期人口集団は、アジア東部では化石が限られているのでほとんど知られていません。アジア東部でもとくに北方の現生人類の初期の居住をよりよく理解するために、LGM前となる33600年前頃の女性個体AR33Kのゲノム特性が調べられました。まず、AR33K個体が他の世界の古代および現代の人口集団とどのように関連しているのか、f3外群分析を用いて調べられました。興味深いことにその結果からは、AR33Kとその7000年ほど前の田園個体が、他の全ての検証人口集団よりも相互により多くの遺伝的浮動を共有している、と示されました(図1Cおよび図2A)。D統計を用いた対称性検定でも、AR33Kと田園個体は他の全ての古代および現代の人口集団との比較でクラスタを形成する、と示されました。これは、qpGraphと最尤系統樹でも裏づけられます。さらに、これらの分析は、AR33Kと田園個体を全てのアジア東部人の基底部に位置づけ(図3A)、古代型ホモ属(絶滅ホモ属)からの遺伝子移入検出の分析では、AR33Kと田園個体は、以前の研究で報告されたように(関連記事)、より新しい人口集団と比較して種区分未定のホモ属であるデニソワ人(Denisovan)祖先系統の過剰を示す、明らかになりました。
以前の研究で、田園個体はベルギーのゴイエット(Goyet)遺跡で発見された35000年前頃の1個体(Goyet Q116-1)と、他の同時代のユーラシア西部人よりも多くのアレル(対立遺伝子)を共有しており、アマゾン地域の現代の人口集団と、他のアメリカ大陸先住民よりも多くのアレルを共有する、と示されました(関連記事)。AR33Kと田園個体との間の高い遺伝的類似性にも関わらず、AR33Kは田園個体ほどにはGoyet Q116-1と同じ遺伝的類似性を共有していない、と明らかになりました。代わりに、AR33Kは他のアジア東部古代人と類似の特性を示し、他のユーラシア西部古代人と比較してのGoyetQ116-1関連祖先系統の上昇傾向を示しますが、統計的有意性のちょうどカットオフ値かそれ以下でした。AR33Kが他のアメリカ大陸先住民よりもスルイ人(Suruí)と多くのアレルを共有している証拠は見つからないので、アジア東部北方ではLGM亜氷期前にすでに複雑な人口集団構造が存在していたかもしれません。以下は本論文の図2です。
33600年前頃のAR33Kは34950~33900年前頃のモンゴル北部のサルキート個体(関連記事)とほぼ同年代で、AR33Kの発見場所からの距離はサルキート渓谷(1159km)も田園洞窟(1114km)も同じくらいです。サルキート個体は、田園個体関連祖先系統(75%)と、シベリア北東部のヤナRHS(Yana Rhinoceros Horn Site)で発見された31600年前頃の2個体(関連記事)の関連祖先系統(25%)の混合と、以前の研究(関連記事)で提案されており、田園個体と同様にGoyet Q116-1とのつながりを示す、と推測されています。しかし、サルキート個体とは異なり、AR33Kは田園個体よりもヤナ関連祖先系統を多く有していません。これはおそらく、田園個体関連祖先系統が、LGM亜氷期前にアジア東部北方に、地理的にも(現在の北京近くの中国北方平原からモンゴル北東部のサルキート渓谷と中国北東部のアムール川地域まで)時間的にも(40000~33000年前頃)広範に存在していたことを示唆します。田園個体関連祖先系統を有する人々は、LGM前にアムール川地域で孤立したまま、モンゴルでヤナ関連祖先系統の人々と混合した可能性があります。以下は本論文の図3です。
●LGM末における最初のアジア東部北方人の出現
LGM亜氷期はヨーロッパでは先史時代の人口動態に大きな影響を及ぼしましたが(関連記事1および関連記事2)、この期間の深刻な気候変化がアジア東部北方の人口集団にどのように影響したのかについては、ほとんど知られていません。本論文は、26500~19000年前頃となるLGMのアジア東部の1個体(AR19K)の遺伝的証拠を報告し、それはこの過酷な期間の終わりにおけるアジア東部北方の人口動態の理解に重要です。
まず、主成分分析(図1B)と外群f3分析(図1 C)を用いてAR19Kが評価され、AR19Kはそれ以前のアジア東部人と比較して後のアジア東部人とより多くの遺伝的類似性を有する、と示されました。AR33Kと田園個体は、AR19Kおよびその後のアジア東部人により共有されていない特有の遺伝的浮動を共有しており、これはqpGraphモデル化(図3A)と系統樹により支持される関係です。この特有の浮動はD統計にも反映さています。
これらの観察から、アジア東部北方における人口集団の変化は、LGM末にはすでに起きており、レナ川中流のハイヤルガス(Khaiyrgas)洞窟(ロシアのサハ共和国)で発見された16900年前頃の未成年期女性1個体のゲノムデータに基づいて最近の研究で提案された、LGM後の人口集団の変化(関連記事)よりも早いことになります。この人口集団変化は、LGMにおいてもっと早く起きた可能性さえあります。なぜならば、22000~18000年前頃の間の遺伝的継続性が、シベリアのさらに西方のシベリア南部中央のマリタ(Mal’ta)遺跡とアフォントヴァゴラ(Afontova Gora)遺跡の個体で言及されているからです(関連記事)。アムール川流域のLGM亜氷期における追加の遺伝学的および考古学的証拠が、この地域におけるAR19Kとその後の個体群により代表される系統の出現時期の解明に必要です。
最近、遅くとも8000年前頃までに、山東省の變變(Bianbian)遺跡と淄博(Boshan)遺跡と小高(Xiaogao)遺跡と小荆山(Xiaojingshan)遺跡の個体群を含むアジア東部北方沿岸部古代人口集団(aCNEA)と、福建省の斎河(Qihe)遺跡と亮島(Liangdao)1・2遺跡と渓頭(Xitoucun)遺跡と曇石山(Tanshishan)遺跡の個体群を含むアジア東部南方沿岸部古代人口集団(aCSEA)とがすでに2つの異なる南北の遺伝的集団に分離していたかもしれない、と示されました(関連記事)。
D統計を用いると、AR19Kは、本論文で新たに報告された14000~6000年前頃の他の個体とともに、aCSEAよりもaCNEAの方と遺伝的に近い、と明らかになりました(図2B)。小荆山遺跡と變變遺跡の個体に対するD統計が均衡しているのは、それらの個体群が他のaCNEAよりも相対的に多くのaCSEA祖先系統を有していることにより説明可能です。興味深いことに、qpGraphと Treemixを用いての混合グラフモデルでは、AR19Kは14000年前頃以降のアジア東部北方個体群の基底部に位置する、と明らかになりました(図3A)。
これらの結果は、アジア東部系統の南北分離を指摘した研究の想定よりも1万年古い、早くも19000年前頃のアジア東部系統の南北分離の存在を明らかにします。さらに、14000年前頃よりも新しいアジア東部北方古代人は、AR14KよりもAR19Kの方との遺伝的浮動の共有が少なく、aCNEAにおけるAR19Kの基底部の位置と一致します。LGM亜氷期末となるAR19Kの分析は、AR19Kがこれまでに特定された最初のアジア東部北方人であり、アジア東部北方現代人とのある程度の継続性と、LGM以前にアジア東部北方に存在した現生人類(田園個体やAR33K)とは異なる遺伝的祖先系統を有する、と明らかにします。
●アムール川地域における遺伝的連続性とLGM後の人口集団の相互作用
ロシア極東の沿海地方の悪魔の門(Devil’s Gate)洞窟(関連記事)と、アムール川流域(関連記事)の新石器時代の狩猟採集民・農耕民から得られた古代DNAデータにより、現代の人口集団との遺伝的連続性がアムール川地域において8000年前頃以来存在している、と明らかになりました。しかし、アムール川地域の人口動態は、8000年前頃以前に関しては不明確です。本論文のより新しい標本群は、遺伝的類似性と年代に基づいて、AR14KとAR13-10KとARpost9KとAR9.2K_oを含む 4つの下位集団に区分されます(図1B・C)。LGM亜氷期後の広範な年代からのこの標本抽出の増加により、アムール川地域およびその周辺地域における人口動態の解像度が向上します。
全体として、主成分分析(図1B)と外群f3(図1C)とADMIXTURE分析からは、AR14KとAR13-10KとARpost9Kは遺伝的に悪魔の門新石器時代人口集団(悪魔の門N)と最も近い、と示唆されます。これは、D統計によりLGM後のアムール川地域人口集団が他のアジア東部北方古代人と比較して悪魔の門Nとより多くのアレルを共有していると示され(図4A)、qpGraphとTreemixでも裏づけられたので(図3A)、確認されました。
さらに、14000年前頃以後の短いROH(runs of homozygosity)により測定されているように、個体間の関連性の減少が観察されました。ROHとは、両親からそれぞれ受け継いだと考えられる同じアレルのそろった状態が連続するゲノム領域(ホモ接合連続領域)で、長いROHを有する個体の両親は近縁関係にある、と推測されます。ROHは人口集団の規模と均一性を示せます。この観察は、アムール川地域における局所的な人口規模の増加を示唆しており、それはおそらく、定住農耕への移行(新石器時代移行)に起因します。
外れ値となる1個体はAR9.2K_oで、14000年前頃以後のアムール川地域の古代人口集団と遺伝的に密接です。興味深いことに、AR9.2K_oは古代山東省人口集団とも一部の遺伝的類似性を共有していますが、この人口集団間の相互作用の可能性は、さらなる標本抽出により確認される必要があります。本論文の結果から、アムール川流域の現代の住民と悪魔の門洞窟の人口集団との間で報告された遺伝的連続性は、おそらく早くも14000年前頃には始まり、以前の推定よりも約6000年さかのぼります。これは、アムール川地域における土器の最初の出現を示す考古学的記録と一致します。さらに、アムール川地域の大きな生物学的多様性により、人類は狩猟や漁労や畜産など多様で豊かな生存戦略を採用でき、この遺伝的連続性が支えられました(関連記事)。
古代旧シベリア人(APS)として定義される古代の人口集団は、9800年前頃となるシベリア北東部のコリマ(Kolyma)遺跡の個体(Kolyma1)と、バイカル湖南部のウスチキャフタ3(Ust-Kyakhta-3)遺跡の個体(UKY)により代表され、古代北ユーラシア人(ANE)の子孫で、アジア東部祖先系統を有する新たに到来した人々と混合した、と提案されています(関連記事1および関連記事2)。APSはアメリカ大陸外ではアメリカ大陸先住民集団と最も密接と示されており、細石刃技術の拡大およびマンモス・ステップ生態系の拡大と関連していました(関連記事)。
しかし、アジア東部祖先系統を表す悪魔の門NとANE祖先系統を表す個体アフォントヴァゴラ3の2方向混合としてのAPSのモデル化は、UKYもしくはコリマでは成功せず、APSに寄与した可能性があるアジア東部人口集団はまだ特定されていない、と示唆されます。そこで、13000年以上前のアジア東部北方標本(AR19KとAR14K)とAPSとの間の関係が調べられました。qpAdmを用いると、UKY個体とコリマ個体はAR19K/AR14KとUSR1個体の混合としてモデル化できる、と示されます(図3B)。USR1は、アラスカのアップウォードサン川(Upward Sun River)で発見された、放射性炭素年代測定法により較正年代で11600~11270年前頃の個体です(関連記事)。
qpGraphにより、AR14K関連人口集団はAPSの直接的なアジア東部起源集団である可能性も示されました(図3A)。これは、APSが他のアジア東部北方古代人よりも14000年前頃以後のアムール川地域人口集団の方と遺伝的に密接だった、と示唆するD統計とも一致します。14000年前頃以後のアムール川地域祖先系統は、APSのアジア東部構成要素にとって悪魔の門N祖先系統よりも適しているので、アムール川地域人口集団は、APS に寄与した可能性が高いANE関連人口集団との相互作用の最前線にいたかもしれない、と本論文は提案します。
●40000~6000年前頃のアジア東部北方古代人における適応的な遺伝的多様体
古代DNAを用いてユーラシア西部人では選択が推測されていますが(関連記事)、アジア東部古代人のゲノムは限定されているので、アジア東部では同様の研究が妨げられてきました。本論文のデータを古代アジア東部人口集団の最近の研究と(関連記事)合わせると、適応的多様体の進化を理解するための、LGMの前後にまたがる40000~6000年前頃と大きな時間枠を提供できます。
アジア東部人にとって1つの重要な適応的多様体は、エクトジスプラシンA受容体(EDAR)遺伝子の一塩基多型rs3827760のV370A変異です(関連記事)。これは、北京の漢人(CHB)では頻度が93.7%に達し、ゲノム規模関連研究では、より太い毛幹やより多くの汗腺やシャベル型切歯との関連が示されています。しかし、EDAR遺伝子のV370A変異の選択の背後にある正確なメカニズムは、現代人のゲノムのみで得られた証拠を用いて検出することは困難です。
2つの選択メカニズムが提案されており、一方は2万年前頃の低紫外線環境における母乳のビタミンD増加への選択(関連記事)、もう一方は3万年前頃の温暖湿潤気候期における体温調節の発汗を調節する選択です。本論文は、LGM亜氷期前の2個体となるAR33K と田園個体を除いて、V370A変異がAR19Kを含む全てのアジア東部古代人に見られることを示します。これは、V370A変異の高頻度への上昇がLGMもしくはその直後だった可能性を示唆します。
古代DNAを用いてのこれらの直接的観察から、V370A変異は温暖湿潤環境期の選択だった、との仮説の可能性は低そうです。さらに、V370A変異の年代は、現代人のゲノムを用いて、大きな信頼区間(43700~4300年前)で11400年前頃と以前には推定されていましたが、本論文の直接的観察からは、AR19K個体で観察されるように(図4B)、このアレルは早くも19000年前頃に出現していたと示され、アレルの推定年代のより古くてより正確な上限を提供します。以下は本論文の図4です。
結論として、本論文の知見は、LGM亜氷期の前(33000年前頃以前)と後(19000~6000年前頃)を含む、アジア東部北方で長期にわたって起きた人口統計学的変化を明らかにします。この期間には14000年前頃以前に2つの大きな人口集団変化が起き、その後でアムール川地域における長期の遺伝的連続性が続きました。LGM以前には、田園個体関連祖先系統が広範に分布しており、アムール川地域ではヤナ関連祖先系統の証拠はありません。19000年前頃のLGM末には、田園個体関連祖先系統はアジア東部現代人祖先系統により置換された可能性が高そうです。
また、AR19Kに代表される最初のアジア東部北方人口集団は、LGMの最終段階にアムール川地域に出現し、全てのアジア東部北方古代人の基底部に位置します。14000年前頃以後、アムール川地域の人口集団は遺伝的連続性を維持し、APSにとって既知の最も密接なアジア東部起源集団となります。APSの1系統は、アメリカ大陸外ではアメリカ大陸先住民集団と最も近縁となります。以前には知られていなかった人口動態を明らかにすることに加えて、本論文の分析は、EDAR遺伝子のV370A変異の出現年代を限定する古代DNAの証拠を提供し、V370A変異はLGMもしくはその直後に高頻度に上昇した、と示唆されます。以下は本論文の要約図です。
●本論文の限界
本論文は後期更新世から完新世までの長期間の古代の個体群を提示しますが、詳細な人口動態の一部は、さらなる標本抽出を通じて検証される必要があります。まず、本論文で観察されたLGM後の人口集団の置換と、アジア東部北方人の環境変化への適応をさらに解明するために、LGM亜氷期を表すより多くの標本を収集しなければなりません。次に、アムール川地域と山東省沿岸部など周辺地域の古代の人口集団間の相互作用の可能性を実証するため、14000年前頃以後の追加の標本を収集しなければなりません。
●私見
以上、本論文についてざっと見てきました。田園個体(に代表される人口集団)は以前より、大きく見るとアジア東部系統に分類されるものの、現代人の直接的祖先ではない、と指摘されており(関連記事)、その後の研究でも同様の結果が提示されています(関連記事1および関連記事2)。この田園個体関連祖先系統がLGM前にはアジア東部北方において広範に存在していたことを、アムール川地域の個体AR33Kのゲノムデータにより本論文は証明しました。
ただ本論文では、ベルギーのゴイエット遺跡の35000年前頃となる1個体(Goyet Q116-1)との遺伝的関係において田園個体とAR33Kとの違いも示されており、田園個体関連祖先系統の影響の強い人口集団でも4万~3万年前頃にはすでに遺伝的分化が進んでいた、と示唆されます。本論文でも言及された田園個体とGoyet Q116-1との遺伝的類似性については、最近重要な進展があり、45000年前頃のヨーロッパ東部にはアジア東部の古代人および現代人と遺伝的に類似した集団が存在し、Goyet Q116-1にも遺伝的影響を及ぼした可能性が指摘されました(関連記事)。
田園個体関連祖先系統は、現代人には殆ど若しくは全く遺伝的影響を残していないようで、アムール川地域においては、田園個体関連祖先系統から現代人につながるアジア東部祖先系統への移行は、LGM末までには起きていたようです。現代人につながるアジア東部祖先系統を有する集団がいつどこからアムール川地域に移動してきたのかを解明するには、時空間的により広範な古代ゲノムデータが必要になります。
本論文は、アムール川地域における現代までの14000年にわたる遺伝的連続性を示した点でも注目されます。こうした更新世からの長期にわたる遺伝的連続性は、世界でも珍しいと言えるかもしれませんが、本当に珍しいのか、それとも古代DNA研究の進んでいない地域では長期の遺伝的連続性が一般的なのか、という問題に関しても、時空間的により広範な古代ゲノムデータが必要になります。
また本論文の注目点として、すでに先行研究で指摘されていた、完新世初期(新石器時代開始)の時点での、アジア東部における明確な南北の遺伝的分化(関連記事1および関連記事2)がすでに19000年前頃までに起きていた、と示したことも挙げられます。この遺伝的分化がどのようにして起きたのか解明するには、繰り返しになりますが、時空間的により広範な古代ゲノムデータが必要になります。
本論文では詳しく言及されていませんが、AR13-10K集団にまとめられている11601~11176年前頃の1個体(AR11K)のY染色体ハプログループ(YHg)がDEに分類されていることも注目されます。これは、カザフスタン南部で発見された紀元後236~331年頃の1個体(KNT004)のYHgがD1a2a2a(Z17175、CTS220)に分類されていることと関連しているかもしれません(関連記事)。KNT004はADMIXTURE分析では悪魔の門N系統構成要素の割合が高いと示されていることから、アジア東部北方にはかつてYHg-Dが現在よりも広く分布しており、そうした集団との混合により、紀元後3世紀に現在のカザフスタン南部にYHg-Dの個体が存在した、とも考えられます。この問題の解明も、時空間的により広範な古代ゲノムデータが必要になります。
アジア東部の古代ゲノム研究はユーラシア西部、とくにヨーロッパと比較するとかなり遅れており、人口史もヨーロッパほどには詳しく解明されていませんが、それでも近年の研究の進展は目覚ましく、今後の研究もできるだけ多く追いかけていきたいものです。今後の注目は、アジア東部南方系統の主要な分布地と考えられている長江流域の新石器時代集団のゲノムデータです。現時点では、長江流域新石器時代集団は、福建省の前期新石器時代個体と遺伝的に類似していると想定されていますが(関連記事)、前期新石器時代の時点で、すでにある程度遺伝的分化が進んでいることも想定されます。
参考文献:
Mao X. et al.(2021): The deep population history of northern East Asia from the Late Pleistocene to the Holocene. Cell, 184, 12, 3256–3266.E13.
https://doi.org/10.1016/j.cell.2021.04.040
指摘を受けて福建省の前期新石器時代遺跡(Qihe)の漢字表記を斎河から奇和洞に訂正し、要約を新たに掲載しました。
後期更新世から完新世までのアジア東部北方の人口史に関する研究(Mao et al., 2021)が公表されました。この研究はオンライン版での先行公開となります。
●要約
北京の南西56km にある田园(田園)洞窟(Tianyuan Cave)で発見された個体により示されたように、アジア東部北方は現生人類(Homo sapiens)により早くも4万年前頃には居住されていました。本論文はアムール地域の33600~3400年前の25個体から得られたゲノム規模データを用いて、田園個体関連祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)が最終氷期極大期(Last Glacial Maximum、略してLGM)前にアジア東部北方に拡大していた、と示します。LGM亜氷期の終わりに、最初のアジア東部北方人がアムール地域に出現し、この人口集団は古代アジア東部北方人の基底部です。アムール地域の人口集団は14000年前から遺伝的継続性を維持しており、これら初期の住民は古代旧シベリア人の既知の最も近いアジア東部供給源を表します。本論文は、エクトジスプラシンA受容体(ectodysplasin A receptor、略してEDAR)遺伝子のV370Aアレル(対立遺伝子)がLGM後に高頻度に上昇した可能性が高いことも観察し、その選択の可能性のある時期を示唆します。本論文は、アジア東部北方の人口動態を詳しく調べます。
●研究史
現生人類(Homo sapiens)は早くも4万年前頃にはアジア東部北方に存在していました(関連記事)。アジア東部北方の定義には、モンゴル高原と中国北部と日本列島と朝鮮半島とロシア極東山岳地域が含まれ、その全てはヨーロッパ中央部および南部と類似の緯度の範囲に位置します。ヨーロッパでは、人口集団の移動と規模は氷期の気候変動の影響を受け、たとえば人口規模は30000~13000年前頃に13万人~41万人の範囲で変動しました(関連記事1および関連記事2)。これらの気候変動は、海洋酸素同位体ステージ(MIS)3(57000年前頃以降)と2(29000年前頃以降)におけるモンゴルでの人類居住の間隙を示唆する考古学的知見により明らかなように、アジアの高緯度地域および高地帯の人口史に同様の影響をもたらしたかもしれません。
いくつかの研究により、9000年前頃から歴史時代にかけてのアジア東部古代人に関する理解が進展してきましたが(関連記事)、26500~19000年前頃となる最終氷期極大期(Last Glacial Maximum、略してLGM)よりも古い人類のゲノムデータは、北京の南西56km にある田园(田園)洞窟(Tianyuan Cave)で発見された4万年前頃の男性個体(関連記事)と、モンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された34950~33900年前頃となる人類の頭蓋冠(関連記事)の2点しか報告されていません。したがって、LGM亜氷期の前後のアジア東部北方の人口集団構造はほとんど知られておらず、アジア東部北方の40000~9000年前頃となる人類化石の欠如により、この先史時代の重要期間の理解が妨げられています。
●標本と古代DNA分析
アジア東部北方の深い人口史を調べるため、アムール川地域の黒竜江省の松嫩平原(Songnen Plain)で発見された古代人25個体のゲノム規模データが生成されました。この25個体の放射性炭素年代は33590~3420年前です(以下、基本的に較正年代です)。この25個体は、考古学的文脈のない建設現場、もしくは夏の雨季に松花江(Songhua River)と嫩江(Nen River)の沖積堆積物に形成された、侵食された小峡谷や小さな渓谷で発見されました。これら25個体からDNAが抽出され、120万ヶ所の参照一塩基多型を用いて濃縮されたデータの網羅率は0.002~14.453倍です。1親等もしくは2親等の親族関係にある個体と、一塩基多型が25000ヶ所未満の個体を除外すると、20個体の採集データセットが得られました。一塩基多型が5万ヶ所未満の2個体には「_LowCov」という接尾辞がつきます。
これら20個体は年代で5区分され、各集団内で類似のゲノム特性は人口集団として扱われます。その5集団とは、(1)更新世でもLGM前となるより早期(34324~32360年前頃)の1個体(AR33K)、(2)LGM末期の19587~19175年前頃となる1個体(AR19K)、(3)最終氷期末の14932~14017年前頃となる2個体(AR14.5KとAR14.1K、AR14Kと表記)、(4)12735~10302年前頃の4個体(AR13-10Kと表記)、(5)9425~3360年前頃の12個体(各表記は、AR9.2K_oが1個体、ARpost9Kが9個体、AR7.3K_LowCovが1個体、AR3.4K_LowCovが1個体)です(図1A)。以下は本論文の図1です。
●LGM前に時空間的に広範囲に存在した田園個体関連祖先系統
LGM亜氷期以前の更新世後期人口集団は、アジア東部では化石が限られているのでほとんど知られていません。アジア東部でもとくに北方の現生人類の初期の居住をよりよく理解するために、LGM前となる33600年前頃の女性個体AR33Kのゲノム特性が調べられました。まず、AR33K個体が他の世界の古代および現代の人口集団とどのように関連しているのか、f3外群分析を用いて調べられました。興味深いことにその結果からは、AR33Kとその7000年ほど前の田園個体が、他の全ての検証人口集団よりも相互により多くの遺伝的浮動を共有している、と示されました(図1Cおよび図2A)。D統計を用いた対称性検定でも、AR33Kと田園個体は他の全ての古代および現代の人口集団との比較でクラスタを形成する、と示されました。これは、qpGraphと最尤系統樹でも裏づけられます。さらに、これらの分析は、AR33Kと田園個体を全てのアジア東部人の基底部に位置づけ(図3A)、古代型ホモ属(絶滅ホモ属)からの遺伝子移入検出の分析では、AR33Kと田園個体は、以前の研究で報告されたように(関連記事)、より新しい人口集団と比較して種区分未定のホモ属であるデニソワ人(Denisovan)祖先系統の過剰を示す、明らかになりました。
以前の研究で、田園個体はベルギーのゴイエット(Goyet)遺跡で発見された35000年前頃の1個体(Goyet Q116-1)と、他の同時代のユーラシア西部人よりも多くのアレル(対立遺伝子)を共有しており、アマゾン地域の現代の人口集団と、他のアメリカ大陸先住民よりも多くのアレルを共有する、と示されました(関連記事)。AR33Kと田園個体との間の高い遺伝的類似性にも関わらず、AR33Kは田園個体ほどにはGoyet Q116-1と同じ遺伝的類似性を共有していない、と明らかになりました。代わりに、AR33Kは他のアジア東部古代人と類似の特性を示し、他のユーラシア西部古代人と比較してのGoyetQ116-1関連祖先系統の上昇傾向を示しますが、統計的有意性のちょうどカットオフ値かそれ以下でした。AR33Kが他のアメリカ大陸先住民よりもスルイ人(Suruí)と多くのアレルを共有している証拠は見つからないので、アジア東部北方ではLGM亜氷期前にすでに複雑な人口集団構造が存在していたかもしれません。以下は本論文の図2です。
33600年前頃のAR33Kは34950~33900年前頃のモンゴル北部のサルキート個体(関連記事)とほぼ同年代で、AR33Kの発見場所からの距離はサルキート渓谷(1159km)も田園洞窟(1114km)も同じくらいです。サルキート個体は、田園個体関連祖先系統(75%)と、シベリア北東部のヤナRHS(Yana Rhinoceros Horn Site)で発見された31600年前頃の2個体(関連記事)の関連祖先系統(25%)の混合と、以前の研究(関連記事)で提案されており、田園個体と同様にGoyet Q116-1とのつながりを示す、と推測されています。しかし、サルキート個体とは異なり、AR33Kは田園個体よりもヤナ関連祖先系統を多く有していません。これはおそらく、田園個体関連祖先系統が、LGM亜氷期前にアジア東部北方に、地理的にも(現在の北京近くの中国北方平原からモンゴル北東部のサルキート渓谷と中国北東部のアムール川地域まで)時間的にも(40000~33000年前頃)広範に存在していたことを示唆します。田園個体関連祖先系統を有する人々は、LGM前にアムール川地域で孤立したまま、モンゴルでヤナ関連祖先系統の人々と混合した可能性があります。以下は本論文の図3です。
●LGM末における最初のアジア東部北方人の出現
LGM亜氷期はヨーロッパでは先史時代の人口動態に大きな影響を及ぼしましたが(関連記事1および関連記事2)、この期間の深刻な気候変化がアジア東部北方の人口集団にどのように影響したのかについては、ほとんど知られていません。本論文は、26500~19000年前頃となるLGMのアジア東部の1個体(AR19K)の遺伝的証拠を報告し、それはこの過酷な期間の終わりにおけるアジア東部北方の人口動態の理解に重要です。
まず、主成分分析(図1B)と外群f3分析(図1 C)を用いてAR19Kが評価され、AR19Kはそれ以前のアジア東部人と比較して後のアジア東部人とより多くの遺伝的類似性を有する、と示されました。AR33Kと田園個体は、AR19Kおよびその後のアジア東部人により共有されていない特有の遺伝的浮動を共有しており、これはqpGraphモデル化(図3A)と系統樹により支持される関係です。この特有の浮動はD統計にも反映さています。
これらの観察から、アジア東部北方における人口集団の変化は、LGM末にはすでに起きており、レナ川中流のハイヤルガス(Khaiyrgas)洞窟(ロシアのサハ共和国)で発見された16900年前頃の未成年期女性1個体のゲノムデータに基づいて最近の研究で提案された、LGM後の人口集団の変化(関連記事)よりも早いことになります。この人口集団変化は、LGMにおいてもっと早く起きた可能性さえあります。なぜならば、22000~18000年前頃の間の遺伝的継続性が、シベリアのさらに西方のシベリア南部中央のマリタ(Mal’ta)遺跡とアフォントヴァゴラ(Afontova Gora)遺跡の個体で言及されているからです(関連記事)。アムール川流域のLGM亜氷期における追加の遺伝学的および考古学的証拠が、この地域におけるAR19Kとその後の個体群により代表される系統の出現時期の解明に必要です。
最近、遅くとも8000年前頃までに、山東省の變變(Bianbian)遺跡と淄博(Boshan)遺跡と小高(Xiaogao)遺跡と小荆山(Xiaojingshan)遺跡の個体群を含むアジア東部北方沿岸部古代人口集団(aCNEA)と、福建省の斎河(Qihe)遺跡と亮島(Liangdao)1・2遺跡と渓頭(Xitoucun)遺跡と曇石山(Tanshishan)遺跡の個体群を含むアジア東部南方沿岸部古代人口集団(aCSEA)とがすでに2つの異なる南北の遺伝的集団に分離していたかもしれない、と示されました(関連記事)。
D統計を用いると、AR19Kは、本論文で新たに報告された14000~6000年前頃の他の個体とともに、aCSEAよりもaCNEAの方と遺伝的に近い、と明らかになりました(図2B)。小荆山遺跡と變變遺跡の個体に対するD統計が均衡しているのは、それらの個体群が他のaCNEAよりも相対的に多くのaCSEA祖先系統を有していることにより説明可能です。興味深いことに、qpGraphと Treemixを用いての混合グラフモデルでは、AR19Kは14000年前頃以降のアジア東部北方個体群の基底部に位置する、と明らかになりました(図3A)。
これらの結果は、アジア東部系統の南北分離を指摘した研究の想定よりも1万年古い、早くも19000年前頃のアジア東部系統の南北分離の存在を明らかにします。さらに、14000年前頃よりも新しいアジア東部北方古代人は、AR14KよりもAR19Kの方との遺伝的浮動の共有が少なく、aCNEAにおけるAR19Kの基底部の位置と一致します。LGM亜氷期末となるAR19Kの分析は、AR19Kがこれまでに特定された最初のアジア東部北方人であり、アジア東部北方現代人とのある程度の継続性と、LGM以前にアジア東部北方に存在した現生人類(田園個体やAR33K)とは異なる遺伝的祖先系統を有する、と明らかにします。
●アムール川地域における遺伝的連続性とLGM後の人口集団の相互作用
ロシア極東の沿海地方の悪魔の門(Devil’s Gate)洞窟(関連記事)と、アムール川流域(関連記事)の新石器時代の狩猟採集民・農耕民から得られた古代DNAデータにより、現代の人口集団との遺伝的連続性がアムール川地域において8000年前頃以来存在している、と明らかになりました。しかし、アムール川地域の人口動態は、8000年前頃以前に関しては不明確です。本論文のより新しい標本群は、遺伝的類似性と年代に基づいて、AR14KとAR13-10KとARpost9KとAR9.2K_oを含む 4つの下位集団に区分されます(図1B・C)。LGM亜氷期後の広範な年代からのこの標本抽出の増加により、アムール川地域およびその周辺地域における人口動態の解像度が向上します。
全体として、主成分分析(図1B)と外群f3(図1C)とADMIXTURE分析からは、AR14KとAR13-10KとARpost9Kは遺伝的に悪魔の門新石器時代人口集団(悪魔の門N)と最も近い、と示唆されます。これは、D統計によりLGM後のアムール川地域人口集団が他のアジア東部北方古代人と比較して悪魔の門Nとより多くのアレルを共有していると示され(図4A)、qpGraphとTreemixでも裏づけられたので(図3A)、確認されました。
さらに、14000年前頃以後の短いROH(runs of homozygosity)により測定されているように、個体間の関連性の減少が観察されました。ROHとは、両親からそれぞれ受け継いだと考えられる同じアレルのそろった状態が連続するゲノム領域(ホモ接合連続領域)で、長いROHを有する個体の両親は近縁関係にある、と推測されます。ROHは人口集団の規模と均一性を示せます。この観察は、アムール川地域における局所的な人口規模の増加を示唆しており、それはおそらく、定住農耕への移行(新石器時代移行)に起因します。
外れ値となる1個体はAR9.2K_oで、14000年前頃以後のアムール川地域の古代人口集団と遺伝的に密接です。興味深いことに、AR9.2K_oは古代山東省人口集団とも一部の遺伝的類似性を共有していますが、この人口集団間の相互作用の可能性は、さらなる標本抽出により確認される必要があります。本論文の結果から、アムール川流域の現代の住民と悪魔の門洞窟の人口集団との間で報告された遺伝的連続性は、おそらく早くも14000年前頃には始まり、以前の推定よりも約6000年さかのぼります。これは、アムール川地域における土器の最初の出現を示す考古学的記録と一致します。さらに、アムール川地域の大きな生物学的多様性により、人類は狩猟や漁労や畜産など多様で豊かな生存戦略を採用でき、この遺伝的連続性が支えられました(関連記事)。
古代旧シベリア人(APS)として定義される古代の人口集団は、9800年前頃となるシベリア北東部のコリマ(Kolyma)遺跡の個体(Kolyma1)と、バイカル湖南部のウスチキャフタ3(Ust-Kyakhta-3)遺跡の個体(UKY)により代表され、古代北ユーラシア人(ANE)の子孫で、アジア東部祖先系統を有する新たに到来した人々と混合した、と提案されています(関連記事1および関連記事2)。APSはアメリカ大陸外ではアメリカ大陸先住民集団と最も密接と示されており、細石刃技術の拡大およびマンモス・ステップ生態系の拡大と関連していました(関連記事)。
しかし、アジア東部祖先系統を表す悪魔の門NとANE祖先系統を表す個体アフォントヴァゴラ3の2方向混合としてのAPSのモデル化は、UKYもしくはコリマでは成功せず、APSに寄与した可能性があるアジア東部人口集団はまだ特定されていない、と示唆されます。そこで、13000年以上前のアジア東部北方標本(AR19KとAR14K)とAPSとの間の関係が調べられました。qpAdmを用いると、UKY個体とコリマ個体はAR19K/AR14KとUSR1個体の混合としてモデル化できる、と示されます(図3B)。USR1は、アラスカのアップウォードサン川(Upward Sun River)で発見された、放射性炭素年代測定法により較正年代で11600~11270年前頃の個体です(関連記事)。
qpGraphにより、AR14K関連人口集団はAPSの直接的なアジア東部起源集団である可能性も示されました(図3A)。これは、APSが他のアジア東部北方古代人よりも14000年前頃以後のアムール川地域人口集団の方と遺伝的に密接だった、と示唆するD統計とも一致します。14000年前頃以後のアムール川地域祖先系統は、APSのアジア東部構成要素にとって悪魔の門N祖先系統よりも適しているので、アムール川地域人口集団は、APS に寄与した可能性が高いANE関連人口集団との相互作用の最前線にいたかもしれない、と本論文は提案します。
●40000~6000年前頃のアジア東部北方古代人における適応的な遺伝的多様体
古代DNAを用いてユーラシア西部人では選択が推測されていますが(関連記事)、アジア東部古代人のゲノムは限定されているので、アジア東部では同様の研究が妨げられてきました。本論文のデータを古代アジア東部人口集団の最近の研究と(関連記事)合わせると、適応的多様体の進化を理解するための、LGMの前後にまたがる40000~6000年前頃と大きな時間枠を提供できます。
アジア東部人にとって1つの重要な適応的多様体は、エクトジスプラシンA受容体(EDAR)遺伝子の一塩基多型rs3827760のV370A変異です(関連記事)。これは、北京の漢人(CHB)では頻度が93.7%に達し、ゲノム規模関連研究では、より太い毛幹やより多くの汗腺やシャベル型切歯との関連が示されています。しかし、EDAR遺伝子のV370A変異の選択の背後にある正確なメカニズムは、現代人のゲノムのみで得られた証拠を用いて検出することは困難です。
2つの選択メカニズムが提案されており、一方は2万年前頃の低紫外線環境における母乳のビタミンD増加への選択(関連記事)、もう一方は3万年前頃の温暖湿潤気候期における体温調節の発汗を調節する選択です。本論文は、LGM亜氷期前の2個体となるAR33K と田園個体を除いて、V370A変異がAR19Kを含む全てのアジア東部古代人に見られることを示します。これは、V370A変異の高頻度への上昇がLGMもしくはその直後だった可能性を示唆します。
古代DNAを用いてのこれらの直接的観察から、V370A変異は温暖湿潤環境期の選択だった、との仮説の可能性は低そうです。さらに、V370A変異の年代は、現代人のゲノムを用いて、大きな信頼区間(43700~4300年前)で11400年前頃と以前には推定されていましたが、本論文の直接的観察からは、AR19K個体で観察されるように(図4B)、このアレルは早くも19000年前頃に出現していたと示され、アレルの推定年代のより古くてより正確な上限を提供します。以下は本論文の図4です。
結論として、本論文の知見は、LGM亜氷期の前(33000年前頃以前)と後(19000~6000年前頃)を含む、アジア東部北方で長期にわたって起きた人口統計学的変化を明らかにします。この期間には14000年前頃以前に2つの大きな人口集団変化が起き、その後でアムール川地域における長期の遺伝的連続性が続きました。LGM以前には、田園個体関連祖先系統が広範に分布しており、アムール川地域ではヤナ関連祖先系統の証拠はありません。19000年前頃のLGM末には、田園個体関連祖先系統はアジア東部現代人祖先系統により置換された可能性が高そうです。
また、AR19Kに代表される最初のアジア東部北方人口集団は、LGMの最終段階にアムール川地域に出現し、全てのアジア東部北方古代人の基底部に位置します。14000年前頃以後、アムール川地域の人口集団は遺伝的連続性を維持し、APSにとって既知の最も密接なアジア東部起源集団となります。APSの1系統は、アメリカ大陸外ではアメリカ大陸先住民集団と最も近縁となります。以前には知られていなかった人口動態を明らかにすることに加えて、本論文の分析は、EDAR遺伝子のV370A変異の出現年代を限定する古代DNAの証拠を提供し、V370A変異はLGMもしくはその直後に高頻度に上昇した、と示唆されます。以下は本論文の要約図です。
●本論文の限界
本論文は後期更新世から完新世までの長期間の古代の個体群を提示しますが、詳細な人口動態の一部は、さらなる標本抽出を通じて検証される必要があります。まず、本論文で観察されたLGM後の人口集団の置換と、アジア東部北方人の環境変化への適応をさらに解明するために、LGM亜氷期を表すより多くの標本を収集しなければなりません。次に、アムール川地域と山東省沿岸部など周辺地域の古代の人口集団間の相互作用の可能性を実証するため、14000年前頃以後の追加の標本を収集しなければなりません。
●私見
以上、本論文についてざっと見てきました。田園個体(に代表される人口集団)は以前より、大きく見るとアジア東部系統に分類されるものの、現代人の直接的祖先ではない、と指摘されており(関連記事)、その後の研究でも同様の結果が提示されています(関連記事1および関連記事2)。この田園個体関連祖先系統がLGM前にはアジア東部北方において広範に存在していたことを、アムール川地域の個体AR33Kのゲノムデータにより本論文は証明しました。
ただ本論文では、ベルギーのゴイエット遺跡の35000年前頃となる1個体(Goyet Q116-1)との遺伝的関係において田園個体とAR33Kとの違いも示されており、田園個体関連祖先系統の影響の強い人口集団でも4万~3万年前頃にはすでに遺伝的分化が進んでいた、と示唆されます。本論文でも言及された田園個体とGoyet Q116-1との遺伝的類似性については、最近重要な進展があり、45000年前頃のヨーロッパ東部にはアジア東部の古代人および現代人と遺伝的に類似した集団が存在し、Goyet Q116-1にも遺伝的影響を及ぼした可能性が指摘されました(関連記事)。
田園個体関連祖先系統は、現代人には殆ど若しくは全く遺伝的影響を残していないようで、アムール川地域においては、田園個体関連祖先系統から現代人につながるアジア東部祖先系統への移行は、LGM末までには起きていたようです。現代人につながるアジア東部祖先系統を有する集団がいつどこからアムール川地域に移動してきたのかを解明するには、時空間的により広範な古代ゲノムデータが必要になります。
本論文は、アムール川地域における現代までの14000年にわたる遺伝的連続性を示した点でも注目されます。こうした更新世からの長期にわたる遺伝的連続性は、世界でも珍しいと言えるかもしれませんが、本当に珍しいのか、それとも古代DNA研究の進んでいない地域では長期の遺伝的連続性が一般的なのか、という問題に関しても、時空間的により広範な古代ゲノムデータが必要になります。
また本論文の注目点として、すでに先行研究で指摘されていた、完新世初期(新石器時代開始)の時点での、アジア東部における明確な南北の遺伝的分化(関連記事1および関連記事2)がすでに19000年前頃までに起きていた、と示したことも挙げられます。この遺伝的分化がどのようにして起きたのか解明するには、繰り返しになりますが、時空間的により広範な古代ゲノムデータが必要になります。
本論文では詳しく言及されていませんが、AR13-10K集団にまとめられている11601~11176年前頃の1個体(AR11K)のY染色体ハプログループ(YHg)がDEに分類されていることも注目されます。これは、カザフスタン南部で発見された紀元後236~331年頃の1個体(KNT004)のYHgがD1a2a2a(Z17175、CTS220)に分類されていることと関連しているかもしれません(関連記事)。KNT004はADMIXTURE分析では悪魔の門N系統構成要素の割合が高いと示されていることから、アジア東部北方にはかつてYHg-Dが現在よりも広く分布しており、そうした集団との混合により、紀元後3世紀に現在のカザフスタン南部にYHg-Dの個体が存在した、とも考えられます。この問題の解明も、時空間的により広範な古代ゲノムデータが必要になります。
アジア東部の古代ゲノム研究はユーラシア西部、とくにヨーロッパと比較するとかなり遅れており、人口史もヨーロッパほどには詳しく解明されていませんが、それでも近年の研究の進展は目覚ましく、今後の研究もできるだけ多く追いかけていきたいものです。今後の注目は、アジア東部南方系統の主要な分布地と考えられている長江流域の新石器時代集団のゲノムデータです。現時点では、長江流域新石器時代集団は、福建省の前期新石器時代個体と遺伝的に類似していると想定されていますが(関連記事)、前期新石器時代の時点で、すでにある程度遺伝的分化が進んでいることも想定されます。
参考文献:
Mao X. et al.(2021): The deep population history of northern East Asia from the Late Pleistocene to the Holocene. Cell, 184, 12, 3256–3266.E13.
https://doi.org/10.1016/j.cell.2021.04.040
この記事へのコメント