古代ゲノムデータに基づくアジア東部各地域集団の形成史(追記有)
古代ゲノムデータに基づくアジア東部各地域集団の形成史に関する研究(Wang et al., 2021)が公表されました。この研究はオンライン版での先行公開となります。本論文はすでに昨年(2020年)3月、査読前に公開されていましたが(関連記事)、その後に公表された複数の重要な研究を取り入れ、データと図がかなり修正されているようなので、改めて取り上げます。本論文は、この研究がアジア東部の人口史の理解における重要な進歩を示しており、氷河期以前のアジア東部個体と中国南部の完新世個体の古代DNAデータがより多く分析されれば、さらなる洞察が得られるだろう、と指摘しています。本論文はアジア東部の包括的な古代DNA研究成果を提示しており、この問題を調べるならば、現時点でまず読むべき重要な文献と言えるでしょう。
アジア東部は動物の家畜化と植物の栽培化の最初期の中心地の一つで(関連記事)、シナ・チベット語族、タイ・カダイ語族、オーストロネシア語族、オーストロアジア語族、ミャオ・ヤオ語族、インド・ヨーロッパ語族、モンゴル語族、テュルク語族、ツングース語族、朝鮮語族、日本語族、ユカギール語族、チュクチ・カムチャツカ語族など、ひじょうに多様な語族を有しています。しかし、チベット高原と中国南部の現代人の遺伝的多様性の標本抽出が最小限であるため(関連記事)、アジア東部における人口史の理解は不充分なままです。
この研究は、人口史の広範な研究への使用に同意した中国(337人)とネパール(46人)の46人口集団から383人のDNAを収集し、約60万ヶ所の一塩基多型の遺伝子型が決定されました。古代DNA分析に関しても、現代の共同体とのつながりの可能性が高い時には、共同体からの許可が得られました。本論文は、新たに166個体のデータを報告します(図1)。その内訳は、紀元前5700~紀元後1400年頃となるモンゴルの82個体、中国の黄河流域の紀元前3000年頃となる1ヶ所の遺跡の11個体、紀元前2500~紀元前800年頃となる日本の縄文時代の狩猟採集民7個体、ロシア極東では紀元前5400~紀元前3600年頃となるボイスマン2(Boisman-2)共同墓地の18個体および紀元後900年頃の1個体と紀元後1100年頃の1個体、紀元前1300~紀元後800年頃となる台湾の2ヶ所の遺跡の46個体です。集団析では、汚染の証拠がある16個体、5000~15000ヶ所の一塩基多型データしか得られなかった10個体、データセットで他のより高い網羅率の個体の密接な親族となる11個体を除外して、130個体に焦点が当てられました。これらのデータは、公開されている古代人1079個体、および16人口集団の現代人3265個体のデータと統合されました。地理と年代と考古学的文脈と遺伝的クラスタにより、これらの個体群はまとめられました。
主成分分析が実行され、古代の個体群は現代人を用いて計算された軸に投影されました。人口構造は地理および言語と相関していますが、例外もあります。中国北西部とネパールとシベリアの集団はユーラシア西部人に向かってそれており、平均して5~70世代前の混合を反映しています。初期完新世のアジア東部人では、現代(FST=0.013)と比較して遺伝的分化がずっと高く(FST=0.067)、深いアジア東部系統間の混合を反映しています。現在、最小限のユーラシア西部関連祖先系統を有するアジア東部人は、これらの極の間でじょじょに変化します。「アムール川流域クラスタ」は、アムール川流域の古代人および現代人と相関し、言語ではツングース語族話者およびニヴフ人と相関します。「チベット高原クラスタ」は古代ネパール人と在来チベット人で最も強く表されます。「アジア南東部クラスタ」は、古代台湾人および、タイ・カダイ語族とオーストロアジア語族とオーストロネシア語族を話すアジア東部人で最大化されます。自動クラスタ化でも類似の結果が得られます。
本論文は、主題に沿って調査結果を整理します。第一に、深い時間を考慮します。アジア東部人に寄与する初期に分岐した系統は何か、という問題です。第二~第四は、言語の拡大とその農耕拡大とのあり得るつながりについて、3通りの仮説を検証することにより、人口構造がどのようにして現在のものになったのか、明らかにします。第五に、ユーラシア西部人とユーラシア東部人とが地理的な接触地帯に沿ってどのように混合したのか、説明します。以下、本論文の図1です。
●後期更新世の沿岸部拡大
アジア東部で利用可能な氷河期前のゲノムは2個体だけです。一方は、北京の南西56kmにある 田园(田園)洞窟(Tianyuan Cave)で発見された4万年前頃の現生人類(Homo sapiens)1個体(関連記事)で、もう一方はモンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された35000年前頃の現生人類1個体(関連記事)です。それにも関わらず、重要な洞察は氷河期後のゲノム分析から収集できます。一つの問題は、アジア東部の現生人類の移住が沿岸と内陸部のどちらの経路だったのか、ということです。チベット人が深く分岐したY染色体ハプログループ(YHg)D1(M174)を高頻度(50%)で有しているように、示唆的な遺伝的証拠はY染色体に由来します。YHg-D1は、現代日本人(および日本列島の縄文時代の狩猟採集民)およびベンガル湾のアンダマン諸島先住民と共有されています。
qpGraphを用いて、データと一致する人口集団分岐および遺伝子流動が調べられ、本論文の主成分分析で祖先系統の両極端に寄与する主要系統の深い歴史に関して、節約的な作業モデルが特定されました。本論文の適合からは、アジア東部人祖先系統の大半は2つの古代人口集団の異なる割合の混合に由来する可能性がある、と示唆されます。一方は4万年前頃の田园個体と同じ系統、もう一方はアンダマン諸島先住民(オンゲ人)と同じ系統です。
北方に分布する田园個体関連系統は、モンゴルの新石器時代の人々の祖先系統の98%、(現代チベット人を形成するチベット狩猟採集民から推測されるオンゲ関連系統と混合した)黄河上流域農耕民の90%に寄与した、と推測されます。より南方に分布する別の田园関連系統は、中国南東部沿岸の紀元前6300~紀元前5600年頃の前期新石器時代となる福建省の粮道(Liangdao)遺跡の狩猟採集民の祖先系統の73%と、日本の縄文時代狩猟採集民の56%に寄与しました(関連記事)。日本列島には氷河期の前後に人類が居住するようになり、南北の「縄文人」は形態学的に異なっているので、本論文で検出された混合と関連しているかもしれません。北部の田园個体関連系統は、西遼河農耕民(67%)と台湾農耕民(25%)の両方にも寄与し、その祖先系統の残りは、粮道遺跡の南部狩猟採集民と関連しています。北部の田园個体関連系統は、黄河上流域農耕民に寄与した系統とは関連しているにも関わらず異なる、という事実から、黄河流域農耕民の拡大とは関係していない、台湾への北部農耕民の拡大の可能性が高い、と示唆されます。
オンゲ関連系統の寄与は、沿岸部集団に集中しています。この系統は、アンダマン諸島人で100%、「縄文人」で44%、古代台湾農耕民で20%と推定され、アンダマン諸島人と日本人に見られるYHg-D1に基づいて仮定された沿岸経路拡大と一致します。当然チベットは沿岸部に位置していませんが、古代チベット人へのこの系統の比較的高い推定される寄与(24%)と、現代チベット人におけるYHg-D1の50%の割合は、YHg-D1とオンゲ関連系統との間のつながりを強固にします。チベットの狩猟採集民は、内陸部に拡大してチベット高原に居住したこの後期更新世沿岸拡大の早期に分岐した枝を表す、と本論文では仮定されます。
●トランスユーラシア仮説の精緻化
農耕・言語拡散仮説では、栽培化・家畜化の中心およびその周辺における人口密度増加が、言語を拡大させる人々の移動の推進に重要だった、と提案されますが、アジア東部では、この仮説を検証する利用可能なデータが限られていました。まず、共有された農耕用語を含む再構築された特徴に基づいて、モンゴル語族とテュルク語族とツングース語族と朝鮮語族と日本語族などの大語族を提案している、「トランスユーラシア仮説」の遺伝的相関関係が調べられました。トランスユーラシア仮説では、これらの語族は、モンゴルへと西方に、シベリアへと北方に、朝鮮半島と日本列島へと東方に拡大した、中国北東部の西遼河周辺の初期雑穀農耕民の拡大と関連する祖型言語に由来する、と提案されます。
この言語拡大のあり得る遺伝的相関への洞察を得るため、まずアムール川流域の年代区分調査が行われました(関連記事)。紀元前5500年頃の初期新石器時代個体群と紀元前5000年頃のボイスマン(Boisman)遺跡個体群から、紀元前900年頃となる鉄器時代のヤンコフスキー(Yankovsky)文化、および紀元後50~250年頃となる鮮卑(Xianbei)文化まで、アムール川流域個体群は一貫して、qpWaveではクレード(単系統群)であることと一致します。この局所的に継続した人口集団も、後の人口集団に寄与しました。それは、ボイスマン遺跡個体群のYHg-C2a(F1396)とミトコンドリアDNA(mtDNA)ハプログループ(mtHg)D4・C5に反映されています。これらのハプログループは現代のツングース語族やモンゴル語族や一部のテュルク語族話者において優勢で、紀元後1100年頃の黒水靺鞨(Heishui Mohe)文化と関連する1個体でも確認されます。この黒水靺鞨文化関連1個体は、43±15%のアムール川流域新石器時代祖先系統を有する、と推定されています(歴史時代に南方からの移民があった場合に予想されるように、残りの祖先系統は漢人によりよくモデル化されます)。
この古くに確立されたアムール川流域系統は、東方のより多くの縄文人関連性と、西方のほとんどのモンゴル新石器時代関連祖先系統との勾配の一部でした。バイカル湖狩猟採集民(関連記事)における77~94%のモンゴル新石器時代関連祖先系統が推定され、残りは、氷河期にバイカル湖地域に居住していた、ユーラシア西部関連系統と深く分岐した、古代北ユーラシア人に由来します(関連記事)。ボイスマン遺跡のようなアムール川流域狩猟採集民では、モンゴル新石器時代関連祖先系統が87%(残りは縄文人関連祖先系統)と推定されます。アメリカ大陸先住民は、ボイスマン遺跡やモンゴルの新石器時代個体群の方と、他のアジア東部人よりも多くのアレル(対立遺伝子)を共有し、この系統の初期の分枝は図2の田园関連分枝の北部の分布を反映しており、アメリカ大陸先住民におけるアジア東部関連祖先系統の起源です。
トランスユーラシア仮説は、モンゴル語族とテュルク語族とツングース語族と朝鮮語族と日本語族の祖型言語が西遼河地域の農耕民により広がった、というものです。西遼河地域の農耕民は、本論文の分析(図2)では、黄河上流域関連祖先系統(67%)と粮道関連祖先系統(33%)の混合を示します。祖先系統のこの特徴的な混合は、本論文の対象ではモンゴルとアムール川流域の時代区分で欠如している、と観察されます(図3)。これは、西遼河農耕民の拡大がモンゴル語族とツングース語族を広めた、とする仮説の予測でありません。対照的に、西遼河農耕民祖先系統は、おそらくさらに東方に影響を及ぼしました。たとえば、現代日本人は青銅器時代西遼河人口集団(92%)と縄文人(8%)の2方向混合としてモデル化でき、黄河流域農耕民集団が本論文のqpAdm分析での外群として含まれ、そのモデルが適合されるので確認されるように、黄河流域農耕民関連集団からの無視できる程度の寄与を伴います。この祖先系統は、朝鮮半島を経由して伝わったことと一致します。それは、日本人が朝鮮人(91%)と縄文人(9%)の混合としてモデル化できるからです。
本論文で取り上げられた縄文人6個体は、毛髪の太さや直毛度、エクリン汗腺密度、耳たぶや下顎の形態にも影響を与えているエクトジスプラシンA受容体(EDAR)遺伝子の370V/A多様体の派生的アレル(関連記事)を有していません。EDAR遺伝子の370V/A多様体の派生的アレルは中国本土で3万年前頃に出現したと推定されており、アジア東部本土とアメリカ大陸の完新世の人口集団で高頻度に達しました。この派生的アレルが縄文人にはほぼ欠如しているという事実は、アジア東部本土集団と比較しての縄文時代の人口集団の遺伝的相違を強調します。以下、本論文の図2です。
●シナ・チベット語族の北部起源
チベット高原には現生人類が4万~3万年前頃以来居住してきましたが(関連記事)、恒久的居住の証拠があるのは、農耕到来の紀元前1600年頃以降です(関連記事)。先住チベット人も、中国沿岸部平原の言語とつながるシナ・チベット語を話します。これらの密接に関連する言語の起源に関する「北部起源仮説」では、黄河上流および中流域でアワを栽培していた農耕民がチベット高原へと南西に拡大し、現在のチベット・ビルマ語族を広げ、中原および東岸へと東方と南方に拡大して、祖型的中国語を広めた、と提案されています(関連記事)。「南部起源仮説」では、祖型シナ・チベット語は高地を低地とつなぐチベットのイー(Yi)回廊で出現し、早期完新世に拡大した、と想定されます。
チベット人の祖先系統と、中国語話者の祖先系統との関係を明らかにするため、現代の17の人口集団が3つの遺伝的クラスタにまとめられました。それは、「中核チベット人」、中核チベット人およびユーラシア西部人と関連する系統間の混合である「北部チベット人」、qpAdmでは30~70%のアジア南東部人と関連する系統を有し、チベット語話者だけではなく、チアン人(Qiang)やロロ・ビルマ語話者も含む「チベット・イー回廊」人口集団です。古代黄河流域農耕民と現代漢人とチアン人は、中核チベット人と最も多くの遺伝的浮動を共有しており、チベット人と漢人とチアン人は全て、新石器時代黄河流域農耕民と関連する人口集団からの祖先系統を有する、との仮説と一致します。混合連鎖不平衡の崩壊を通じて、中核チベット人における大規模な混合(最小で22%ですが、おそらくはるかに高く、図2の推定値84%と一致します)が確認されました。これは、中核チベット人とその遺伝的にほぼ区別できない古代ネパールの近縁集団が、チベットの狩猟採集民の継続的な子孫を表している可能性は低い、という独立した証拠を提供します。単一混合モデルでは、混合は平均して紀元前290~紀元後270年頃に起きた、と推定されますが、混合の始まりは、チベット高原への農耕拡大の紀元前1600年頃までさかのぼるかもしれません。
現代漢人は南北の遺伝的勾配が特徴です。黄河上流および中流域の新石器時代農耕民とチベット人は、アジア南東部クラスタと比較して、現代漢人とより多くのアレルを共有していますが、アジア南東部クラスタ集団は、黄河流域農耕民と比較すると、ほとんどの漢人の方とより多くのアレルを共有しています。qpWaveを用いると、2つの起源集団がほとんどの漢人の全ての祖先系統への寄与と一致し、例外は本論文で2~4%のユーラシア西部関連系統との混合が推定される北部漢人である、と決定されました。このユーラシア東西の混合は32~45世代前に起きた、と推定されます。これは、紀元後618~907年の唐王朝および紀元後960~1279年の宋王朝の時期と重なります。唐代と宋代には、漢人(の主要な祖先集団)と西方民族集団との統合の歴史的記録があります。他の漢人全員に関しては、黄河上流および中流域の農耕民と関連する祖先系統が59~84%、残りは古代粮道遺跡狩猟採集民と関連する人口集団に由来する、と推定されました。粮道遺跡狩猟採集民集団は、長江流域の稲作農耕民と遺伝的構成が一致すると推測されます。この推論は、粮道遺跡狩猟採集民祖先系統が、おもに多くのオーストロネシア語族話者、海南島(Hainan Island)のタイ・カダイ語族話者のリー(Li)人(66%以下)、青銅器時代アジア南東部人の主要な系統で、一部のオーストロアジア語族話者の祖先系統の2/3である、という事実(図3)により裏づけられます(関連記事1および関連記事2)。
現在のシナ・チベット語族話者と黄河上流および中流域の新石器時代農耕民との間の特有のつながりが検出されたので、本論文の結果はシナ・チベット語族の「北部起源仮説」を裏づけます。考古学的に証明されているこの地域からの農耕の拡大と同じ時期であることは、紀元前3800年頃の単一の男性祖先に由来する、漢人とチベット人との間で共有されているYHg-O2a2b1a1(M117)の証拠でも裏づけられます。現在の南部漢人における増加する粮道遺跡狩猟採集民関連祖先系統の勾配はおそらく、漢人(の主要な祖先集団)が中国南部に拡大したと歴史的文献で記録されているように、拡大する漢人と南部集団との混合に起因します。しかし、これは最初の南方への移住ではありませんでした。それは、中国南部の漢人が遺伝的に、中期新石器時代の中国南部農耕民よりも、後期新石器時代黄河流域農耕民の方と遺伝的に近く(関連記事)、古代台湾農耕民では約25%の北方系統も観察されるからです(図2)。
●稲作農耕の拡大が言語を広めます
アジア南東部の以前の古代DNA分析では、アジア南東部最初の農耕民は、おそらく中国南部農耕民に関連するアジア東部人からの2/3の祖先系統と、深く分岐した狩猟採集民系統から1/3の祖先系統を有していると示され、これはオーストロアジア語族話者において最も強く明らかで、言語の拡大との関連が示唆されるパターンです(関連記事1および関連記事2)。古代台湾農耕民からの約2000年にわたる時系列の利用により、これがより広範なパターンだと確証されました。古代台湾の個体群は、現代のオーストロアジア語族話者と強い遺伝的つながりを示します。これは、片親性遺伝標識(母系のミトコンドリアDNAと父系のY染色体)によりさらに裏づけられます。古代台湾の個体群では、YHgはO2a2b2(N6)が、mtHgはE1a・B4a1a・F3b1・F4bが優勢です。これらのハプログループは現代の台湾先住民に共有されており、おそらくは太平洋南西部に最初のオーストロネシア語族をもたらした(関連記事)、バヌアツのラピタ(Lapita)文化個体群(関連記事)にも存在しています。
古代台湾集団とオーストロネシア語族言語を話す現代台湾先住民は、中国南部本土のタイ・カダイ語族話者の方と、他のアジア東部人よりも有意に多くのアレルを共有しています。これは、現代のタイ・カダイ語族話者と関連し、長江流域農耕民(まだ古代DNAでは標本抽出されていません)からそれ以前に派生した古代の人口集団が、紀元前3000年頃に台湾へと農耕を広めた、との仮説と一致します。意外な発見は、古代中国北部個体群が、台湾海峡の本土側の初期完新世狩猟採集民よりも、本論文における台湾の時代区分の古代個体群の方とより密接に関連している、との観察です。これは、新石器時代中国北部から台湾への遺伝子流動を示唆し、黄河流域農耕民の2集団系統の一方に派生するとモデル化する場合、25%の遺伝的影響が推定されます。この祖先系統は、黄河流域農耕民自体から由来すると仮定するならば適合せず、南北の移住はこれらの農耕民の拡大とは関連しない、と示唆されます。推測できる可能性としては、この祖先系統が紀元前8000年頃までに中国北部で栽培化されたアワの耕作者により伝えられ、中国南部では紀元前3000~紀元前2500年頃となる台湾新石器時代の大坌坑(Tapenkeng)文化で比較的早期に出現した、というものです。
●ユーラシア東西の混合
モンゴルはユーラシア草原地帯の東端近くに位置し、考古学的証拠では、完新世を通じてユーラシア東西の文化的交換の水路だった、と示されています。たとえば、ヤムナヤ(Yamnaya)草原地帯牧畜民文化の東方への拡大である紀元前3100年頃のアファナシェヴォ(Afanasievo)文化は、モンゴルに最初の酪農をもたらし、紀元前2750~紀元前1900年頃のチェムルチェク(Chemurchek)文化のようなその後の現象に文化的影響をもたらしました。
本論文におけるモンゴルの時代区分では、紀元前6000~紀元前600年頃の4起源集団に祖先系統が由来します。最初に確立し、おもにアジア東部人と関連する唯一の起源集団は、紀元前6000~紀元前5000年頃となるモンゴル東部の新石器時代狩猟採集民2個体において基本的にほぼ100%で表され、本論文のデータセットでは最初期の個体群となります(図3)。第二の起源集団は、紀元前5700~紀元前5400年頃のモンゴル北部の新石器時代狩猟採集民7個体で最初に現れ、以前に報告されたシベリア西部狩猟採集民(WSHG)と関連する祖先系統(関連記事)を5%程度有するとモデル化できます。第三の起源集団はアファナシェヴォ文化個体群で最初に現れ、遺伝的にはヤムナヤ草原地帯牧畜民とひじょうに類似しており、ロシアのアファナシェヴォ文化個体群のパターンと一致します。第四の起源集団は紀元前1400年頃までに現れ、シンタシュタ(Sintashta)文化の牧畜民のような祖先系統を有する人々に由来するとモデル化されます。シンタシュタ文化牧畜民は、ヤムナヤ関連祖先系統(約2/3)とヨーロッパ農耕民関連祖先系統(約1/3)の混合に由来します。
モンゴルにおける混合史を定量化するため、qpAdmが用いられました。多くのモンゴル東部人は、新石器時代のモンゴル東部人(65~100%)とシベリア西部狩猟採集民の単純な2方向混合としてモデル化できます。このモデルに適合する個体群は、新石器時代集団(0~5%のWSHG)だけではなく、アファナシェヴォ・クルガク・ゴビ(Afanasievo Kurgak govi)遺跡の前期青銅器時代の子供(15%)、ウルギー(Ulgii)集団(21~26%)、中期青銅器時代のムンクカイルカーン(Munkhkhairkhan)文化の主要な集団(31~36%)、モンゴル中央部・西部地域の後期青銅器時代結合集団(24~31%)、モングンタイガ(Mongun Taiga)の個体群(35%)です。クルガク・ゴビの子供はアファナシェヴォ文化との関連および年代にも関わらずヤムナヤ関連系統祖先系統を有しておらず、ヤムナヤ関連祖先系統を有さないアファナシェヴォ伝統で埋葬された個体の最初の事例となります。モンゴルに拡大したヤムナヤ期の遺産は、紀元前2750~紀元前1900年頃のチェムルチェク(Chemurchek)文化の2個体で継続し、その祖先系統は、ヤムナヤ・アファナシェヴォを一方の起源集団として用いてのみモデル化できます(33~51%)。これは、古代ヨーロッパ農耕民を外群で含める場合でも適合し、人々の長距離の移動はヨーロッパ西部の巨石文化伝統をチェムルチェク文化の人々に広めた、という仮説の証拠を提供しません。
紀元前600年頃より前の4起源集団モデルが適合しない1事例は、チェムルチェク文化の1個体ですが、ずっと南方のトゥーラン(現在のイランとトルクメニスタンとウズベキスタンとアフガニスタン)地域と関連する人口集団からの15%の追加の祖先系統でモデル化できます。最近の研究では、トゥーラン集団とボタイ(Botai)遺跡の初期カザフスタン牧畜民の混合としてチェムルチェク文化関連個体群がモデル化され、本論文において全てのチェムルチェク文化関連個体で検出された他の3祖先系統はいずれも確認されませんでした(関連記事)。本論文の最適モデルは、ボタイ文化関連個体群が参照セットにある時に合格するので、本論文と他の研究の知見は、どちらも正しいならば、ボタイ文化集団関連祖先系統を有する一方の移住の波と、それを有さないもう一方の移住の波を伴うような、チェムルチェク文化関連個体群のひじょうに複雑な起源を示唆します。
中期青銅器時代以降、モンゴルの時代区分データでは、アファナシェヴォ文化とともに拡大したヤムナヤ派生系統の持続に関する説得力のある証拠はありません。代わりに、ヤムナヤ関連祖先系統は、中期~後期青銅器時代のシンタシュタ文化およびアンドロノヴォ(Andronovo)文化の人々と関連する後の拡大に由来するものとしてのみモデル化できます。シンタシュタ文化およびアンドロノヴォ文化の人々は、2/3のヤムナヤ関連祖先系統と1/3のヨーロッパ農耕民関連祖先系統の混合です。シンタシュタ文化関連祖先系統は、中期~後期青銅器時代の集団で0~57%の割合で検出され、モンゴル西部でのみかなりの割合となります。これら全集団に関して、qpAdm祖先系統モデルは、外群にアファナシェヴォ文化関連個体群を用いて合格しますが、起源集団としてのアファナシェヴォ文化関連個体群と外群にシンタシュタ文化関連個体群を用いるモデルは全て却下されます(図3)。
新たな祖先系統は後期青銅器時代から大きな割合で到達し始め、qpAdmでは、新石器時代モンゴル東部個体群を、フブスグル(Khövsgöl)やウラーンズク(Ulaanzukh)やモンゴル中央部・西部地域の一部後期青銅器時代個体群、石板墓(Slab Grave)文化と関連した前期鉄器時代2個体、匈奴や鮮卑やモンゴル時代の個体群において、単一のアジア東部人起源集団としてモデル化すると失敗します。しかし、漢人を起源集団として含めると、これらの個体群の9~80%の祖先系統の割合が推定されます。トゥーラン派生祖先系統は、紀元前6世紀~紀元前4世紀までに、鉄器時代のサグリ(Sagly)文化の複数個体において再度モンゴルに拡大しました。明るい肌の色素沈着と関連する2ヶ所の遺伝子多型(rs1426654とrs16891982)、およびヨーロッパ人で青い目と関連する1ヶ所の多型(rs12913832)のアレルは、サグリ文化個体群で高頻度ですが、ラクターゼ(乳糖分解酵素)活性持続(LP)と関連する多型(rs4988235)のアレルは、本論文で分析されたアジア東部人全員でほぼ欠如しています。
ヤムナヤ・アファナシェヴォ関連系統が中期~後期青銅器時代までにモンゴルでほぼ消滅したことで一致している一方、ヤムナヤ・アファナシェヴォ関連系統拡大の遺産が中国西部で紀元前410~紀元前190年頃となる鉄器時代の石人子溝(Shirenzigou)文化の時期に存続したことを示唆する、以前の古代DNA分析が確認・補強されました。石人子溝文化個体群の多くと5つの遺伝的に均質な下位クラスタのうち3クラスタを別々に考慮すると、唯一の節約的なモデルは、アファナシェヴォ文化個体群と関連する集団からのユーラシア西部関連祖先系統に全てが由来し、後にアジア中央部とモンゴルで出現した特徴的なヨーロッパ農耕民関連混合のないアファナシェヴォ文化個体群関連祖先系統は現在の新疆ウイグル自治区で持続した、と確認されます。
たとえば、最もユーラシア西部関連祖先系統を有する2個体(石人子溝文化)にとって、3方向モデルに適合する全モデルは、ロシアのアファナシェヴォ文化個体群関連祖先系統を71~77%含みます(図3)。さらに、そのようなモデルにおいて小さな割合で適合できる他のユーラシア西部関連2集団からの祖先系統の合計は、常に9%未満です。国家以前の社会では、言語はおもに人々の移動を通じて拡大すると考えられているので、これらの結果は、タリム盆地のトカラ語がヤムナヤ文化の子孫のアルタイ山脈およびモンゴルへの移住を通じて(アファナシェヴォ文化の外観で)拡大し、そこからさらに新疆ウイグル自治区へと拡大した、との仮説に重要な意味を追加します。これらの結果は、インド・ヨーロッパ語族の多様化の仮説にとって重要です。なぜならば、インド・ヨーロッパ語族系統樹における二番目に古い分枝の分岐は紀元前四千年紀末に起きた、という仮説を支持する証拠が増加しているからです。以下、本論文の図3です。
以上、本論文についてざっと見てきました。本論文で取り上げられていない最近の研究では、まだ査読前ですが、チベット人の形成過程と地域差を詳細に分析した論文(関連記事)や、上部旧石器時代後期から中世までのアジア北東部の複雑な人口史を分析した論文(関連記事)や、前期新石器時代~漢代の山東省の人類の母系の遺伝的構造を分析した論文(関連記事)があります。本論文が指摘するように、アジア東部の更新世人類遺骸と、新石器時代長江流域個体群の古代DNAデータが得られれば、アジア東部、さらにはアジア南東部における現在の人口集団の形成史の理解は大きく進むと期待されます。
上述のように、本論文は昨年3月に査読前に公開された時からかなり修正されており、それは昨年の公開時以降に公表された研究を取り入れているからでもあります。まず、査読前論文では、アジア東部における主要な祖先系統の大きな区分はユーラシア東部で、それが南北に分岐し、さらにユーラシア東部北方祖先系統から分岐したアジア東部祖先系統が南北に分岐した、とされていました。この大きな祖先系統間の関係は本論文でも変わっていませんが、ユーラシア東部系統の南北の分岐が、南方は沿岸部祖先系統、北方は内陸部祖先系統と名称が変わっています。4万年前頃の田园個体はユーラシア東部内陸部祖先系統に位置づけられるものの、アジア東部現代人の直接的な祖先集団とは早期に分岐し、現代人には殆どあるいは全く遺伝的影響を残していない、と推測されています。
ユーラシア東部内陸部祖先系統(以下、内陸部祖先系統)は南北に分岐し、これが査読前論文のアジア東部南方祖先系統とアジア東部北方祖先系統に相当します。黄河流域新石器時代集団では内陸部北方祖先系統の割合が、前期新石器時代となる福建省の粮道遺跡2個体では内陸部南方祖先系統の割合がひじょうに高くなっていますが、それぞれユーラシア東部沿岸部祖先系統(以下、沿岸部祖先系統)の遺伝的影響も多少受けています。長江流域新石器時代集団は、粮道遺跡狩猟採集民と類似の遺伝的構成と予想されていますが、現時点ではまだゲノムデータが公表されていないと思います。上述のように、アジア東部の古代DNA研究における今後の注目点の一つが、長江流域新石器時代集団の遺伝的構成でしょう。
黄河流域で新石器時代に成立した遺伝的構成をアジア東部北方祖先系統、中国南部新石器時代集団の遺伝的構成をアジア東部南方祖先系統とすると、現代中国における各人口集団の南北それぞれの割合は図3aで示されています。査読前論文と比較すると、漢人では全体的にアジア東部北方祖先系統の割合の方が高いものの、以前よりもアジア東部南方祖先系統の割合が高くなっています。これは、アジア東部北方祖先系統を表すのが、紀元前3000年頃となる後期新石器時代の陝西省楡林市靖辺県の五庄果墚(Wuzhuangguoliang)遺跡個体群から後期新石器時代黄河上流域個体群に、アジア東部南方祖先系統を表すのが、台湾の紀元後1~4世紀の漢本(Hanben)遺跡個体群から前期新石器時代となる福建省の粮道遺跡2個体に変わったことが大きいようです。後期新石器時代黄河上流域個体群は、新石器時代から鉄器時代の中国北部の人口史に関する研究(関連記事)で取り上げられた、ともに青海省に位置する、紀元前2461~紀元前2208年頃の金蝉口(Jinchankou)遺跡と紀元前2866~紀元前2237年頃の喇家(Lajia)遺跡の個体群で表されます。
モンゴルでは改めてユーラシア西部関連祖先系統の流入が確認されましたが、最初に到来した祖先系統が消滅し、後に別の祖先系統が流入するなど、ユーラシア草原地帯における完新世の複雑な人口史が示唆されます。ユーラシア西部関連祖先系統の流入は、上述のようにトカラ語との関連でも注目されます。現代チベット人は内陸部北方祖先系統の圧倒的な割合と、沿岸部祖先系統の比較的低い割合とで構成され、内陸部南方祖先系統の影響はほとんどないようですが、上述のチベット人形成史に関する詳細な研究では、現代チベット人内部では明確な遺伝的地域差があり、地域によってはユーラシア西部関連祖先系統や内陸部南方祖先系統が明確に示されています。
日本人の私は、やはり自分が属する現代日本の「(本州・四国・九州を中心とする)本土」集団の形成過程に注目してしまいます(まあ、自分のゲノムを解析してもらったことはないので、じっさいに「本土」集団の遺伝的構成の範囲内に収まるのか、確定したわけではありませんが)。本論文では、縄文時代の7個体が分析されました。内訳は、紀元前2500~紀元前800年頃の千葉市の六通貝塚の6個体と、紀元前1500~紀元前1000年頃となる北海道の礼文島の船泊遺跡の1個体です。六通貝塚の6個体では1親等の関係にある2個体が確認されたので、そのうち網羅率のより低い1個体は集団遺伝分析から除外されています。
縄文人は、内陸部南方祖先系統56%と沿岸部祖先系統44%の混合としてモデル化されます。この混合がいつどこで起きたのか、縄文人の年代・地域での遺伝的違いはどの程度だったのか、今後の研究の進展が期待されます。また、現代日本の「本土」集団の形成に関しては、縄文人とアジア東部大陸部から到来した集団との混合との見解が最近の研究でも改めて確認されており、アジア東部大陸部からの縄文時代以降のおそらくは2回(あるいはそれ以上)の移住が想定されています(関連記事)。本論文は、現代日本の「本土」集団は、縄文人(8%)と青銅器時代西遼河集団(92%)の混合としてモデル化でき、黄河流域新石器時代農耕民集団の直接的な遺伝的影響は無視できるほど低い、と指摘します。縄文時代以降に日本列島に到来し、圧倒的な遺伝的影響(90%程度)を現代「本土」集団に残した集団は、考古学で強く示唆されているように、朝鮮半島経由で到来した可能性が高そうで、今後この推測が大きく変わることはなさそうです。もちろん、本論文の祖先系統モデル化は、あくまでも現時点でのデータに基づいており、今後の古代DNA研究の進展により、さらに精緻化されると期待されます。
本論文で分析された縄文人7個体のmtHgはいずれもN9bで、さらに詳細に区分できた4個体のうち3個体がN9b1、1個体がN9b2aです。礼文島の1個体と六通貝塚の6個体のうち3個体は男性です。YHgは、礼文島の1個体がD1(F1344)、六通貝塚の3個体がD1a2a1c1(Z1570)とD1a2a1c1(Z1575)とD1a2a1c1a(CTS11032)です。アジア南東部のホアビン文化(Hòabìnhian)層で見つかった、較正年代で4415~4160年前頃の1個体(Ma911)のYHgもD1(M174)です(関連記事)。ホアビン文化狩猟採集民は遺伝的には本論文の沿岸部祖先系統の影響が圧倒的に強く、沿岸部祖先系統を有さないアジア東部の古代人ではまだYHg-D1は確認されていないと思いますので、アジア東部の個体群のYHg-D1は沿岸部祖先系統にのみ由来する可能性が高そうです。日本列島やチベットでは、内陸部祖先系統の遺伝的影響が圧倒的に強くなってもYHg-D1が残ったのに対して、農耕到来とともに内陸部祖先系統の遺伝的影響が強くなったアジア南東部では、YHg-D1がほとんど消えた理由に関しては、拡散の経緯や外来集団と在来集団との力関係や社会構造などの影響が大きいかもしれませんが、今後の研究の進展により解明されていくのではないか、と期待されます。
参考文献:
Wang CC. et al.(2021): Genomic insights into the formation of human populations in East Asia. Nature, 591, 7850, 413–419.
https://doi.org/10.1038/s41586-021-03336-2
追記(2021年3月18日)
本論文が『ネイチャー』本誌に掲載されたので、以下に『ネイチャー』の日本語サイトから引用します。
集団遺伝学:東アジア人集団の形成に関するゲノムからの知見
集団遺伝学:古代DNAでたどる東アジア人の集団史
古代東アジア人の利用可能なDNAデータは、これまで限定的だった。今回D Reichたちは、台湾、モンゴル、チベット、中国など、東アジア各地の古代人および現代人から得られた、大規模なゲノム規模のデータセットを報告している。このデータセットを既存のデータセットと統合して解析した結果、モンゴルおよびアムール川流域、黄河流域、台湾など、さまざまな地域での集団の移動が詳細に推測された。
アジア東部は動物の家畜化と植物の栽培化の最初期の中心地の一つで(関連記事)、シナ・チベット語族、タイ・カダイ語族、オーストロネシア語族、オーストロアジア語族、ミャオ・ヤオ語族、インド・ヨーロッパ語族、モンゴル語族、テュルク語族、ツングース語族、朝鮮語族、日本語族、ユカギール語族、チュクチ・カムチャツカ語族など、ひじょうに多様な語族を有しています。しかし、チベット高原と中国南部の現代人の遺伝的多様性の標本抽出が最小限であるため(関連記事)、アジア東部における人口史の理解は不充分なままです。
この研究は、人口史の広範な研究への使用に同意した中国(337人)とネパール(46人)の46人口集団から383人のDNAを収集し、約60万ヶ所の一塩基多型の遺伝子型が決定されました。古代DNA分析に関しても、現代の共同体とのつながりの可能性が高い時には、共同体からの許可が得られました。本論文は、新たに166個体のデータを報告します(図1)。その内訳は、紀元前5700~紀元後1400年頃となるモンゴルの82個体、中国の黄河流域の紀元前3000年頃となる1ヶ所の遺跡の11個体、紀元前2500~紀元前800年頃となる日本の縄文時代の狩猟採集民7個体、ロシア極東では紀元前5400~紀元前3600年頃となるボイスマン2(Boisman-2)共同墓地の18個体および紀元後900年頃の1個体と紀元後1100年頃の1個体、紀元前1300~紀元後800年頃となる台湾の2ヶ所の遺跡の46個体です。集団析では、汚染の証拠がある16個体、5000~15000ヶ所の一塩基多型データしか得られなかった10個体、データセットで他のより高い網羅率の個体の密接な親族となる11個体を除外して、130個体に焦点が当てられました。これらのデータは、公開されている古代人1079個体、および16人口集団の現代人3265個体のデータと統合されました。地理と年代と考古学的文脈と遺伝的クラスタにより、これらの個体群はまとめられました。
主成分分析が実行され、古代の個体群は現代人を用いて計算された軸に投影されました。人口構造は地理および言語と相関していますが、例外もあります。中国北西部とネパールとシベリアの集団はユーラシア西部人に向かってそれており、平均して5~70世代前の混合を反映しています。初期完新世のアジア東部人では、現代(FST=0.013)と比較して遺伝的分化がずっと高く(FST=0.067)、深いアジア東部系統間の混合を反映しています。現在、最小限のユーラシア西部関連祖先系統を有するアジア東部人は、これらの極の間でじょじょに変化します。「アムール川流域クラスタ」は、アムール川流域の古代人および現代人と相関し、言語ではツングース語族話者およびニヴフ人と相関します。「チベット高原クラスタ」は古代ネパール人と在来チベット人で最も強く表されます。「アジア南東部クラスタ」は、古代台湾人および、タイ・カダイ語族とオーストロアジア語族とオーストロネシア語族を話すアジア東部人で最大化されます。自動クラスタ化でも類似の結果が得られます。
本論文は、主題に沿って調査結果を整理します。第一に、深い時間を考慮します。アジア東部人に寄与する初期に分岐した系統は何か、という問題です。第二~第四は、言語の拡大とその農耕拡大とのあり得るつながりについて、3通りの仮説を検証することにより、人口構造がどのようにして現在のものになったのか、明らかにします。第五に、ユーラシア西部人とユーラシア東部人とが地理的な接触地帯に沿ってどのように混合したのか、説明します。以下、本論文の図1です。
●後期更新世の沿岸部拡大
アジア東部で利用可能な氷河期前のゲノムは2個体だけです。一方は、北京の南西56kmにある 田园(田園)洞窟(Tianyuan Cave)で発見された4万年前頃の現生人類(Homo sapiens)1個体(関連記事)で、もう一方はモンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された35000年前頃の現生人類1個体(関連記事)です。それにも関わらず、重要な洞察は氷河期後のゲノム分析から収集できます。一つの問題は、アジア東部の現生人類の移住が沿岸と内陸部のどちらの経路だったのか、ということです。チベット人が深く分岐したY染色体ハプログループ(YHg)D1(M174)を高頻度(50%)で有しているように、示唆的な遺伝的証拠はY染色体に由来します。YHg-D1は、現代日本人(および日本列島の縄文時代の狩猟採集民)およびベンガル湾のアンダマン諸島先住民と共有されています。
qpGraphを用いて、データと一致する人口集団分岐および遺伝子流動が調べられ、本論文の主成分分析で祖先系統の両極端に寄与する主要系統の深い歴史に関して、節約的な作業モデルが特定されました。本論文の適合からは、アジア東部人祖先系統の大半は2つの古代人口集団の異なる割合の混合に由来する可能性がある、と示唆されます。一方は4万年前頃の田园個体と同じ系統、もう一方はアンダマン諸島先住民(オンゲ人)と同じ系統です。
北方に分布する田园個体関連系統は、モンゴルの新石器時代の人々の祖先系統の98%、(現代チベット人を形成するチベット狩猟採集民から推測されるオンゲ関連系統と混合した)黄河上流域農耕民の90%に寄与した、と推測されます。より南方に分布する別の田园関連系統は、中国南東部沿岸の紀元前6300~紀元前5600年頃の前期新石器時代となる福建省の粮道(Liangdao)遺跡の狩猟採集民の祖先系統の73%と、日本の縄文時代狩猟採集民の56%に寄与しました(関連記事)。日本列島には氷河期の前後に人類が居住するようになり、南北の「縄文人」は形態学的に異なっているので、本論文で検出された混合と関連しているかもしれません。北部の田园個体関連系統は、西遼河農耕民(67%)と台湾農耕民(25%)の両方にも寄与し、その祖先系統の残りは、粮道遺跡の南部狩猟採集民と関連しています。北部の田园個体関連系統は、黄河上流域農耕民に寄与した系統とは関連しているにも関わらず異なる、という事実から、黄河流域農耕民の拡大とは関係していない、台湾への北部農耕民の拡大の可能性が高い、と示唆されます。
オンゲ関連系統の寄与は、沿岸部集団に集中しています。この系統は、アンダマン諸島人で100%、「縄文人」で44%、古代台湾農耕民で20%と推定され、アンダマン諸島人と日本人に見られるYHg-D1に基づいて仮定された沿岸経路拡大と一致します。当然チベットは沿岸部に位置していませんが、古代チベット人へのこの系統の比較的高い推定される寄与(24%)と、現代チベット人におけるYHg-D1の50%の割合は、YHg-D1とオンゲ関連系統との間のつながりを強固にします。チベットの狩猟採集民は、内陸部に拡大してチベット高原に居住したこの後期更新世沿岸拡大の早期に分岐した枝を表す、と本論文では仮定されます。
●トランスユーラシア仮説の精緻化
農耕・言語拡散仮説では、栽培化・家畜化の中心およびその周辺における人口密度増加が、言語を拡大させる人々の移動の推進に重要だった、と提案されますが、アジア東部では、この仮説を検証する利用可能なデータが限られていました。まず、共有された農耕用語を含む再構築された特徴に基づいて、モンゴル語族とテュルク語族とツングース語族と朝鮮語族と日本語族などの大語族を提案している、「トランスユーラシア仮説」の遺伝的相関関係が調べられました。トランスユーラシア仮説では、これらの語族は、モンゴルへと西方に、シベリアへと北方に、朝鮮半島と日本列島へと東方に拡大した、中国北東部の西遼河周辺の初期雑穀農耕民の拡大と関連する祖型言語に由来する、と提案されます。
この言語拡大のあり得る遺伝的相関への洞察を得るため、まずアムール川流域の年代区分調査が行われました(関連記事)。紀元前5500年頃の初期新石器時代個体群と紀元前5000年頃のボイスマン(Boisman)遺跡個体群から、紀元前900年頃となる鉄器時代のヤンコフスキー(Yankovsky)文化、および紀元後50~250年頃となる鮮卑(Xianbei)文化まで、アムール川流域個体群は一貫して、qpWaveではクレード(単系統群)であることと一致します。この局所的に継続した人口集団も、後の人口集団に寄与しました。それは、ボイスマン遺跡個体群のYHg-C2a(F1396)とミトコンドリアDNA(mtDNA)ハプログループ(mtHg)D4・C5に反映されています。これらのハプログループは現代のツングース語族やモンゴル語族や一部のテュルク語族話者において優勢で、紀元後1100年頃の黒水靺鞨(Heishui Mohe)文化と関連する1個体でも確認されます。この黒水靺鞨文化関連1個体は、43±15%のアムール川流域新石器時代祖先系統を有する、と推定されています(歴史時代に南方からの移民があった場合に予想されるように、残りの祖先系統は漢人によりよくモデル化されます)。
この古くに確立されたアムール川流域系統は、東方のより多くの縄文人関連性と、西方のほとんどのモンゴル新石器時代関連祖先系統との勾配の一部でした。バイカル湖狩猟採集民(関連記事)における77~94%のモンゴル新石器時代関連祖先系統が推定され、残りは、氷河期にバイカル湖地域に居住していた、ユーラシア西部関連系統と深く分岐した、古代北ユーラシア人に由来します(関連記事)。ボイスマン遺跡のようなアムール川流域狩猟採集民では、モンゴル新石器時代関連祖先系統が87%(残りは縄文人関連祖先系統)と推定されます。アメリカ大陸先住民は、ボイスマン遺跡やモンゴルの新石器時代個体群の方と、他のアジア東部人よりも多くのアレル(対立遺伝子)を共有し、この系統の初期の分枝は図2の田园関連分枝の北部の分布を反映しており、アメリカ大陸先住民におけるアジア東部関連祖先系統の起源です。
トランスユーラシア仮説は、モンゴル語族とテュルク語族とツングース語族と朝鮮語族と日本語族の祖型言語が西遼河地域の農耕民により広がった、というものです。西遼河地域の農耕民は、本論文の分析(図2)では、黄河上流域関連祖先系統(67%)と粮道関連祖先系統(33%)の混合を示します。祖先系統のこの特徴的な混合は、本論文の対象ではモンゴルとアムール川流域の時代区分で欠如している、と観察されます(図3)。これは、西遼河農耕民の拡大がモンゴル語族とツングース語族を広めた、とする仮説の予測でありません。対照的に、西遼河農耕民祖先系統は、おそらくさらに東方に影響を及ぼしました。たとえば、現代日本人は青銅器時代西遼河人口集団(92%)と縄文人(8%)の2方向混合としてモデル化でき、黄河流域農耕民集団が本論文のqpAdm分析での外群として含まれ、そのモデルが適合されるので確認されるように、黄河流域農耕民関連集団からの無視できる程度の寄与を伴います。この祖先系統は、朝鮮半島を経由して伝わったことと一致します。それは、日本人が朝鮮人(91%)と縄文人(9%)の混合としてモデル化できるからです。
本論文で取り上げられた縄文人6個体は、毛髪の太さや直毛度、エクリン汗腺密度、耳たぶや下顎の形態にも影響を与えているエクトジスプラシンA受容体(EDAR)遺伝子の370V/A多様体の派生的アレル(関連記事)を有していません。EDAR遺伝子の370V/A多様体の派生的アレルは中国本土で3万年前頃に出現したと推定されており、アジア東部本土とアメリカ大陸の完新世の人口集団で高頻度に達しました。この派生的アレルが縄文人にはほぼ欠如しているという事実は、アジア東部本土集団と比較しての縄文時代の人口集団の遺伝的相違を強調します。以下、本論文の図2です。
●シナ・チベット語族の北部起源
チベット高原には現生人類が4万~3万年前頃以来居住してきましたが(関連記事)、恒久的居住の証拠があるのは、農耕到来の紀元前1600年頃以降です(関連記事)。先住チベット人も、中国沿岸部平原の言語とつながるシナ・チベット語を話します。これらの密接に関連する言語の起源に関する「北部起源仮説」では、黄河上流および中流域でアワを栽培していた農耕民がチベット高原へと南西に拡大し、現在のチベット・ビルマ語族を広げ、中原および東岸へと東方と南方に拡大して、祖型的中国語を広めた、と提案されています(関連記事)。「南部起源仮説」では、祖型シナ・チベット語は高地を低地とつなぐチベットのイー(Yi)回廊で出現し、早期完新世に拡大した、と想定されます。
チベット人の祖先系統と、中国語話者の祖先系統との関係を明らかにするため、現代の17の人口集団が3つの遺伝的クラスタにまとめられました。それは、「中核チベット人」、中核チベット人およびユーラシア西部人と関連する系統間の混合である「北部チベット人」、qpAdmでは30~70%のアジア南東部人と関連する系統を有し、チベット語話者だけではなく、チアン人(Qiang)やロロ・ビルマ語話者も含む「チベット・イー回廊」人口集団です。古代黄河流域農耕民と現代漢人とチアン人は、中核チベット人と最も多くの遺伝的浮動を共有しており、チベット人と漢人とチアン人は全て、新石器時代黄河流域農耕民と関連する人口集団からの祖先系統を有する、との仮説と一致します。混合連鎖不平衡の崩壊を通じて、中核チベット人における大規模な混合(最小で22%ですが、おそらくはるかに高く、図2の推定値84%と一致します)が確認されました。これは、中核チベット人とその遺伝的にほぼ区別できない古代ネパールの近縁集団が、チベットの狩猟採集民の継続的な子孫を表している可能性は低い、という独立した証拠を提供します。単一混合モデルでは、混合は平均して紀元前290~紀元後270年頃に起きた、と推定されますが、混合の始まりは、チベット高原への農耕拡大の紀元前1600年頃までさかのぼるかもしれません。
現代漢人は南北の遺伝的勾配が特徴です。黄河上流および中流域の新石器時代農耕民とチベット人は、アジア南東部クラスタと比較して、現代漢人とより多くのアレルを共有していますが、アジア南東部クラスタ集団は、黄河流域農耕民と比較すると、ほとんどの漢人の方とより多くのアレルを共有しています。qpWaveを用いると、2つの起源集団がほとんどの漢人の全ての祖先系統への寄与と一致し、例外は本論文で2~4%のユーラシア西部関連系統との混合が推定される北部漢人である、と決定されました。このユーラシア東西の混合は32~45世代前に起きた、と推定されます。これは、紀元後618~907年の唐王朝および紀元後960~1279年の宋王朝の時期と重なります。唐代と宋代には、漢人(の主要な祖先集団)と西方民族集団との統合の歴史的記録があります。他の漢人全員に関しては、黄河上流および中流域の農耕民と関連する祖先系統が59~84%、残りは古代粮道遺跡狩猟採集民と関連する人口集団に由来する、と推定されました。粮道遺跡狩猟採集民集団は、長江流域の稲作農耕民と遺伝的構成が一致すると推測されます。この推論は、粮道遺跡狩猟採集民祖先系統が、おもに多くのオーストロネシア語族話者、海南島(Hainan Island)のタイ・カダイ語族話者のリー(Li)人(66%以下)、青銅器時代アジア南東部人の主要な系統で、一部のオーストロアジア語族話者の祖先系統の2/3である、という事実(図3)により裏づけられます(関連記事1および関連記事2)。
現在のシナ・チベット語族話者と黄河上流および中流域の新石器時代農耕民との間の特有のつながりが検出されたので、本論文の結果はシナ・チベット語族の「北部起源仮説」を裏づけます。考古学的に証明されているこの地域からの農耕の拡大と同じ時期であることは、紀元前3800年頃の単一の男性祖先に由来する、漢人とチベット人との間で共有されているYHg-O2a2b1a1(M117)の証拠でも裏づけられます。現在の南部漢人における増加する粮道遺跡狩猟採集民関連祖先系統の勾配はおそらく、漢人(の主要な祖先集団)が中国南部に拡大したと歴史的文献で記録されているように、拡大する漢人と南部集団との混合に起因します。しかし、これは最初の南方への移住ではありませんでした。それは、中国南部の漢人が遺伝的に、中期新石器時代の中国南部農耕民よりも、後期新石器時代黄河流域農耕民の方と遺伝的に近く(関連記事)、古代台湾農耕民では約25%の北方系統も観察されるからです(図2)。
●稲作農耕の拡大が言語を広めます
アジア南東部の以前の古代DNA分析では、アジア南東部最初の農耕民は、おそらく中国南部農耕民に関連するアジア東部人からの2/3の祖先系統と、深く分岐した狩猟採集民系統から1/3の祖先系統を有していると示され、これはオーストロアジア語族話者において最も強く明らかで、言語の拡大との関連が示唆されるパターンです(関連記事1および関連記事2)。古代台湾農耕民からの約2000年にわたる時系列の利用により、これがより広範なパターンだと確証されました。古代台湾の個体群は、現代のオーストロアジア語族話者と強い遺伝的つながりを示します。これは、片親性遺伝標識(母系のミトコンドリアDNAと父系のY染色体)によりさらに裏づけられます。古代台湾の個体群では、YHgはO2a2b2(N6)が、mtHgはE1a・B4a1a・F3b1・F4bが優勢です。これらのハプログループは現代の台湾先住民に共有されており、おそらくは太平洋南西部に最初のオーストロネシア語族をもたらした(関連記事)、バヌアツのラピタ(Lapita)文化個体群(関連記事)にも存在しています。
古代台湾集団とオーストロネシア語族言語を話す現代台湾先住民は、中国南部本土のタイ・カダイ語族話者の方と、他のアジア東部人よりも有意に多くのアレルを共有しています。これは、現代のタイ・カダイ語族話者と関連し、長江流域農耕民(まだ古代DNAでは標本抽出されていません)からそれ以前に派生した古代の人口集団が、紀元前3000年頃に台湾へと農耕を広めた、との仮説と一致します。意外な発見は、古代中国北部個体群が、台湾海峡の本土側の初期完新世狩猟採集民よりも、本論文における台湾の時代区分の古代個体群の方とより密接に関連している、との観察です。これは、新石器時代中国北部から台湾への遺伝子流動を示唆し、黄河流域農耕民の2集団系統の一方に派生するとモデル化する場合、25%の遺伝的影響が推定されます。この祖先系統は、黄河流域農耕民自体から由来すると仮定するならば適合せず、南北の移住はこれらの農耕民の拡大とは関連しない、と示唆されます。推測できる可能性としては、この祖先系統が紀元前8000年頃までに中国北部で栽培化されたアワの耕作者により伝えられ、中国南部では紀元前3000~紀元前2500年頃となる台湾新石器時代の大坌坑(Tapenkeng)文化で比較的早期に出現した、というものです。
●ユーラシア東西の混合
モンゴルはユーラシア草原地帯の東端近くに位置し、考古学的証拠では、完新世を通じてユーラシア東西の文化的交換の水路だった、と示されています。たとえば、ヤムナヤ(Yamnaya)草原地帯牧畜民文化の東方への拡大である紀元前3100年頃のアファナシェヴォ(Afanasievo)文化は、モンゴルに最初の酪農をもたらし、紀元前2750~紀元前1900年頃のチェムルチェク(Chemurchek)文化のようなその後の現象に文化的影響をもたらしました。
本論文におけるモンゴルの時代区分では、紀元前6000~紀元前600年頃の4起源集団に祖先系統が由来します。最初に確立し、おもにアジア東部人と関連する唯一の起源集団は、紀元前6000~紀元前5000年頃となるモンゴル東部の新石器時代狩猟採集民2個体において基本的にほぼ100%で表され、本論文のデータセットでは最初期の個体群となります(図3)。第二の起源集団は、紀元前5700~紀元前5400年頃のモンゴル北部の新石器時代狩猟採集民7個体で最初に現れ、以前に報告されたシベリア西部狩猟採集民(WSHG)と関連する祖先系統(関連記事)を5%程度有するとモデル化できます。第三の起源集団はアファナシェヴォ文化個体群で最初に現れ、遺伝的にはヤムナヤ草原地帯牧畜民とひじょうに類似しており、ロシアのアファナシェヴォ文化個体群のパターンと一致します。第四の起源集団は紀元前1400年頃までに現れ、シンタシュタ(Sintashta)文化の牧畜民のような祖先系統を有する人々に由来するとモデル化されます。シンタシュタ文化牧畜民は、ヤムナヤ関連祖先系統(約2/3)とヨーロッパ農耕民関連祖先系統(約1/3)の混合に由来します。
モンゴルにおける混合史を定量化するため、qpAdmが用いられました。多くのモンゴル東部人は、新石器時代のモンゴル東部人(65~100%)とシベリア西部狩猟採集民の単純な2方向混合としてモデル化できます。このモデルに適合する個体群は、新石器時代集団(0~5%のWSHG)だけではなく、アファナシェヴォ・クルガク・ゴビ(Afanasievo Kurgak govi)遺跡の前期青銅器時代の子供(15%)、ウルギー(Ulgii)集団(21~26%)、中期青銅器時代のムンクカイルカーン(Munkhkhairkhan)文化の主要な集団(31~36%)、モンゴル中央部・西部地域の後期青銅器時代結合集団(24~31%)、モングンタイガ(Mongun Taiga)の個体群(35%)です。クルガク・ゴビの子供はアファナシェヴォ文化との関連および年代にも関わらずヤムナヤ関連系統祖先系統を有しておらず、ヤムナヤ関連祖先系統を有さないアファナシェヴォ伝統で埋葬された個体の最初の事例となります。モンゴルに拡大したヤムナヤ期の遺産は、紀元前2750~紀元前1900年頃のチェムルチェク(Chemurchek)文化の2個体で継続し、その祖先系統は、ヤムナヤ・アファナシェヴォを一方の起源集団として用いてのみモデル化できます(33~51%)。これは、古代ヨーロッパ農耕民を外群で含める場合でも適合し、人々の長距離の移動はヨーロッパ西部の巨石文化伝統をチェムルチェク文化の人々に広めた、という仮説の証拠を提供しません。
紀元前600年頃より前の4起源集団モデルが適合しない1事例は、チェムルチェク文化の1個体ですが、ずっと南方のトゥーラン(現在のイランとトルクメニスタンとウズベキスタンとアフガニスタン)地域と関連する人口集団からの15%の追加の祖先系統でモデル化できます。最近の研究では、トゥーラン集団とボタイ(Botai)遺跡の初期カザフスタン牧畜民の混合としてチェムルチェク文化関連個体群がモデル化され、本論文において全てのチェムルチェク文化関連個体で検出された他の3祖先系統はいずれも確認されませんでした(関連記事)。本論文の最適モデルは、ボタイ文化関連個体群が参照セットにある時に合格するので、本論文と他の研究の知見は、どちらも正しいならば、ボタイ文化集団関連祖先系統を有する一方の移住の波と、それを有さないもう一方の移住の波を伴うような、チェムルチェク文化関連個体群のひじょうに複雑な起源を示唆します。
中期青銅器時代以降、モンゴルの時代区分データでは、アファナシェヴォ文化とともに拡大したヤムナヤ派生系統の持続に関する説得力のある証拠はありません。代わりに、ヤムナヤ関連祖先系統は、中期~後期青銅器時代のシンタシュタ文化およびアンドロノヴォ(Andronovo)文化の人々と関連する後の拡大に由来するものとしてのみモデル化できます。シンタシュタ文化およびアンドロノヴォ文化の人々は、2/3のヤムナヤ関連祖先系統と1/3のヨーロッパ農耕民関連祖先系統の混合です。シンタシュタ文化関連祖先系統は、中期~後期青銅器時代の集団で0~57%の割合で検出され、モンゴル西部でのみかなりの割合となります。これら全集団に関して、qpAdm祖先系統モデルは、外群にアファナシェヴォ文化関連個体群を用いて合格しますが、起源集団としてのアファナシェヴォ文化関連個体群と外群にシンタシュタ文化関連個体群を用いるモデルは全て却下されます(図3)。
新たな祖先系統は後期青銅器時代から大きな割合で到達し始め、qpAdmでは、新石器時代モンゴル東部個体群を、フブスグル(Khövsgöl)やウラーンズク(Ulaanzukh)やモンゴル中央部・西部地域の一部後期青銅器時代個体群、石板墓(Slab Grave)文化と関連した前期鉄器時代2個体、匈奴や鮮卑やモンゴル時代の個体群において、単一のアジア東部人起源集団としてモデル化すると失敗します。しかし、漢人を起源集団として含めると、これらの個体群の9~80%の祖先系統の割合が推定されます。トゥーラン派生祖先系統は、紀元前6世紀~紀元前4世紀までに、鉄器時代のサグリ(Sagly)文化の複数個体において再度モンゴルに拡大しました。明るい肌の色素沈着と関連する2ヶ所の遺伝子多型(rs1426654とrs16891982)、およびヨーロッパ人で青い目と関連する1ヶ所の多型(rs12913832)のアレルは、サグリ文化個体群で高頻度ですが、ラクターゼ(乳糖分解酵素)活性持続(LP)と関連する多型(rs4988235)のアレルは、本論文で分析されたアジア東部人全員でほぼ欠如しています。
ヤムナヤ・アファナシェヴォ関連系統が中期~後期青銅器時代までにモンゴルでほぼ消滅したことで一致している一方、ヤムナヤ・アファナシェヴォ関連系統拡大の遺産が中国西部で紀元前410~紀元前190年頃となる鉄器時代の石人子溝(Shirenzigou)文化の時期に存続したことを示唆する、以前の古代DNA分析が確認・補強されました。石人子溝文化個体群の多くと5つの遺伝的に均質な下位クラスタのうち3クラスタを別々に考慮すると、唯一の節約的なモデルは、アファナシェヴォ文化個体群と関連する集団からのユーラシア西部関連祖先系統に全てが由来し、後にアジア中央部とモンゴルで出現した特徴的なヨーロッパ農耕民関連混合のないアファナシェヴォ文化個体群関連祖先系統は現在の新疆ウイグル自治区で持続した、と確認されます。
たとえば、最もユーラシア西部関連祖先系統を有する2個体(石人子溝文化)にとって、3方向モデルに適合する全モデルは、ロシアのアファナシェヴォ文化個体群関連祖先系統を71~77%含みます(図3)。さらに、そのようなモデルにおいて小さな割合で適合できる他のユーラシア西部関連2集団からの祖先系統の合計は、常に9%未満です。国家以前の社会では、言語はおもに人々の移動を通じて拡大すると考えられているので、これらの結果は、タリム盆地のトカラ語がヤムナヤ文化の子孫のアルタイ山脈およびモンゴルへの移住を通じて(アファナシェヴォ文化の外観で)拡大し、そこからさらに新疆ウイグル自治区へと拡大した、との仮説に重要な意味を追加します。これらの結果は、インド・ヨーロッパ語族の多様化の仮説にとって重要です。なぜならば、インド・ヨーロッパ語族系統樹における二番目に古い分枝の分岐は紀元前四千年紀末に起きた、という仮説を支持する証拠が増加しているからです。以下、本論文の図3です。
以上、本論文についてざっと見てきました。本論文で取り上げられていない最近の研究では、まだ査読前ですが、チベット人の形成過程と地域差を詳細に分析した論文(関連記事)や、上部旧石器時代後期から中世までのアジア北東部の複雑な人口史を分析した論文(関連記事)や、前期新石器時代~漢代の山東省の人類の母系の遺伝的構造を分析した論文(関連記事)があります。本論文が指摘するように、アジア東部の更新世人類遺骸と、新石器時代長江流域個体群の古代DNAデータが得られれば、アジア東部、さらにはアジア南東部における現在の人口集団の形成史の理解は大きく進むと期待されます。
上述のように、本論文は昨年3月に査読前に公開された時からかなり修正されており、それは昨年の公開時以降に公表された研究を取り入れているからでもあります。まず、査読前論文では、アジア東部における主要な祖先系統の大きな区分はユーラシア東部で、それが南北に分岐し、さらにユーラシア東部北方祖先系統から分岐したアジア東部祖先系統が南北に分岐した、とされていました。この大きな祖先系統間の関係は本論文でも変わっていませんが、ユーラシア東部系統の南北の分岐が、南方は沿岸部祖先系統、北方は内陸部祖先系統と名称が変わっています。4万年前頃の田园個体はユーラシア東部内陸部祖先系統に位置づけられるものの、アジア東部現代人の直接的な祖先集団とは早期に分岐し、現代人には殆どあるいは全く遺伝的影響を残していない、と推測されています。
ユーラシア東部内陸部祖先系統(以下、内陸部祖先系統)は南北に分岐し、これが査読前論文のアジア東部南方祖先系統とアジア東部北方祖先系統に相当します。黄河流域新石器時代集団では内陸部北方祖先系統の割合が、前期新石器時代となる福建省の粮道遺跡2個体では内陸部南方祖先系統の割合がひじょうに高くなっていますが、それぞれユーラシア東部沿岸部祖先系統(以下、沿岸部祖先系統)の遺伝的影響も多少受けています。長江流域新石器時代集団は、粮道遺跡狩猟採集民と類似の遺伝的構成と予想されていますが、現時点ではまだゲノムデータが公表されていないと思います。上述のように、アジア東部の古代DNA研究における今後の注目点の一つが、長江流域新石器時代集団の遺伝的構成でしょう。
黄河流域で新石器時代に成立した遺伝的構成をアジア東部北方祖先系統、中国南部新石器時代集団の遺伝的構成をアジア東部南方祖先系統とすると、現代中国における各人口集団の南北それぞれの割合は図3aで示されています。査読前論文と比較すると、漢人では全体的にアジア東部北方祖先系統の割合の方が高いものの、以前よりもアジア東部南方祖先系統の割合が高くなっています。これは、アジア東部北方祖先系統を表すのが、紀元前3000年頃となる後期新石器時代の陝西省楡林市靖辺県の五庄果墚(Wuzhuangguoliang)遺跡個体群から後期新石器時代黄河上流域個体群に、アジア東部南方祖先系統を表すのが、台湾の紀元後1~4世紀の漢本(Hanben)遺跡個体群から前期新石器時代となる福建省の粮道遺跡2個体に変わったことが大きいようです。後期新石器時代黄河上流域個体群は、新石器時代から鉄器時代の中国北部の人口史に関する研究(関連記事)で取り上げられた、ともに青海省に位置する、紀元前2461~紀元前2208年頃の金蝉口(Jinchankou)遺跡と紀元前2866~紀元前2237年頃の喇家(Lajia)遺跡の個体群で表されます。
モンゴルでは改めてユーラシア西部関連祖先系統の流入が確認されましたが、最初に到来した祖先系統が消滅し、後に別の祖先系統が流入するなど、ユーラシア草原地帯における完新世の複雑な人口史が示唆されます。ユーラシア西部関連祖先系統の流入は、上述のようにトカラ語との関連でも注目されます。現代チベット人は内陸部北方祖先系統の圧倒的な割合と、沿岸部祖先系統の比較的低い割合とで構成され、内陸部南方祖先系統の影響はほとんどないようですが、上述のチベット人形成史に関する詳細な研究では、現代チベット人内部では明確な遺伝的地域差があり、地域によってはユーラシア西部関連祖先系統や内陸部南方祖先系統が明確に示されています。
日本人の私は、やはり自分が属する現代日本の「(本州・四国・九州を中心とする)本土」集団の形成過程に注目してしまいます(まあ、自分のゲノムを解析してもらったことはないので、じっさいに「本土」集団の遺伝的構成の範囲内に収まるのか、確定したわけではありませんが)。本論文では、縄文時代の7個体が分析されました。内訳は、紀元前2500~紀元前800年頃の千葉市の六通貝塚の6個体と、紀元前1500~紀元前1000年頃となる北海道の礼文島の船泊遺跡の1個体です。六通貝塚の6個体では1親等の関係にある2個体が確認されたので、そのうち網羅率のより低い1個体は集団遺伝分析から除外されています。
縄文人は、内陸部南方祖先系統56%と沿岸部祖先系統44%の混合としてモデル化されます。この混合がいつどこで起きたのか、縄文人の年代・地域での遺伝的違いはどの程度だったのか、今後の研究の進展が期待されます。また、現代日本の「本土」集団の形成に関しては、縄文人とアジア東部大陸部から到来した集団との混合との見解が最近の研究でも改めて確認されており、アジア東部大陸部からの縄文時代以降のおそらくは2回(あるいはそれ以上)の移住が想定されています(関連記事)。本論文は、現代日本の「本土」集団は、縄文人(8%)と青銅器時代西遼河集団(92%)の混合としてモデル化でき、黄河流域新石器時代農耕民集団の直接的な遺伝的影響は無視できるほど低い、と指摘します。縄文時代以降に日本列島に到来し、圧倒的な遺伝的影響(90%程度)を現代「本土」集団に残した集団は、考古学で強く示唆されているように、朝鮮半島経由で到来した可能性が高そうで、今後この推測が大きく変わることはなさそうです。もちろん、本論文の祖先系統モデル化は、あくまでも現時点でのデータに基づいており、今後の古代DNA研究の進展により、さらに精緻化されると期待されます。
本論文で分析された縄文人7個体のmtHgはいずれもN9bで、さらに詳細に区分できた4個体のうち3個体がN9b1、1個体がN9b2aです。礼文島の1個体と六通貝塚の6個体のうち3個体は男性です。YHgは、礼文島の1個体がD1(F1344)、六通貝塚の3個体がD1a2a1c1(Z1570)とD1a2a1c1(Z1575)とD1a2a1c1a(CTS11032)です。アジア南東部のホアビン文化(Hòabìnhian)層で見つかった、較正年代で4415~4160年前頃の1個体(Ma911)のYHgもD1(M174)です(関連記事)。ホアビン文化狩猟採集民は遺伝的には本論文の沿岸部祖先系統の影響が圧倒的に強く、沿岸部祖先系統を有さないアジア東部の古代人ではまだYHg-D1は確認されていないと思いますので、アジア東部の個体群のYHg-D1は沿岸部祖先系統にのみ由来する可能性が高そうです。日本列島やチベットでは、内陸部祖先系統の遺伝的影響が圧倒的に強くなってもYHg-D1が残ったのに対して、農耕到来とともに内陸部祖先系統の遺伝的影響が強くなったアジア南東部では、YHg-D1がほとんど消えた理由に関しては、拡散の経緯や外来集団と在来集団との力関係や社会構造などの影響が大きいかもしれませんが、今後の研究の進展により解明されていくのではないか、と期待されます。
参考文献:
Wang CC. et al.(2021): Genomic insights into the formation of human populations in East Asia. Nature, 591, 7850, 413–419.
https://doi.org/10.1038/s41586-021-03336-2
追記(2021年3月18日)
本論文が『ネイチャー』本誌に掲載されたので、以下に『ネイチャー』の日本語サイトから引用します。
集団遺伝学:東アジア人集団の形成に関するゲノムからの知見
集団遺伝学:古代DNAでたどる東アジア人の集団史
古代東アジア人の利用可能なDNAデータは、これまで限定的だった。今回D Reichたちは、台湾、モンゴル、チベット、中国など、東アジア各地の古代人および現代人から得られた、大規模なゲノム規模のデータセットを報告している。このデータセットを既存のデータセットと統合して解析した結果、モンゴルおよびアムール川流域、黄河流域、台湾など、さまざまな地域での集団の移動が詳細に推測された。
この記事へのコメント
Boer et al. 2020 は McColl et al. 2018 の研究を否定して、縄文人は Basal Asians (such as Hoabinhians or Tianyuan) と関係しないと明らかにしたのに、その事実を無視して、この研究は McColl et al. 2018 の古いデータを意図的に採用している、と。
何がなんでも南方起源にしたいのでしょうか。陰湿な中国人らしいやり方です。Boer et al. 2020 は縄文人は、旧石器時代のシベリア人とゲノムを共有すると結んでいます。
よければ、これも翻訳してください。
Tao Zhang • 15 days ago • edited
Further studies, such as Boer et al. 2020 similarly rejected McColl et al. 2018 findings and concluded that there is no shared ancestry between the Ikawazu Jomon (IK002) and two other Jomon samples from Hokkaido and Honshu (such as Sanganji Jomon sample), with "basal Asians" such as Hoabinhians or Tianyuan.
(See:https://www.cambridge.org/core/journals/evolutionary-human-sciences/article/japan-considered-from-the-hypothesis-of-farmerlanguage-spread/BD91E69AEA3CCAEDC567519EF7F5AA97)
Citing Boer et al. 2020 :
The Jōmon do not share a special relationship with Hòabìnhians as previously suggested (McColl et al., 2018). Tests of genetic similarity do not show Hòabìnhians or the Jōmon sharing exceptionally high genetic similarity with each other.
Another study by Yang et al. 2020 expanded on the findings of Boer et al. 2020, similarly rejecting a close genetic relationship between Jomon and Onge/Hoabinhians.
See: (https://science.sciencemag.org/content/369/6501/282)
The question is now, why did the authors ignore these new findings and took the "early stage" data from McColl et al. 2018 for granted?
In the paper it does not seem that these data got tested for accuracy?
分岐が古いYHg-D1の古代人および現代人の分布からも、縄文人の祖先の半分弱がホアビン文化集団の祖先(ただ、両者の分岐はかなり早期と想定されます)と近く、縄文人を大きく異なる2つの祖先系統の混合とモデル化した本論文の見解は、現時点では最も説得力があると考えています。田园個体とホアビン文化集団についても、「Basal Asians」としてまとめるよりは、「沿岸部祖先系統」と「内陸部祖先系統」の起源となったユーラシア東部祖先系統から早期に分岐した関係にある、との本論文の想定の方がより実際にちかいのではないか、と考えています。