アジア中央部現代人におけるタリム盆地のミイラからの遺伝的影響
アジア中央部現代人におけるタリム盆地のミイラに代表される集団からの遺伝的影響に関する研究(Dai et al., 2022)が公表されました。アジア中央部人の多様性は、複数の移住と文化拡散により形成されてきました。古代DNA研究は青銅器時時代以来のアジア中央部人の人口統計学的変化を明らかにしてきましたが、アジア中央部現代人への古代の人口集団の寄与は不明瞭なままです。この研究は、インド・ヨーロッパ語族話者のタジクの人口集団とテュルク諸語話者のキルギスの人口集団の131人の全ゲノムの高網羅率の配列決定を実行し、そのゲノム多様性と混合史を調べます。本論文は古代DNAデータの統合により、アジア中央部人の起源と混合史をより詳細に明らかにしました。
その結果、現代のタジクの人口集団の主要な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)は、青銅器時代のバクトリア・ マルギアナ考古学複合(Bactrio Margian Archaeological Complex、以下BMAC)およびアンドロノヴォ(Andronovo)文化関連人口集団の混合にさかのぼれる、と分かりました。高地タジク人口集団はさらに、孤立した古代北ユーラシア人口集団である、タリム盆地のミイラから追加の遺伝子流動を受けました。キルギス人のユーラシア西部祖先系統は、おもに中華人民共和国の新疆ウイグル自治区(以下、新疆)の歴史時代の人口集団に由来します。さらに、タジク人とキルギス人の両方で検出された最近の混合兆候は、歴史時代におけるユーラシア東部草原地帯の遊牧民の拡大に起因します。
●研究史
ユーラシアの交差点に位置するアジア中央部は、ヒト進化の研究に重要な地域です。歴史学と考古学の証拠によると、言語および文化の変化と絡み合ったさまざまな移住が、アジア中央部において相互作用し、ヒトの遺伝的多様性を形成してきました。マイクロサテライト(DNA上で塩基配列中に同じ構造を持つ部分が2~5対繰り返し並んでいる反復配列)とY染色体とミトコンドリアDNA(mtDNA)の標識に基づく初期の諸研究は、アジア中央部人の遺伝的多様性がユーラシアで最高であることを示しました。
このパターンの説明のため、二つの仮説が提案されました。アジア中央部心臓部(中心地域)仮説は、ユーラシア人の遺伝的多様性の供給源としてアジア中央部を提案し、遺伝的混合仮説は、東西ユーラシア人の混合としてアジア中央部人を提案しました。DNAチップ(DNAの塩基配列を点状に数万個並べたもの)で遺伝子型決定されたDNAゲノム規模一塩基多型(SNP)のその後の分析は、アジア中央部における遺伝的混合のひじょうに複雑なシナリオを提案しました。その仮説では、ヨーロッパとアジア西部および南部からアジア中央部への遺伝子流動の複数の波が支持され、いくつかの最近の移住および混合事象が明らかになりました(関連記事)。
近年では、ゲノム規模水準に基づく古代DNAの調査が、アジア中央部人口集団の進化史の遺伝的見解を更新しました。簡潔に言うと、青銅器時代以来のさまざまな遺伝的祖先系統を含む移住と混合が示唆されました。BMAC集団は、イラン初期農耕民の遺伝的祖先系統(60~65%)と、それより低い割合のアナトリア半島農耕民関連祖先系統(20~25%)と、アジア中央部南方で栄えたシベリア西部狩猟採集民祖先系統(10%)により特徴づけられます(関連記事)。4100年前頃、草原地帯関連祖先系統がアジア中央部に出現しました。鉄器時代には、東方遊牧民の遺伝的構成要素が中央草原地帯のスキタイ人と新疆の人口集団で見つかりました(関連記事1および関連記事2および関連記事3)。
ごく最近、中国北西部の新疆に位置するタリム盆地の前期および中期青銅器時代(EMBA)のミイラにより表される、新たな遺伝的祖先系統が特定されました。とくにタリムEMBA1は、おもに古代北ユーラシア(ANE)人口集団に【その祖先系統が】おもに由来し、初期完新世以来孤立していた、と提案されました(関連記事)。アジア中央部におけるタリムEMBA1としての独特な新疆青銅器時代構成要素の歴史については、まだ不明です。過去5000年間の新疆人口集団の複雑な人口史が明らかにされてきましたが(関連記事)、上述の遺伝的祖先系統の混合が現代アジア中央部人口集団にどのように寄与したのかは、まだ不明です。
高解像度の全ゲノム配列決定(WGS)データは、複雑な動態を説明するための、配列決定深度と品質の異質な古代DNAデータとの統合を容易にします。この研究では、アジア中央部における2つの代表的な民族集団から合計131個体(表1)で、高深度WGSが実行されました。一方はテュルク諸語話者のキルギス人、もう一方はインド・ヨーロッパ語族話者のタジク人で(図1)、世界的なWGSパネルでは標本として不充分です。さまざまな人口集団ゲノム手法の活用により、大量の古代DNAデータと現代の人口集団のWGSデータが統合され、キルギス人とタジク人の集団の混合史が調べられました。本論文の結果は、アジア中央部人の起源と混合動態の理解を深めます。以下は本論文の図1です。
●人口集団のゲノム差異
2つの代表的なアジア中央部人口集団の131個体でWGSが実行されました。それは、中国およびキルギスのキルギス人2集団から72個体と、サリコル(Sarikoli)とワヒー(Wakhi)とドゥシャンベ(Dushanbe)のタジク人3集団から59個体です。各標本の平均的なゲノム配列決定深度は30倍以上です。アジア中央部の周辺地域の121個体の、刊行されている高深度のWGSデータと共同でSNP遺伝子型決定が実行され、ヒトゲノム参照配列hg19の全ての部位が出力されます。
品質管理の後、新たに配列決定された131個体のゲノムで合計1100万6ヶ所のSNPが得られました。合計288万8675ヶ所のSNPは、dbSNP(第138版)のデータベースに記録されていません。273万7785ヶ所のSNPは、1000人ゲノム計画で報告されていません。これは、遺伝的に標本として不充分なアジア中央部人口集団の配列決定の重要性を例証します。アジア中央部人における古代の人口集団の遺伝的影響を理解するため、すでに刊行されている現代のユーラシアとアフリカとアメリカ大陸の人口集団および古代の人口集団のデータと、252個体のゲノムのデータセットが統合され、2456個体で合計659765ヶ所のSNPが得られました。
●人口構造分析
主成分分析(PCA)が実行され、古代人標本をユーラシア現代人の遺伝的差異の状況に投影することにより、古代の個体群とアジア中央部現代人との間の遺伝的類似性が評価されました(図2)。PC1軸はユーラシア西部人(つまり、ヨーロッパ人とアジア西部人)およびアジア南部人をユーラシア東部人(アジア東部人とシベリア人)から区別し、PC2軸はさらに、アジア南部人をアジア西部人およびヨーロッパ人と分けます。中国およびキルギスタンのキルギス人はPCAの中心に分布し、ほぼその地理的位置に応じてクラスタ化します(まとまります)。
中国のキルギス人はヨーロッパ人およびアジア南部人とより近くでクラスタ化し、キルギスタンのキルギス人よりもユーラシア西部構成要素の割合が高いことを示唆します。タジク人集団はアジア南部人とアジア西部人の間に広がっており、その地理的分布にそってクラスタ化します。パミール高原の西側のドゥシャンベのタジク人は、パミール高原のサリコルやパミーリー(Pamiri)やワヒーのタジク人と分離します。古代DNAの文脈では、旧石器時代以来、タジク人集団はANE祖先系統の割合が高いロシアのアフォントヴァ・ゴラ(Afontova Gora)遺跡個体(アフォントヴァ・ゴラ2)と重なります。
キルギス人集団は、おもにユーラシア東部関連構成要素を有している(関連記事)、モンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された34950~33900年前頃となる上部旧石器時代(UP)の女性個体(モンゴル_サルキートUP)の近くに位置します。ドゥシャンベのタジク人は他のタジク人3集団と比較するとアナトリアN(新石器時代)の方へと伸びており(図2A)、ドゥシャンベのタジク人におけるアナトリア半島農耕民関連祖先系統のより高い割合示唆している可能性が高そうです。
青銅器時代(BA)の新疆の数個体、たとえば、新疆BA3や新疆BA4やジュンガリアEBA(前期青銅器時代)1およびEBA2などは、タジク人4集団と密接にクラスタ化し(図2B)、タジク人と青銅器時代の新疆の人口集団との間の高い遺伝的類似性を反映しているかもしれません。鉄器時代(IA)と歴史時代(HE)のアジア中央部および草原地帯個体群は、タジク人4集団と明確に分離し、例外は新疆とアジア南部の散在した個体、たとえばJEZK_IA3外れ値(o)BMACやLSH_IA2_oSteやXinj_HE1やパキスタンのラジャ・ジーラ(Raja Gira)個体です。対照的に、鉄器時代と歴史時代のアジア中央部およびモンゴルの個体の大半は、キルギス人とクラスタ化します。このパターンは、キルギス人およびタジク人集団の形成に関わった異なる混合史を反映しています。以下は本論文の図2です。
次に、モデルに基づくADMIXTUREクラスタ化分析が実行され、祖先系統混合の特性が得られました。K(系統構成要素数)=8のモデルで、最小の交差検証誤差結果が示されます。このモデル下で、キルギス人とタジク人は特有の6構成要素とともにユーラシア西部人との混合特性を示します(図3)。その6構成要素とは、アナトリア半島新石器時代農耕民関連祖先系統(アナトリアN、紫色)、ザグロス中央部のガンジュ・ダレー(Ganj Dareh)遺跡個体群に見られるイラン新石器時代農耕民関連祖先系統(イランN、桃色)、タリムEMBA1で支配的なANE関連祖先系統(濃い青色)、ヨーロッパ西部狩猟採集民関連祖先系統(WEHG、空色)、古代アジア東部関連祖先系統(緑色)、バイカル湖狩猟採集民関連祖先系統(黄色)です。一般的に、この6祖先系統構成要素は、アジア中央部全体の古代DNA標本に広く存在します。タジク人は、他のアジア中央部現代人よりも、タリムEMBA1で支配的なANE関連祖先系統をより高い割合で有しています(図3)。以下は本論文の図3です。
●ユーラシア古代人からの遺伝的寄与
古代のユーラシア人口集団とアジア中央部現代人(キルギス人とタジク人)との間の遺伝的類似性をさらに示すため、まずf4統計(人口集団1、人口集団2:タジク人およびキルギス人、ムブティ人)が計算され、それはタジク人がアジア中央部および草原地帯の人口集団との比較で、クシロフ(Ksirov)およびクシャン(Kushan)遺跡の紀元前450年頃のサルマティア人(Sarmatian)個体(サルマティア人_クシロフ_クシャン450BCE)や、JEZK_IA2やJEZK_IA1_aSteやJEZK_IA3_oBMACやトルクメニスタンIAなど鉄器時代人口集団とよりも、タリムEMBA1やアジア中央部および草原地帯EMBAやロシア_サマラ(Samara)EBAヤムナヤ(Yamnaya)文化など、青銅器時代人口集団の方と大きな類似性を有している、と示されます。キルギス人集団は、青銅器時代人口集団よりも、サカ(Saka)文化天山山脈の紀元前600年頃の個体(サカ天山600BCE)や、新疆IAや、新疆HE7や、新疆IA2_aEA(古代アジア東部)といった、鉄器時代および歴史時代の集団の方と大きな類似性を示します。
外群f3統計(ムブティ人;キルギス人およびタジク人、検証対象X)を用いて共有される遺伝的浮動が計算されて、ムブティ人は外群として用いられ、Xはユーラシアの人口集団一式を示します。タジク人4集団と、タリムEMBA1やアジア中央部および草原地帯EMBAやロシア_サマラEBAヤムナヤなど青銅器時代人口集団との間で最高の遺伝的類似性が証明されました。とくに、他の現代のアジア中央部人口集団と比較すると、パミール高原のタジク人3集団(サリコルとワヒーとパミーリー)が、タリムEMBA1とより高水準の遺伝的浮動を共有しています。キルギス人集団は、中国の五庄果墚(Wuzhuangguoliang)遺跡後期新石器時代個体(五庄果墚LN.EC)や中国の西遼河BA外れ値(WLR_BA_o)や中国のアムール川流域鮮卑IA(AR鮮卑IA)など、新石器時代と青銅器時代と鉄器時代の中国北部およびモンゴルの人口集団と最高の遺伝的浮動を共有しており、新石器時代以来のユーラシア東部における遺伝的連続性が示唆されます。
●混合シナリオの推定
qpAdmが採用され、キルギス人およびタジク人集団それぞれの、祖先供給源を含む混合モデルとその関連する遺伝的割合が推測されました。まず、混合の供給源として、銅器時代前の人口集団もしくは遺伝的に孤立した人口集団との、遠位モデル化が用いられました。キルギス人およびタジク人の最適の遠位モデルは、5供給源とモデル化できます。キルギス人における主要な祖先系統構成要素は、ロシアのシャマンカ(Shamanka)遺跡の金石併用時代(銅器時代)個体(シャマンカ金石併用時代)に代表されるバイカル湖狩猟採集民(59.3~69.8%)とイラン農耕民関連祖先系統(16~23.8%)に由来します。残りの少数の祖先系統構成要素は、アナトリア半島農耕民(5.1~5.6%)とWEHG(5.3~6.6%)とANE関連のタリムEMBA1(3.2~5.3%)です。タジク人集団の祖先系統特性は5構成要素に区分でき、イラン農耕民(43.8~52.8%)とANE(13.3~15.8%)とWEHG(9.5~11.8%)とバイカル湖狩猟採集民(7.7~17.1%)とアナトリア半島農耕民(9.7~15.6%)です。
次に、アジア中央部現代人の供給源として、青銅器時代と鉄器時代と歴史時代の人口集団でのモデル化が実行されました。サリコルおよびパミーリーのタジク人は、ロシアのアンドロノヴォ文化個体、BMAC、タリムEMBA1、モンゴルの匈奴o1の混合としてモデル化できます(図4A)。この結果は、少なくとも3つの別の供給源がタジク人集団に存在する、というqpWave分析により裏づけられます。タリムEMBA1は、サリコルおよびパミーリーのタジク人の混合推定では4方向モデル下で必要です。タリムEMBA1を除くと、混合モデル化は失敗しました。サリコルおよびパミーリーのタジク人では、草原地帯供給源として、ロシアMLBAシンタシュタ(Sintashta)文化、アジア中央部および草原地帯MLBA、ロシアのアファナシェヴォ(Afanasievo)文化、ロシア_サマラ(Samara)EBAと、どの集団を用いた場合でも、混合モデルは挙って失敗しました。
高地タジク人(サリコルとワヒーとパミーリー)では、ロシアのアンドロノヴォ文化もしくはロシアのアンドロノヴォ文化およびBMACをトルクメニスタンIAと置換すると、モデルはよく機能し、それは、トルクメニスタンIAがBMACとアンドロノヴォ文化の混合だったからです(関連記事)。ドゥシャンベのタジク人は、トルクメニスタンIAとモンゴル匈奴o1の混合としてモデル化できます。全ての結果は、タジク人の草原地帯祖先系統の代理として、ロシアのアンドロノヴォ文化集団を示唆します。その結果、タジク人の主要な祖先系統は、BMACおよびアンドロノヴォ文化集団と混合した青銅器時代人口集団にたどることができ、その後、高地タジク人はタリムEMBA1から追加の遺伝子流動を受けました。
タジク人と比較すると、テュルク諸語話者人口集団は異なるパターンを示します。キルギス人およびカザフ人集団の主要な祖先系統は、新疆HE3(44.8~58.9%)とモンゴル匈奴o1(41.1~55.2%)に由来します(図4A)。ウイグル人とウズベク人とトルクメン人は、トルクメニスタンIA(48.8~65.1%)とモンゴル匈奴o1(34.9~51.2%)の混合としてモデル化され(図4A)、これはウイグルの人口史と一致します。以下は本論文の図4です。
最後にDATESを用いて、タジク人およびキルギス人集団と関わる混合事象が年代測定されました。サリコルおよびパミーリーのタジク人では、BMACおよびアンドロノヴォ文化集団との混合は、それぞれ5970(7988~3951)年前頃と3211(3871~2550)年前頃にそれぞれ起き、これはアジア中央部における草原地帯関連祖先系統の出現時期と一致します。この年代の改善には、広範囲の追加のアンドロノヴォ文化個体の標本抽出が必要でしょう。BMACを支配的な供給源として用いると、タリムEMBA1からサリコルおよびパミーリーのタジク人集団への遺伝子流動はそれぞれ、2957(3587~2326)年前頃および3616(4414~2818)年前頃と推定されます。モンゴル匈奴o1により表されるユーラシア東部人の最近の西方への拡散を伴う、タジク人4集団における混合は、1418~805年前と推定されます。キルギス人の2集団については、モンゴル匈奴o1および匈奴HE3を含む主要な混合事象はそれぞれ、493(570~417)年前頃および784(940~629)年前頃と推定されます。
●mtDNAとY染色体の遺伝標識
キルギス人およびタジク人集団の母系と父系の遺伝子プールへの古代の祖先系統の影響を調べるため、WGSデータに由来するmtDNAとY染色体の差異が分析されました。ハプログループ特性は補足資料の表S8に示されています。mtDNAハプログループ(mtHg)UとHは、古代イラン/トゥーラン(現在のイランとトルクメニスタンとウズベキスタンとアフガニスタン)と草原地帯関連のつながりとして提案されており、キルギス人およびタジク人集団に存在します。タリムEMBA1で特徴づけられるmtHg-C4は、キルギス人およびタジク人でも見られます。
キルギス人(44人のうち26人)およびタジク人(33人のうち16人)集団における最も一般的な父系はY染色体ハプログループ(YHg)R1a1で、これは縄目文土器(Corded Ware)文化やアンドロノヴォ文化やシンタシュタ文化など、草原地帯関連人口集団で報告されてきました。ヤムナヤ文化およびアファナシェヴォ文化集団で特徴づけられるYHg-R1b1は、タジク人でも見つかります(33人のうち2人)。青銅器時代のイラン/トゥーランに広く存在するYHg-JおよびR2は、アジア中央部現代人でも見られます。これらの結果は、草原地帯およびBMACと関連する祖先系統を有する男女両方が、キルギス人およびタジク人集団の遺伝子プールに寄与したことを示唆します。
●族内婚の推定
遺伝的多様性への文化的影響は、アジア中央部では話題になっています。混合史の文脈において、古代の人口集団とタジク人およびキルギス人集団において同型接合連続領域(runs of homozygosity、略してROH)が特定され、アジア中央部における族内婚と族外婚の歴史が調べられました。タジク人は長いROHの閾値を超える個体の割合が高く、20 cM(センチモルガン)以上のROHの合計長は、79個体のうち18個体で50 cMを超えています。対照的に、キルギス人集団は低水準のROHを示します。このパターンは、タジク人の族内婚、およびキルギス人の族外婚と一致します。興味深いことに、タジク人の供給源であるBMACとアンドロノヴォ文化両方の人口集団は低水準のROHを有しており、両人口集団は族内婚を採用していなかったかもしれない、と示唆されます。タジク人で行なわれてきた族内婚の最節約的なシナリオは、5970~3211年前頃となるBMACとアンドロノヴォ文化の人口集団の混合後である可能性が高い、と本論文は提案します(図4B)。
●考察
アジア中央部には草原地帯やオアシスや渓谷や砂漠や高地など複雑な地形があることを考えると、その遺伝的多様性と人口構造は、利用可能なアジア中央部人のゲノムではまだ標本として不充分です。この研究では、アジア中央部人について最大のWGSが実行されました。タジク人3集団とキルギス人2集団から新たに生成された131個体の高深度ゲノムは、標本として不充分だったアジア中央部人口集団の遺伝的差異の目録を拡大しました。本論文の結果は、現代のタジク人とキルギス人の民族集団における、おもに地理的要因に対応する人口構造を示唆し、アジア中央部のさまざまな地域の民族集団のゲノムデータが、その人口史の研究に不可欠であることを提案します。
アジア中央部人の歴史を調べるために一連の遺伝学敵研究が行なわれたにも関わらず、遺伝標識の限定的な解像度と古代の人口集団の供給源パネルが欠けていたため、これらの研究はユーラシア現代人に由来する祖先系統構成要素、つまり遺伝的供給源の間接的な代表を分析しました。アジア中央部とその周辺地域の高深度ゲノムの進歩を活用して、本論文はタジク人およびキルギス人集団の混合史の起源を、広い時間範囲にわたる古代ユーラシア人口集団の文脈で再評価しました。
本論文の結果は、タジク人集団が青銅器時代アジア中央部人、とくに新疆の個体群と高い遺伝的類似性を示す(図2B)、と明らかにしました。タジク人4集団の主要な祖先系統構成要素は、BMACとアンドロノヴォの個体群にたどれます(図4A・B)。サカ文化などスキタイ人におけるアンドロノヴォ文化など草原地帯関連祖先系統を考えると、提案されたタジク人とスキタイ人との間の言語学と自然人類学の関連は、その共有された草原地帯関連祖先系統に由来するかもしれません。
対照的に、キルギス人は他のテュルク諸語話者人口集団とともに、鉄器時代以降の混合に起源があります。モンゴル匈奴o1の代表を伴う東部草原地帯に由来する歴史時代の遺伝子流動は、キルギス人と他のテュルク諸語話者人口集団にかなりの遺伝的寄与をもたらし、それはカザフ人とウイグル人とウズベク人で34.9~55.2%となります。これは、タジク人集団における11.6~18.6%より高く(図4A)、タジク人は最近の混合からの影響をあまり受けていない、と示唆されます。その結果、タジク人集団は一般的に青銅器時代以来、アジア中央部人の遺伝的連続性のパターンを示します。本論文の結果は、アジア中央部へのインド・ヨーロッパ語族話者の拡大はテュルク諸語話者の拡大より早かった、とする言語学および遺伝学的証拠と一致します。
さらに重要なことに、タリムEMBA1により表される新たに特徴づけられた祖先系統構成要素が、アジア中央部現代人の遺伝子プールに遺伝的影響を残した、遺伝的に孤立したANE関連人口集団として特定されました(関連記事)。タリムEMBA1祖先系統は鉄器時代と歴史時代の新疆の人口集団に存在しましたが(関連記事)、アジア中央部の現代の人口集団では、タリム盆地の近隣となるパミール高原(図1)のサリコルとワヒーとパミーリーのタジク人でしか検出されませんでした。パミール高原の西側のドゥシャンベのタジク人と他のテュルク諸語話者人口集団では、タリムEMBA1祖先系統の痕跡の検出に失敗しました。先行研究(関連記事)では、ウズベキスタンの西部タジク人はタリムEMBA1祖先系統を有していないかもしれない、と予測されました。
考古学および遺伝学的研究の証拠の統合により、本論文が提案する興味深いシナリオは、孤立した前期~中期青銅器時代のタリム盆地人口集団(言語は不明)が完全に消えたわけではない、というものです。その集団はタリム盆地で居住地を放棄した後、パミール高原に移住し、次に3286年前頃にインド・ヨーロッパ語族話者と混合した可能性が高そうです。タリムEMBA1祖先系統は、鉄器時代人口集団、つまり新疆のタシュクルガン(Taxkorgan)のJEZK_IA2、およびパミール高原の現代のタジク人集団で維持されています。その相互作用は、青銅器時代にパミール高原とタリム盆地の両方に出現した、アジア西部から輸入されたコムギとオオムギの考古学的証拠によっても示唆されます。それは、パミール高原がユーラシア東西の文化の相互作用の地理的回廊としてだけではなく、孤立した前期~中期青銅器時代のタリム盆地人口集団にとって退避地としても機能したことを裏づけます。
まとめると、本論文はアジア中央部人の祖先の起源と人口構造と混合史について、以前の報告より繊細なシナリオを明らかにしました。しかし、将来の研究にはまだ長い道のりがあります。第一に、古代DNAに基づく複数の波の混合の年代測定手法が必要です。第二に、時空間的にアジア中央部とその近隣地域からより多くの古代DNAデータ、とくに高品質のデータが、このユーラシア心臓部における人口動態と局所的適応と表現型の進化についての詳細の改善に必要です。
参考文献:
Dai SS. et al.(2022): The Genetic Echo of the Tarim Mummies in Modern Central Asians. Molecular Biology and Evolution, 39, 9, msac179.
https://doi.org/10.1093/molbev/msac179
その結果、現代のタジクの人口集団の主要な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)は、青銅器時代のバクトリア・ マルギアナ考古学複合(Bactrio Margian Archaeological Complex、以下BMAC)およびアンドロノヴォ(Andronovo)文化関連人口集団の混合にさかのぼれる、と分かりました。高地タジク人口集団はさらに、孤立した古代北ユーラシア人口集団である、タリム盆地のミイラから追加の遺伝子流動を受けました。キルギス人のユーラシア西部祖先系統は、おもに中華人民共和国の新疆ウイグル自治区(以下、新疆)の歴史時代の人口集団に由来します。さらに、タジク人とキルギス人の両方で検出された最近の混合兆候は、歴史時代におけるユーラシア東部草原地帯の遊牧民の拡大に起因します。
●研究史
ユーラシアの交差点に位置するアジア中央部は、ヒト進化の研究に重要な地域です。歴史学と考古学の証拠によると、言語および文化の変化と絡み合ったさまざまな移住が、アジア中央部において相互作用し、ヒトの遺伝的多様性を形成してきました。マイクロサテライト(DNA上で塩基配列中に同じ構造を持つ部分が2~5対繰り返し並んでいる反復配列)とY染色体とミトコンドリアDNA(mtDNA)の標識に基づく初期の諸研究は、アジア中央部人の遺伝的多様性がユーラシアで最高であることを示しました。
このパターンの説明のため、二つの仮説が提案されました。アジア中央部心臓部(中心地域)仮説は、ユーラシア人の遺伝的多様性の供給源としてアジア中央部を提案し、遺伝的混合仮説は、東西ユーラシア人の混合としてアジア中央部人を提案しました。DNAチップ(DNAの塩基配列を点状に数万個並べたもの)で遺伝子型決定されたDNAゲノム規模一塩基多型(SNP)のその後の分析は、アジア中央部における遺伝的混合のひじょうに複雑なシナリオを提案しました。その仮説では、ヨーロッパとアジア西部および南部からアジア中央部への遺伝子流動の複数の波が支持され、いくつかの最近の移住および混合事象が明らかになりました(関連記事)。
近年では、ゲノム規模水準に基づく古代DNAの調査が、アジア中央部人口集団の進化史の遺伝的見解を更新しました。簡潔に言うと、青銅器時代以来のさまざまな遺伝的祖先系統を含む移住と混合が示唆されました。BMAC集団は、イラン初期農耕民の遺伝的祖先系統(60~65%)と、それより低い割合のアナトリア半島農耕民関連祖先系統(20~25%)と、アジア中央部南方で栄えたシベリア西部狩猟採集民祖先系統(10%)により特徴づけられます(関連記事)。4100年前頃、草原地帯関連祖先系統がアジア中央部に出現しました。鉄器時代には、東方遊牧民の遺伝的構成要素が中央草原地帯のスキタイ人と新疆の人口集団で見つかりました(関連記事1および関連記事2および関連記事3)。
ごく最近、中国北西部の新疆に位置するタリム盆地の前期および中期青銅器時代(EMBA)のミイラにより表される、新たな遺伝的祖先系統が特定されました。とくにタリムEMBA1は、おもに古代北ユーラシア(ANE)人口集団に【その祖先系統が】おもに由来し、初期完新世以来孤立していた、と提案されました(関連記事)。アジア中央部におけるタリムEMBA1としての独特な新疆青銅器時代構成要素の歴史については、まだ不明です。過去5000年間の新疆人口集団の複雑な人口史が明らかにされてきましたが(関連記事)、上述の遺伝的祖先系統の混合が現代アジア中央部人口集団にどのように寄与したのかは、まだ不明です。
高解像度の全ゲノム配列決定(WGS)データは、複雑な動態を説明するための、配列決定深度と品質の異質な古代DNAデータとの統合を容易にします。この研究では、アジア中央部における2つの代表的な民族集団から合計131個体(表1)で、高深度WGSが実行されました。一方はテュルク諸語話者のキルギス人、もう一方はインド・ヨーロッパ語族話者のタジク人で(図1)、世界的なWGSパネルでは標本として不充分です。さまざまな人口集団ゲノム手法の活用により、大量の古代DNAデータと現代の人口集団のWGSデータが統合され、キルギス人とタジク人の集団の混合史が調べられました。本論文の結果は、アジア中央部人の起源と混合動態の理解を深めます。以下は本論文の図1です。
●人口集団のゲノム差異
2つの代表的なアジア中央部人口集団の131個体でWGSが実行されました。それは、中国およびキルギスのキルギス人2集団から72個体と、サリコル(Sarikoli)とワヒー(Wakhi)とドゥシャンベ(Dushanbe)のタジク人3集団から59個体です。各標本の平均的なゲノム配列決定深度は30倍以上です。アジア中央部の周辺地域の121個体の、刊行されている高深度のWGSデータと共同でSNP遺伝子型決定が実行され、ヒトゲノム参照配列hg19の全ての部位が出力されます。
品質管理の後、新たに配列決定された131個体のゲノムで合計1100万6ヶ所のSNPが得られました。合計288万8675ヶ所のSNPは、dbSNP(第138版)のデータベースに記録されていません。273万7785ヶ所のSNPは、1000人ゲノム計画で報告されていません。これは、遺伝的に標本として不充分なアジア中央部人口集団の配列決定の重要性を例証します。アジア中央部人における古代の人口集団の遺伝的影響を理解するため、すでに刊行されている現代のユーラシアとアフリカとアメリカ大陸の人口集団および古代の人口集団のデータと、252個体のゲノムのデータセットが統合され、2456個体で合計659765ヶ所のSNPが得られました。
●人口構造分析
主成分分析(PCA)が実行され、古代人標本をユーラシア現代人の遺伝的差異の状況に投影することにより、古代の個体群とアジア中央部現代人との間の遺伝的類似性が評価されました(図2)。PC1軸はユーラシア西部人(つまり、ヨーロッパ人とアジア西部人)およびアジア南部人をユーラシア東部人(アジア東部人とシベリア人)から区別し、PC2軸はさらに、アジア南部人をアジア西部人およびヨーロッパ人と分けます。中国およびキルギスタンのキルギス人はPCAの中心に分布し、ほぼその地理的位置に応じてクラスタ化します(まとまります)。
中国のキルギス人はヨーロッパ人およびアジア南部人とより近くでクラスタ化し、キルギスタンのキルギス人よりもユーラシア西部構成要素の割合が高いことを示唆します。タジク人集団はアジア南部人とアジア西部人の間に広がっており、その地理的分布にそってクラスタ化します。パミール高原の西側のドゥシャンベのタジク人は、パミール高原のサリコルやパミーリー(Pamiri)やワヒーのタジク人と分離します。古代DNAの文脈では、旧石器時代以来、タジク人集団はANE祖先系統の割合が高いロシアのアフォントヴァ・ゴラ(Afontova Gora)遺跡個体(アフォントヴァ・ゴラ2)と重なります。
キルギス人集団は、おもにユーラシア東部関連構成要素を有している(関連記事)、モンゴル北東部のサルキート渓谷(Salkhit Valley)で発見された34950~33900年前頃となる上部旧石器時代(UP)の女性個体(モンゴル_サルキートUP)の近くに位置します。ドゥシャンベのタジク人は他のタジク人3集団と比較するとアナトリアN(新石器時代)の方へと伸びており(図2A)、ドゥシャンベのタジク人におけるアナトリア半島農耕民関連祖先系統のより高い割合示唆している可能性が高そうです。
青銅器時代(BA)の新疆の数個体、たとえば、新疆BA3や新疆BA4やジュンガリアEBA(前期青銅器時代)1およびEBA2などは、タジク人4集団と密接にクラスタ化し(図2B)、タジク人と青銅器時代の新疆の人口集団との間の高い遺伝的類似性を反映しているかもしれません。鉄器時代(IA)と歴史時代(HE)のアジア中央部および草原地帯個体群は、タジク人4集団と明確に分離し、例外は新疆とアジア南部の散在した個体、たとえばJEZK_IA3外れ値(o)BMACやLSH_IA2_oSteやXinj_HE1やパキスタンのラジャ・ジーラ(Raja Gira)個体です。対照的に、鉄器時代と歴史時代のアジア中央部およびモンゴルの個体の大半は、キルギス人とクラスタ化します。このパターンは、キルギス人およびタジク人集団の形成に関わった異なる混合史を反映しています。以下は本論文の図2です。
次に、モデルに基づくADMIXTUREクラスタ化分析が実行され、祖先系統混合の特性が得られました。K(系統構成要素数)=8のモデルで、最小の交差検証誤差結果が示されます。このモデル下で、キルギス人とタジク人は特有の6構成要素とともにユーラシア西部人との混合特性を示します(図3)。その6構成要素とは、アナトリア半島新石器時代農耕民関連祖先系統(アナトリアN、紫色)、ザグロス中央部のガンジュ・ダレー(Ganj Dareh)遺跡個体群に見られるイラン新石器時代農耕民関連祖先系統(イランN、桃色)、タリムEMBA1で支配的なANE関連祖先系統(濃い青色)、ヨーロッパ西部狩猟採集民関連祖先系統(WEHG、空色)、古代アジア東部関連祖先系統(緑色)、バイカル湖狩猟採集民関連祖先系統(黄色)です。一般的に、この6祖先系統構成要素は、アジア中央部全体の古代DNA標本に広く存在します。タジク人は、他のアジア中央部現代人よりも、タリムEMBA1で支配的なANE関連祖先系統をより高い割合で有しています(図3)。以下は本論文の図3です。
●ユーラシア古代人からの遺伝的寄与
古代のユーラシア人口集団とアジア中央部現代人(キルギス人とタジク人)との間の遺伝的類似性をさらに示すため、まずf4統計(人口集団1、人口集団2:タジク人およびキルギス人、ムブティ人)が計算され、それはタジク人がアジア中央部および草原地帯の人口集団との比較で、クシロフ(Ksirov)およびクシャン(Kushan)遺跡の紀元前450年頃のサルマティア人(Sarmatian)個体(サルマティア人_クシロフ_クシャン450BCE)や、JEZK_IA2やJEZK_IA1_aSteやJEZK_IA3_oBMACやトルクメニスタンIAなど鉄器時代人口集団とよりも、タリムEMBA1やアジア中央部および草原地帯EMBAやロシア_サマラ(Samara)EBAヤムナヤ(Yamnaya)文化など、青銅器時代人口集団の方と大きな類似性を有している、と示されます。キルギス人集団は、青銅器時代人口集団よりも、サカ(Saka)文化天山山脈の紀元前600年頃の個体(サカ天山600BCE)や、新疆IAや、新疆HE7や、新疆IA2_aEA(古代アジア東部)といった、鉄器時代および歴史時代の集団の方と大きな類似性を示します。
外群f3統計(ムブティ人;キルギス人およびタジク人、検証対象X)を用いて共有される遺伝的浮動が計算されて、ムブティ人は外群として用いられ、Xはユーラシアの人口集団一式を示します。タジク人4集団と、タリムEMBA1やアジア中央部および草原地帯EMBAやロシア_サマラEBAヤムナヤなど青銅器時代人口集団との間で最高の遺伝的類似性が証明されました。とくに、他の現代のアジア中央部人口集団と比較すると、パミール高原のタジク人3集団(サリコルとワヒーとパミーリー)が、タリムEMBA1とより高水準の遺伝的浮動を共有しています。キルギス人集団は、中国の五庄果墚(Wuzhuangguoliang)遺跡後期新石器時代個体(五庄果墚LN.EC)や中国の西遼河BA外れ値(WLR_BA_o)や中国のアムール川流域鮮卑IA(AR鮮卑IA)など、新石器時代と青銅器時代と鉄器時代の中国北部およびモンゴルの人口集団と最高の遺伝的浮動を共有しており、新石器時代以来のユーラシア東部における遺伝的連続性が示唆されます。
●混合シナリオの推定
qpAdmが採用され、キルギス人およびタジク人集団それぞれの、祖先供給源を含む混合モデルとその関連する遺伝的割合が推測されました。まず、混合の供給源として、銅器時代前の人口集団もしくは遺伝的に孤立した人口集団との、遠位モデル化が用いられました。キルギス人およびタジク人の最適の遠位モデルは、5供給源とモデル化できます。キルギス人における主要な祖先系統構成要素は、ロシアのシャマンカ(Shamanka)遺跡の金石併用時代(銅器時代)個体(シャマンカ金石併用時代)に代表されるバイカル湖狩猟採集民(59.3~69.8%)とイラン農耕民関連祖先系統(16~23.8%)に由来します。残りの少数の祖先系統構成要素は、アナトリア半島農耕民(5.1~5.6%)とWEHG(5.3~6.6%)とANE関連のタリムEMBA1(3.2~5.3%)です。タジク人集団の祖先系統特性は5構成要素に区分でき、イラン農耕民(43.8~52.8%)とANE(13.3~15.8%)とWEHG(9.5~11.8%)とバイカル湖狩猟採集民(7.7~17.1%)とアナトリア半島農耕民(9.7~15.6%)です。
次に、アジア中央部現代人の供給源として、青銅器時代と鉄器時代と歴史時代の人口集団でのモデル化が実行されました。サリコルおよびパミーリーのタジク人は、ロシアのアンドロノヴォ文化個体、BMAC、タリムEMBA1、モンゴルの匈奴o1の混合としてモデル化できます(図4A)。この結果は、少なくとも3つの別の供給源がタジク人集団に存在する、というqpWave分析により裏づけられます。タリムEMBA1は、サリコルおよびパミーリーのタジク人の混合推定では4方向モデル下で必要です。タリムEMBA1を除くと、混合モデル化は失敗しました。サリコルおよびパミーリーのタジク人では、草原地帯供給源として、ロシアMLBAシンタシュタ(Sintashta)文化、アジア中央部および草原地帯MLBA、ロシアのアファナシェヴォ(Afanasievo)文化、ロシア_サマラ(Samara)EBAと、どの集団を用いた場合でも、混合モデルは挙って失敗しました。
高地タジク人(サリコルとワヒーとパミーリー)では、ロシアのアンドロノヴォ文化もしくはロシアのアンドロノヴォ文化およびBMACをトルクメニスタンIAと置換すると、モデルはよく機能し、それは、トルクメニスタンIAがBMACとアンドロノヴォ文化の混合だったからです(関連記事)。ドゥシャンベのタジク人は、トルクメニスタンIAとモンゴル匈奴o1の混合としてモデル化できます。全ての結果は、タジク人の草原地帯祖先系統の代理として、ロシアのアンドロノヴォ文化集団を示唆します。その結果、タジク人の主要な祖先系統は、BMACおよびアンドロノヴォ文化集団と混合した青銅器時代人口集団にたどることができ、その後、高地タジク人はタリムEMBA1から追加の遺伝子流動を受けました。
タジク人と比較すると、テュルク諸語話者人口集団は異なるパターンを示します。キルギス人およびカザフ人集団の主要な祖先系統は、新疆HE3(44.8~58.9%)とモンゴル匈奴o1(41.1~55.2%)に由来します(図4A)。ウイグル人とウズベク人とトルクメン人は、トルクメニスタンIA(48.8~65.1%)とモンゴル匈奴o1(34.9~51.2%)の混合としてモデル化され(図4A)、これはウイグルの人口史と一致します。以下は本論文の図4です。
最後にDATESを用いて、タジク人およびキルギス人集団と関わる混合事象が年代測定されました。サリコルおよびパミーリーのタジク人では、BMACおよびアンドロノヴォ文化集団との混合は、それぞれ5970(7988~3951)年前頃と3211(3871~2550)年前頃にそれぞれ起き、これはアジア中央部における草原地帯関連祖先系統の出現時期と一致します。この年代の改善には、広範囲の追加のアンドロノヴォ文化個体の標本抽出が必要でしょう。BMACを支配的な供給源として用いると、タリムEMBA1からサリコルおよびパミーリーのタジク人集団への遺伝子流動はそれぞれ、2957(3587~2326)年前頃および3616(4414~2818)年前頃と推定されます。モンゴル匈奴o1により表されるユーラシア東部人の最近の西方への拡散を伴う、タジク人4集団における混合は、1418~805年前と推定されます。キルギス人の2集団については、モンゴル匈奴o1および匈奴HE3を含む主要な混合事象はそれぞれ、493(570~417)年前頃および784(940~629)年前頃と推定されます。
●mtDNAとY染色体の遺伝標識
キルギス人およびタジク人集団の母系と父系の遺伝子プールへの古代の祖先系統の影響を調べるため、WGSデータに由来するmtDNAとY染色体の差異が分析されました。ハプログループ特性は補足資料の表S8に示されています。mtDNAハプログループ(mtHg)UとHは、古代イラン/トゥーラン(現在のイランとトルクメニスタンとウズベキスタンとアフガニスタン)と草原地帯関連のつながりとして提案されており、キルギス人およびタジク人集団に存在します。タリムEMBA1で特徴づけられるmtHg-C4は、キルギス人およびタジク人でも見られます。
キルギス人(44人のうち26人)およびタジク人(33人のうち16人)集団における最も一般的な父系はY染色体ハプログループ(YHg)R1a1で、これは縄目文土器(Corded Ware)文化やアンドロノヴォ文化やシンタシュタ文化など、草原地帯関連人口集団で報告されてきました。ヤムナヤ文化およびアファナシェヴォ文化集団で特徴づけられるYHg-R1b1は、タジク人でも見つかります(33人のうち2人)。青銅器時代のイラン/トゥーランに広く存在するYHg-JおよびR2は、アジア中央部現代人でも見られます。これらの結果は、草原地帯およびBMACと関連する祖先系統を有する男女両方が、キルギス人およびタジク人集団の遺伝子プールに寄与したことを示唆します。
●族内婚の推定
遺伝的多様性への文化的影響は、アジア中央部では話題になっています。混合史の文脈において、古代の人口集団とタジク人およびキルギス人集団において同型接合連続領域(runs of homozygosity、略してROH)が特定され、アジア中央部における族内婚と族外婚の歴史が調べられました。タジク人は長いROHの閾値を超える個体の割合が高く、20 cM(センチモルガン)以上のROHの合計長は、79個体のうち18個体で50 cMを超えています。対照的に、キルギス人集団は低水準のROHを示します。このパターンは、タジク人の族内婚、およびキルギス人の族外婚と一致します。興味深いことに、タジク人の供給源であるBMACとアンドロノヴォ文化両方の人口集団は低水準のROHを有しており、両人口集団は族内婚を採用していなかったかもしれない、と示唆されます。タジク人で行なわれてきた族内婚の最節約的なシナリオは、5970~3211年前頃となるBMACとアンドロノヴォ文化の人口集団の混合後である可能性が高い、と本論文は提案します(図4B)。
●考察
アジア中央部には草原地帯やオアシスや渓谷や砂漠や高地など複雑な地形があることを考えると、その遺伝的多様性と人口構造は、利用可能なアジア中央部人のゲノムではまだ標本として不充分です。この研究では、アジア中央部人について最大のWGSが実行されました。タジク人3集団とキルギス人2集団から新たに生成された131個体の高深度ゲノムは、標本として不充分だったアジア中央部人口集団の遺伝的差異の目録を拡大しました。本論文の結果は、現代のタジク人とキルギス人の民族集団における、おもに地理的要因に対応する人口構造を示唆し、アジア中央部のさまざまな地域の民族集団のゲノムデータが、その人口史の研究に不可欠であることを提案します。
アジア中央部人の歴史を調べるために一連の遺伝学敵研究が行なわれたにも関わらず、遺伝標識の限定的な解像度と古代の人口集団の供給源パネルが欠けていたため、これらの研究はユーラシア現代人に由来する祖先系統構成要素、つまり遺伝的供給源の間接的な代表を分析しました。アジア中央部とその周辺地域の高深度ゲノムの進歩を活用して、本論文はタジク人およびキルギス人集団の混合史の起源を、広い時間範囲にわたる古代ユーラシア人口集団の文脈で再評価しました。
本論文の結果は、タジク人集団が青銅器時代アジア中央部人、とくに新疆の個体群と高い遺伝的類似性を示す(図2B)、と明らかにしました。タジク人4集団の主要な祖先系統構成要素は、BMACとアンドロノヴォの個体群にたどれます(図4A・B)。サカ文化などスキタイ人におけるアンドロノヴォ文化など草原地帯関連祖先系統を考えると、提案されたタジク人とスキタイ人との間の言語学と自然人類学の関連は、その共有された草原地帯関連祖先系統に由来するかもしれません。
対照的に、キルギス人は他のテュルク諸語話者人口集団とともに、鉄器時代以降の混合に起源があります。モンゴル匈奴o1の代表を伴う東部草原地帯に由来する歴史時代の遺伝子流動は、キルギス人と他のテュルク諸語話者人口集団にかなりの遺伝的寄与をもたらし、それはカザフ人とウイグル人とウズベク人で34.9~55.2%となります。これは、タジク人集団における11.6~18.6%より高く(図4A)、タジク人は最近の混合からの影響をあまり受けていない、と示唆されます。その結果、タジク人集団は一般的に青銅器時代以来、アジア中央部人の遺伝的連続性のパターンを示します。本論文の結果は、アジア中央部へのインド・ヨーロッパ語族話者の拡大はテュルク諸語話者の拡大より早かった、とする言語学および遺伝学的証拠と一致します。
さらに重要なことに、タリムEMBA1により表される新たに特徴づけられた祖先系統構成要素が、アジア中央部現代人の遺伝子プールに遺伝的影響を残した、遺伝的に孤立したANE関連人口集団として特定されました(関連記事)。タリムEMBA1祖先系統は鉄器時代と歴史時代の新疆の人口集団に存在しましたが(関連記事)、アジア中央部の現代の人口集団では、タリム盆地の近隣となるパミール高原(図1)のサリコルとワヒーとパミーリーのタジク人でしか検出されませんでした。パミール高原の西側のドゥシャンベのタジク人と他のテュルク諸語話者人口集団では、タリムEMBA1祖先系統の痕跡の検出に失敗しました。先行研究(関連記事)では、ウズベキスタンの西部タジク人はタリムEMBA1祖先系統を有していないかもしれない、と予測されました。
考古学および遺伝学的研究の証拠の統合により、本論文が提案する興味深いシナリオは、孤立した前期~中期青銅器時代のタリム盆地人口集団(言語は不明)が完全に消えたわけではない、というものです。その集団はタリム盆地で居住地を放棄した後、パミール高原に移住し、次に3286年前頃にインド・ヨーロッパ語族話者と混合した可能性が高そうです。タリムEMBA1祖先系統は、鉄器時代人口集団、つまり新疆のタシュクルガン(Taxkorgan)のJEZK_IA2、およびパミール高原の現代のタジク人集団で維持されています。その相互作用は、青銅器時代にパミール高原とタリム盆地の両方に出現した、アジア西部から輸入されたコムギとオオムギの考古学的証拠によっても示唆されます。それは、パミール高原がユーラシア東西の文化の相互作用の地理的回廊としてだけではなく、孤立した前期~中期青銅器時代のタリム盆地人口集団にとって退避地としても機能したことを裏づけます。
まとめると、本論文はアジア中央部人の祖先の起源と人口構造と混合史について、以前の報告より繊細なシナリオを明らかにしました。しかし、将来の研究にはまだ長い道のりがあります。第一に、古代DNAに基づく複数の波の混合の年代測定手法が必要です。第二に、時空間的にアジア中央部とその近隣地域からより多くの古代DNAデータ、とくに高品質のデータが、このユーラシア心臓部における人口動態と局所的適応と表現型の進化についての詳細の改善に必要です。
参考文献:
Dai SS. et al.(2022): The Genetic Echo of the Tarim Mummies in Modern Central Asians. Molecular Biology and Evolution, 39, 9, msac179.
https://doi.org/10.1093/molbev/msac179
この記事へのコメント