仰韶遺跡の新石器時代人類のゲノムデータ
黄河中流域の新石器時代人類のゲノムデータを報告した研究(Li et al., 2024)が公表されました。本論文は、黄河中流域の代表的な新石器時代文化である仰韶(Yangshao)文化の基準遺跡となる仰韶遺跡の、仰韶文化~龍山(Longshan)文化期の人類のゲノムデータを報告し、これまで認識されていなかった、後期龍山文化期の人類集団における遺伝的多様性を示しています。ただ、本論文の主要な対象読者は専門家でしょうから、とくに注意が喚起されているわけではありませんが、仰韶文化と関連する人類集団のような遺伝的構成要素が、中華人民共和国の支配地域の多くのさまざまな人類集団のゲノムにおいて高い割合を占めているからといって、仰韶文化人類集団がそうしたさまざまな人類集団すべての直接的祖先であることを意味しているわけでも証明しているわけでもない、と認識しておかねばならないでしょう。こうした古代ゲノム研究の一般層の受容において、古代人A集団と古代人B集団の混合で古代人C集団や現代人D集団のゲノムがモデル化できることは、A集団とB集団がC集団やD集団の直接的祖先であることを意味しているとは限らない、と常に念頭に置かねばなりません。
また、本論文は「中華民族」の遺伝的形成における黄河の重要性を最後に指摘していますが、現時点で中華人民共和国の支配下に置かれている多様な人類集団を「中華民族」という一つの民族的枠組みで把握することにはあまりにも無理があり、ましてや「中華民族」なる概念を前近代に拡張して人類史や歴史を把握することは論外である、と私は考えています。「中華民族」なる概念が提唱された当初は、そこに「同化」や「民族浄化」だけではない、肯定的な意味合いを読み取ることもできたのかもしれませんが、少なくとも現時点では、「中華民族」なる概念に(中華人民共和国の支配者および主流派の人々や、中華人民共和国の体制教義にひじょうに肯定的な外国の人々以外では)肯定的意味合いを見いだすことはほぼ不可能で、ひじょうに悍ましい概念になっている、と私は考えています。この記事における時代区分の略称は、後期新石器時代(Late Neolithic、略してLN)と鉄器時代(Iron Age、略してIA)です。なお、[]は本論文の参考文献の番号で、当ブログで過去に取り上げた研究のみを掲載しています。
●研究史
1921年に、スウェーデンの地質学者であるユハン・グンナール・アンデショーン(Johan Gunnar Andersson、ユハン・グンナール・アンダーソン)と中国人の同僚は、中国中央部の河南省三門峡市の仰韶遺跡の最初の発掘を実行しました。考古学者は、仰韶村(Yangshaocun)で発掘された遺物は新石器時代にさかのぼり、仰韶村に因んで考古学的には「仰韶文化」として記載する、との合意に達しました。仰韶村における仰韶文化の発見は中国における近代考古学の開始を示しており、中国には石器時代文化はない、との主張を覆しました。
過去数十年間、学際的研究は黄河中流域の新石器時代の歴史に関する知識を大きく増やしました。考古学的には、裴李崗(Peiligang)文化(9000~7000年前頃)が黄河中流域における最初の新石器時代文化で、狩猟および採集から雑穀農耕への重要な移行段階とみなされています。7000~5000年前頃の間、仰韶文化は中国における最古級の農耕共同体の一つを表しています。仰韶文化の廟底溝(Miaodigou)遺跡段階までに、乾燥農耕が主要な生計戦略となり、仰韶文化関連要素の外部への急速な拡大の契機となった、人口圧の高まりがもたらされました。5000~3000年前頃には、龍山文化が独立した共同体から王朝国家への移行の重要な段階でした。龍山文化は、先行する仰韶文化の赤みがかった土器とは区別される、高度な磨製黒陶で注目されています。言語学的研究では、シナ・チベット語族は後期新石器時代の黄河流域起源だった、と示唆されてきました[6]。
これまで、黄河中流域の人口動態の歴史に関する知識は、古代DNAゲノムの不足のため比較的限られています。稲作農耕への依存度増加と関連しているかもしれない人口動態の変化は、黄河中流域の仰韶文化および龍山文化関連個体群の利用可能な古代DNAから明らかにされました[7]。瓦店(Wadian)遺跡や平糧台(Pingliangtai)遺跡や郝家台(Haojiatai)遺跡の後期新石器時代龍山文化の人々は、その祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)の大半が小呉(Xiaowu)遺跡と汪溝(Wanggou)遺跡の中期新石器時代仰韶文化の人々に由来する、と特徴づけられましたが、アジア東部南方の人々から追加の遺伝子流動を受け取りました[7]。しかし、仰韶文化期から龍山文化期の移行における文化的変化がどの程度、黄河中流域の人口動態を伴ったのかは、まだ確定していません。最近の古代DNA研究も、チベット高原[8]や中国南西部[9]や西遼河[7、10]への黄河関連祖先系統の寄与を裏づけました。中国南部沿岸では、前期新石器時代と比較して後期新石器時代には、黄河関連祖先系統が増加しました[11]。これらの調査結果は、黄河が中華文明【当ブログでは原則として「文明」という用語を使わないことにしていますが、この記事では「civilization」の訳語として使います】に長期の顕著な影響を及ぼした、と強調しています。
考古学的重要性にも関わらず、仰韶村のヒト遺骸は遺伝学的に標本抽出されていませんでした。本論文では、仰韶村の仰韶文化と龍山文化に属するヒト遺骸から得られた最初のゲノム規模データが報告されます。本論文は、厦門大学の医療倫理委員会によって審査され、承認されました。放射性炭素年代測定によると、この研究で新たに生成された仰韶文化関連の1個体の年代は仰韶文化中期で、龍山文化関連の以前に刊行された個体と新たに報告される個体は後期龍山文化の期間内に収まります。新たに生成されたデータによって調査が可能となるのは、(1)仰韶文化関連農耕民が生物学的にどの程度均一だったのか、(2)先行研究[7]で観察されたように、ヒトの移住と混合が新石器時代黄河中流域における文化的相互作用と移行に関わっていたのかどうか、(3)新石器時代黄河中流域個体群からアジア東部現代人への遺伝的寄与です。
●ゲノム規模古代DNAデータの概要
歯や錐体骨や四肢骨から抽出されたDNAを用いて、仰韶村の考古学的遺跡から発見された古代人12個体の標本で、二本鎖ライブラリが生成されました。次に、古代DNA捕獲技術が、120万SNP(Single Nucleotide Polymorphism、一塩基多型)でのヒト内在性DNAの濃縮に適用されました。H37個体(きわめて低い内在性率)を除く全標本は、5’および3’末端のヌクレオチドにおいてヒト参照ゲノムに対する脱アミノ化率が10%超となり、真正古代DNAの存在を示唆しています。高い汚染率(5%超)と低いSNP数(2万未満)の標本の除外後に、9個体が維持されました。SNP数がより少ない他の個体と親族関係にある標本は除去され、最終的に集団遺伝学的分析で親族関係にない8個体が得られました。120万SNPでのゲノム網羅率の深度の範囲は0.06~1.11倍で、少なくとも1回の読み取りで網羅されるSNP部位の数の範囲は、71392~1187416です。
●黄河中流域個体群の遺伝的特性
調査対象の黄河中流域個体群の差異のゲノム規模パターンを調べるためにまず、ヒト起源(Human Origins、略してHO)データセットのアジア東部および南東部の古代人および現代人に基づいて、主成分分析(principal component analysis、略してPCA)が実行されました。古代の個体群が、現代人で計算された最初の上位2主成分(PC)に投影されました(図1)。その結果、仰韶村の新たに報告された仰韶文化関連1個体(黄河_仰韶村_仰韶と分類表示されます)は、仰韶村の近くに位置する小呉遺跡と汪溝遺跡の仰韶文化関連個体群で表される以前に定義された遺伝的クラスタ(黄河_仰韶_刊行)の近くに位置する、と分かりました。黄河_仰韶村_仰韶には、124万パネルで限定的なSNP数(119462)の1個体しか含まれていないことに要注意です。PCAでも対でのf₄統計でも、黄河_仰韶村_仰韶と黄河_仰韶_刊行の遺伝的特性を区別できない、つまりf₄(ヨルバ人、X;黄河_仰韶_刊行、黄河_仰韶村_仰韶)で有意な値が得られなかったことを考慮して、統計的検出力を改善するため、黄河_仰韶村_仰韶と黄河_仰韶_刊行はともに「仰韶」集団としてまとめられて命名されました。以下は本論文の図1です。
現在の漢人の南北の遺伝的勾配は、この仰韶文化関連クラスタ(まとまり)から中国南部/アジア南東部の人々(Southern Chinese/Southeast Asians、略してSC/SEA)まで広がっています(図1)。以前に刊行された郝家台遺跡と平糧台遺跡と瓦店遺跡の龍山文化関連個体群(黄河_龍山_刊行と分類表示されます)はともにクラスタ化し、仰韶クラスタと比較してPC1上でわずかに古代および現在のSC/SEA関連遺伝的クラスタの方へと動いています。この結果は、連鎖不平衡(linkage disequilibrium、略してLD)剪定HOデータセットに基づく教師なしADMIXTUREによって、黄河_龍山_刊行におけるSC/SEA関連構成要素(黄色)の増加と解釈されました。主要な「黄河_仰韶村_龍山」集団は6個体を含んでおり、同時代の黄河_龍山_刊行ではなく仰韶クラスタとまとまりました。
仰韶村の別の龍山文化関連の1個体(つまり、HOデータセットで38645個のSNPのあるK1-4)と瓦店遺跡の以前に刊行された龍山文化関連の1個体(つまり、HOデータセットで467231個のSNPのあるWT5M2)はそれぞれ、対応する主要クラスタではなく、黄河_龍山_刊行および仰韶クラスタ関連集団とまとまりました。しかし、124万データセットに基づくf₄(ヨルバ人、X;K1-4、黄河_仰韶村_龍山)は、K1-4(124万パネルで71392個のSNP)と残りの黄河_仰韶村_龍山の個体の集団組成との間で有意な遺伝的違いを識別しません。腊邑(Layi)遺跡と渓頭(Xitoucun)遺跡の個体を用いての、124万データセットに基づくf₄(ヨルバ人、腊邑/渓頭;WT5M2、黄河_龍山_刊行)の有意な正の値は、PCAの結果と一致します。124万データセットに基づく対でのqpWave分析も、WT5M2と黄河_龍山_刊行が多様なユーラシア系統と比較してクレード(単系統群)を形成する、とのモデルを却下しました。したがって、WT5M2は以下の分析において、黄河_龍山_刊行の遺伝的外れ値(outlier、略してo)に割り当てられました(黄河_龍山_刊行_oと分類表示されます)。
●龍山文化関連人口集団内の遺伝的多様性
次に、黄河_仰韶村_龍山と黄河_龍山_刊行との間の遺伝的関係の解明に焦点が当てられました。黄河_仰韶村_龍山と黄河_龍山_刊行の個体群の放射性炭素年代測定は、相互に重なっており、後期龍山文化の期間内に収まります。PCAで示されているように、黄河_仰韶村_龍山と黄河_龍山_刊行との間の遺伝的異質性が定量化され、これは、124万データセットに基づく、台湾の漢本(Hanben)遺跡個体(台湾_漢本_IA)を用いたf₄(ヨルバ人、台湾_漢本_IA;黄河_仰韶村_龍山、黄河_龍山_刊行)の有意な正の値と、f₄(ヨルバ人、古代チベット/古代アジア北東部関連祖先系統;黄河_仰韶村_龍山、黄河_龍山_刊行)の有意な負の値によって説明できます。124万データセットに基づく対でのqpWave分析も、黄河_龍山_刊行が黄河_仰韶村_龍山と遺伝的にクレードを形成する、とのモデルを却下します。これらの調査結果は、後期龍山文化関連集団内の人口構造を反映しています。
124万データセットに基づくf₃形式(仰韶クラスタ、X:ヨルバ人)の外群f₃統計の上位の兆候は、仰韶クラスタと龍山文化関連人口集団との間で共有されるつよい遺伝的浮動を示唆しました。これは、黄河中流域における仰韶クラスタ関連祖先系統の遺伝的連続性を浮き彫りにしました。さらに、仰韶クラスタを可能性のある遺伝的1供給源として使用し、龍山文化関連人口集団の祖先系統組成がモデル化されました。黄河_龍山_刊行クラスタ自体は、qpAdmモデル化において、アジア東部南方の人々と関連する第二の供給源を必要としました(図2b)。外群一式に基づく対でのqpWaveモデル化は、黄河_仰韶村_龍山が仰韶クラスタと遺伝的にクレードを形成する、とのモデルを却下しました。
f₄対称性検定から、黄河_仰韶村_龍山は仰韶クラスタと比較して、古代のチベットおよびアジア北東部(Ancient Northeast Asia、略してANA)関連祖先系統と余分な類似性を共有していた、と示唆されました。古代チベット人関連系統は、先行研究[8]で説明されているように、そのゲノムが黄河とANAと約10%の標本抽出されていない深く分岐した系統に由来しました。したがって、ANA関連の人々が、黄河_仰韶村_龍山のあり得る第二の祖先系統供給源として選択されました。qpAdmモデル化から、黄河_仰韶村_龍山はANA関連祖先系統(約11~17%)と仰韶クラスタ関連祖先系統(約83~89%)としてモデル化できる、と示唆されました。さらに、黄河_仰韶村_龍山の7個体のうち2個体(つまり、K1-2とK1-6)は仰韶クラスタよりもANA関連の人々とわずかに多くのアレル(対立遺伝子)を共有しており、仰韶クラスタ+ANAクラスタの2方向として最適にモデル化でき、他の黄河_仰韶村_龍山クラスタ個体は仰韶クラスタの1方向で良好に適合する、と分かりました。「黄河_龍山_刊行_o」と分類表示された個体群は仰韶集団と区別できず、qpAdmモデル化では追加のSEA/ANA関連祖先系統は必要ありませんでした(図2b)。以下は本論文の図2です。
まとめると、2回の人口統計学的過程に起因するかもしれない、黄河中流域の後期龍山文化期間の人々の内部における以前には認識されていなかった遺伝的多様性の存在の証拠が観察されました。第一に、定住水稲農耕に依存していたSEA関連人口集団が北方へと移住し、瓦店遺跡や郝家台遺跡や平糧台遺跡の比較的遺伝的に均一な人口集団(つまり、黄河_龍山_刊行)が生じました(図2b)。これは龍山文化期における稲作農耕への依存度増加に反映されていましたが、この遺伝子流動は近隣の仰韶村遺跡には到達しませんでした(図2b)。仰韶村も稲作農耕への依存度を高めたのかどうか、直接的に検証するには、さらなる考古植物学的研究が必要でしょう。現時点では利用できない長江流域の稲作農耕民と関連する古代DNAが、混合モデルの改良に必要であることに要注意です。
第二に、ANAと関連する遺伝子流動が仰韶村の少なくとも一部の龍山文化関連個体に寄与した、と分かりました(図2b)。黄河クラスタとANAクラスタとの間のこの混合パターンは、黄河上流域の斉家(Qijia)文化関連個体群(黄河上流_LN)や黄河湾曲地域の石峁(Shimao)遺跡個体群(石峁_LN)など、後期新石器時代の黄河流域全体で観察されました(図2b)。ANAがかつては以前の観察よりさらな南方に拡大したことも、示唆されました。黄河_仰韶村_龍山は石峁_LN(山西省北部の石峁遺跡の後期新石器時代人口集団)の1方向でもモデル化でき、ANA祖先系統の出現は、中期および後期龍山文化期の中原への河套(Hetao)地域の文化的影響と一致している可能性が高いことを反映しています。さらに、瓦店遺跡の龍山文化関連1個体の祖先系統が仰韶集団に完全に由来していたことも分かりました(図2b)。一部の黄河_仰韶村_龍山クラスタの個体は、仰韶クラスタ関連系統の直接的な子孫としても最適に説明できます。しかし、これらの個体が、他の同時代の個体が受け取ったようなSEA/ANAからの遺伝子流動を受け取らなかった理由は、現時点では不明です。黄河中流域からのさらなる標本抽出が、この問題により多くの光を当てるかもしれません。
●現在の中国人における黄河中流域関連系統の遺伝的遺産
外群f₃統計は、新石器時代黄河関連祖先系統とアジア東部現代人、とくに中国の漢人およびチベット・ビルマ語派話者人口集団との間の遺伝的類似性を示唆しました。本論文では、中国の民族的および言語学的に多様な人口集団利用可能なSNP配列データが再分析され、現在の中国の人々への黄河中流域祖先系統の寄与が定量化されました。後期龍山文化関連人口集団は仰韶クラスタと他の系統との間の混合(つまり、黄河_龍山_刊行は仰韶クラスタとアジア東部南方人との間の混合で、黄河_仰韶村_龍山人口集団は仰韶クラスタとANAクラスタとの間の混合でした)か、仰韶クラスタの直接的子孫(つまり、黄河_龍山_刊行_oと黄河_仰韶村_龍山の一部の個体)でした。したがって、本論文で把握している限りでは、仰韶クラスタ関連祖先系統は、黄河中流域の最古級の利用可能なゲノムで、相対的に混合していない祖先系統かもしれません。本論文では、qpAdmを用いて、現在の中国人について、供給源の一つとして黄河中流域の仰韶集団が適用されました。
現在の中国の民族集団をqpAdmモデル化に当てはめると、新石器時代の仰韶文化関連系統が現在の中国の遺伝的景観に大きく影響を及ぼしていた、と分かりました。これらのモデルは、山東半島の狩猟採集民など他のアジア東部北方系統を外群一式に加えてさえ良好に適合し、対象集団がこれらの集団の寄与なしに適切に説明できることを示唆しています。先行研究では、中国の漢人は仰韶クラスタ関連祖先系統とアジア東部南方関連祖先系統との間の混合としてモデル化でき、地理的に構造化された遺伝的勾配を形成した、と報告されました[13]。タイ・カダイ(Tai-Kadai、略してTK)語族やミャオ・ヤオ(Hmong-Mien、略してHM)語族やオーストロネシア(Austronesian、略してAN)語族やオーストロアジア(Austro-Asiatic、略してAA)語族の話者である中国南部のほぼすべての民族言語集団は、仰韶クラスタとその対応する言語学的代理の2方向混合と一致しました(つまり、他の系統からの限定的な混合兆候の人口集団)。本論文では、TK祖語話者の代理としてリー人(Li)、HM祖語話者の代理としてモン人(Hmong)、AN祖語話者の代理としてムラブリ人(Mlabri)が選択されました。
中国北東部のツングース語族およびモンゴル語族話者人口集団は、ANAクラスタと仰韶クラスタとユーラシア西部人の混合としてモデル化できました。高地チベット人は、仰韶クラスタとANAクラスタと標本抽出されていない深く分岐された系統で構成される5100年前頃のゾングリ(Zongri)遺跡個体関連の遺伝的特性を維持しており、中国南西部の低地チベット人は、追加となる中国南部関連の遺伝子流動を受け取りました。東トルキスタン(中華人民共和国新疆ウイグル自治区)では、テュルク語族話者のウイグル人とキルギス人はANAクラスタと仰韶クラスタとユーラシア西部人の混合としてモデル化できました。河西回廊の先住民族集団は、高い割合の仰韶クラスタ関連祖先系統と限定的なユーラシア西部人関連祖先系統を有していました。これらの結果から、仰韶クラスタ関連系統は現在の中国人の最重要な生物学的起源の一つと示唆され、中華民族の遺伝的形成における黄河の重要性を浮き彫りにします。
参考文献:
Li S. et al.(2024): Ancient genomic time transect unravels the population dynamics of Neolithic middle Yellow River farmers. Science Bulletin, 69, 21, 3365-3370.
https://doi.org/10.1016/j.scib.2024.09.002
[6]Zhang M. et al.(2019): Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic. Nature, 569, 7754, 112–115.
https://doi.org/10.1038/s41586-019-1153-z
関連記事
[7]Ning C. et al.(2020): Ancient genomes from northern China suggest links between subsistence changes and human migration. Nature Communications, 11, 2700.
https://doi.org/10.1038/s41467-020-16557-2
関連記事
[8]Wang H. et al.(2023): Human genetic history on the Tibetan Plateau in the past 5100 years. Science Advances, 9, 11, eadd5582.
https://doi.org/10.1126/sciadv.add5582
関連記事
[9]Tao L. et al.(2023): Ancient genomes reveal millet farming-related demic diffusion from the Yellow River into southwest China. Current Biology, 33, 22, 4995–5002.E7.
https://doi.org/10.1016/j.cub.2023.09.055
関連記事
[10]Zhu KY. et al.(2024): The genetic diversity in the ancient human population of Upper Xiajiadian culture. Journal of Systematics and Evolution, 62, 4, 785–793.
https://doi.org/10.1111/jse.13029
関連記事
[11]Yang MA. et al.(2020): Ancient DNA indicates human population shifts and admixture in northern and southern China. Science, 369, 6501, 282–288.
https://doi.org/10.1126/science.aba0909
関連記事
[13]Wang CC. et al.(2021): Genomic insights into the formation of human populations in East Asia. Nature, 591, 7850, 413–419.
https://doi.org/10.1038/s41586-021-03336-2
関連記事
また、本論文は「中華民族」の遺伝的形成における黄河の重要性を最後に指摘していますが、現時点で中華人民共和国の支配下に置かれている多様な人類集団を「中華民族」という一つの民族的枠組みで把握することにはあまりにも無理があり、ましてや「中華民族」なる概念を前近代に拡張して人類史や歴史を把握することは論外である、と私は考えています。「中華民族」なる概念が提唱された当初は、そこに「同化」や「民族浄化」だけではない、肯定的な意味合いを読み取ることもできたのかもしれませんが、少なくとも現時点では、「中華民族」なる概念に(中華人民共和国の支配者および主流派の人々や、中華人民共和国の体制教義にひじょうに肯定的な外国の人々以外では)肯定的意味合いを見いだすことはほぼ不可能で、ひじょうに悍ましい概念になっている、と私は考えています。この記事における時代区分の略称は、後期新石器時代(Late Neolithic、略してLN)と鉄器時代(Iron Age、略してIA)です。なお、[]は本論文の参考文献の番号で、当ブログで過去に取り上げた研究のみを掲載しています。
●研究史
1921年に、スウェーデンの地質学者であるユハン・グンナール・アンデショーン(Johan Gunnar Andersson、ユハン・グンナール・アンダーソン)と中国人の同僚は、中国中央部の河南省三門峡市の仰韶遺跡の最初の発掘を実行しました。考古学者は、仰韶村(Yangshaocun)で発掘された遺物は新石器時代にさかのぼり、仰韶村に因んで考古学的には「仰韶文化」として記載する、との合意に達しました。仰韶村における仰韶文化の発見は中国における近代考古学の開始を示しており、中国には石器時代文化はない、との主張を覆しました。
過去数十年間、学際的研究は黄河中流域の新石器時代の歴史に関する知識を大きく増やしました。考古学的には、裴李崗(Peiligang)文化(9000~7000年前頃)が黄河中流域における最初の新石器時代文化で、狩猟および採集から雑穀農耕への重要な移行段階とみなされています。7000~5000年前頃の間、仰韶文化は中国における最古級の農耕共同体の一つを表しています。仰韶文化の廟底溝(Miaodigou)遺跡段階までに、乾燥農耕が主要な生計戦略となり、仰韶文化関連要素の外部への急速な拡大の契機となった、人口圧の高まりがもたらされました。5000~3000年前頃には、龍山文化が独立した共同体から王朝国家への移行の重要な段階でした。龍山文化は、先行する仰韶文化の赤みがかった土器とは区別される、高度な磨製黒陶で注目されています。言語学的研究では、シナ・チベット語族は後期新石器時代の黄河流域起源だった、と示唆されてきました[6]。
これまで、黄河中流域の人口動態の歴史に関する知識は、古代DNAゲノムの不足のため比較的限られています。稲作農耕への依存度増加と関連しているかもしれない人口動態の変化は、黄河中流域の仰韶文化および龍山文化関連個体群の利用可能な古代DNAから明らかにされました[7]。瓦店(Wadian)遺跡や平糧台(Pingliangtai)遺跡や郝家台(Haojiatai)遺跡の後期新石器時代龍山文化の人々は、その祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)の大半が小呉(Xiaowu)遺跡と汪溝(Wanggou)遺跡の中期新石器時代仰韶文化の人々に由来する、と特徴づけられましたが、アジア東部南方の人々から追加の遺伝子流動を受け取りました[7]。しかし、仰韶文化期から龍山文化期の移行における文化的変化がどの程度、黄河中流域の人口動態を伴ったのかは、まだ確定していません。最近の古代DNA研究も、チベット高原[8]や中国南西部[9]や西遼河[7、10]への黄河関連祖先系統の寄与を裏づけました。中国南部沿岸では、前期新石器時代と比較して後期新石器時代には、黄河関連祖先系統が増加しました[11]。これらの調査結果は、黄河が中華文明【当ブログでは原則として「文明」という用語を使わないことにしていますが、この記事では「civilization」の訳語として使います】に長期の顕著な影響を及ぼした、と強調しています。
考古学的重要性にも関わらず、仰韶村のヒト遺骸は遺伝学的に標本抽出されていませんでした。本論文では、仰韶村の仰韶文化と龍山文化に属するヒト遺骸から得られた最初のゲノム規模データが報告されます。本論文は、厦門大学の医療倫理委員会によって審査され、承認されました。放射性炭素年代測定によると、この研究で新たに生成された仰韶文化関連の1個体の年代は仰韶文化中期で、龍山文化関連の以前に刊行された個体と新たに報告される個体は後期龍山文化の期間内に収まります。新たに生成されたデータによって調査が可能となるのは、(1)仰韶文化関連農耕民が生物学的にどの程度均一だったのか、(2)先行研究[7]で観察されたように、ヒトの移住と混合が新石器時代黄河中流域における文化的相互作用と移行に関わっていたのかどうか、(3)新石器時代黄河中流域個体群からアジア東部現代人への遺伝的寄与です。
●ゲノム規模古代DNAデータの概要
歯や錐体骨や四肢骨から抽出されたDNAを用いて、仰韶村の考古学的遺跡から発見された古代人12個体の標本で、二本鎖ライブラリが生成されました。次に、古代DNA捕獲技術が、120万SNP(Single Nucleotide Polymorphism、一塩基多型)でのヒト内在性DNAの濃縮に適用されました。H37個体(きわめて低い内在性率)を除く全標本は、5’および3’末端のヌクレオチドにおいてヒト参照ゲノムに対する脱アミノ化率が10%超となり、真正古代DNAの存在を示唆しています。高い汚染率(5%超)と低いSNP数(2万未満)の標本の除外後に、9個体が維持されました。SNP数がより少ない他の個体と親族関係にある標本は除去され、最終的に集団遺伝学的分析で親族関係にない8個体が得られました。120万SNPでのゲノム網羅率の深度の範囲は0.06~1.11倍で、少なくとも1回の読み取りで網羅されるSNP部位の数の範囲は、71392~1187416です。
●黄河中流域個体群の遺伝的特性
調査対象の黄河中流域個体群の差異のゲノム規模パターンを調べるためにまず、ヒト起源(Human Origins、略してHO)データセットのアジア東部および南東部の古代人および現代人に基づいて、主成分分析(principal component analysis、略してPCA)が実行されました。古代の個体群が、現代人で計算された最初の上位2主成分(PC)に投影されました(図1)。その結果、仰韶村の新たに報告された仰韶文化関連1個体(黄河_仰韶村_仰韶と分類表示されます)は、仰韶村の近くに位置する小呉遺跡と汪溝遺跡の仰韶文化関連個体群で表される以前に定義された遺伝的クラスタ(黄河_仰韶_刊行)の近くに位置する、と分かりました。黄河_仰韶村_仰韶には、124万パネルで限定的なSNP数(119462)の1個体しか含まれていないことに要注意です。PCAでも対でのf₄統計でも、黄河_仰韶村_仰韶と黄河_仰韶_刊行の遺伝的特性を区別できない、つまりf₄(ヨルバ人、X;黄河_仰韶_刊行、黄河_仰韶村_仰韶)で有意な値が得られなかったことを考慮して、統計的検出力を改善するため、黄河_仰韶村_仰韶と黄河_仰韶_刊行はともに「仰韶」集団としてまとめられて命名されました。以下は本論文の図1です。
現在の漢人の南北の遺伝的勾配は、この仰韶文化関連クラスタ(まとまり)から中国南部/アジア南東部の人々(Southern Chinese/Southeast Asians、略してSC/SEA)まで広がっています(図1)。以前に刊行された郝家台遺跡と平糧台遺跡と瓦店遺跡の龍山文化関連個体群(黄河_龍山_刊行と分類表示されます)はともにクラスタ化し、仰韶クラスタと比較してPC1上でわずかに古代および現在のSC/SEA関連遺伝的クラスタの方へと動いています。この結果は、連鎖不平衡(linkage disequilibrium、略してLD)剪定HOデータセットに基づく教師なしADMIXTUREによって、黄河_龍山_刊行におけるSC/SEA関連構成要素(黄色)の増加と解釈されました。主要な「黄河_仰韶村_龍山」集団は6個体を含んでおり、同時代の黄河_龍山_刊行ではなく仰韶クラスタとまとまりました。
仰韶村の別の龍山文化関連の1個体(つまり、HOデータセットで38645個のSNPのあるK1-4)と瓦店遺跡の以前に刊行された龍山文化関連の1個体(つまり、HOデータセットで467231個のSNPのあるWT5M2)はそれぞれ、対応する主要クラスタではなく、黄河_龍山_刊行および仰韶クラスタ関連集団とまとまりました。しかし、124万データセットに基づくf₄(ヨルバ人、X;K1-4、黄河_仰韶村_龍山)は、K1-4(124万パネルで71392個のSNP)と残りの黄河_仰韶村_龍山の個体の集団組成との間で有意な遺伝的違いを識別しません。腊邑(Layi)遺跡と渓頭(Xitoucun)遺跡の個体を用いての、124万データセットに基づくf₄(ヨルバ人、腊邑/渓頭;WT5M2、黄河_龍山_刊行)の有意な正の値は、PCAの結果と一致します。124万データセットに基づく対でのqpWave分析も、WT5M2と黄河_龍山_刊行が多様なユーラシア系統と比較してクレード(単系統群)を形成する、とのモデルを却下しました。したがって、WT5M2は以下の分析において、黄河_龍山_刊行の遺伝的外れ値(outlier、略してo)に割り当てられました(黄河_龍山_刊行_oと分類表示されます)。
●龍山文化関連人口集団内の遺伝的多様性
次に、黄河_仰韶村_龍山と黄河_龍山_刊行との間の遺伝的関係の解明に焦点が当てられました。黄河_仰韶村_龍山と黄河_龍山_刊行の個体群の放射性炭素年代測定は、相互に重なっており、後期龍山文化の期間内に収まります。PCAで示されているように、黄河_仰韶村_龍山と黄河_龍山_刊行との間の遺伝的異質性が定量化され、これは、124万データセットに基づく、台湾の漢本(Hanben)遺跡個体(台湾_漢本_IA)を用いたf₄(ヨルバ人、台湾_漢本_IA;黄河_仰韶村_龍山、黄河_龍山_刊行)の有意な正の値と、f₄(ヨルバ人、古代チベット/古代アジア北東部関連祖先系統;黄河_仰韶村_龍山、黄河_龍山_刊行)の有意な負の値によって説明できます。124万データセットに基づく対でのqpWave分析も、黄河_龍山_刊行が黄河_仰韶村_龍山と遺伝的にクレードを形成する、とのモデルを却下します。これらの調査結果は、後期龍山文化関連集団内の人口構造を反映しています。
124万データセットに基づくf₃形式(仰韶クラスタ、X:ヨルバ人)の外群f₃統計の上位の兆候は、仰韶クラスタと龍山文化関連人口集団との間で共有されるつよい遺伝的浮動を示唆しました。これは、黄河中流域における仰韶クラスタ関連祖先系統の遺伝的連続性を浮き彫りにしました。さらに、仰韶クラスタを可能性のある遺伝的1供給源として使用し、龍山文化関連人口集団の祖先系統組成がモデル化されました。黄河_龍山_刊行クラスタ自体は、qpAdmモデル化において、アジア東部南方の人々と関連する第二の供給源を必要としました(図2b)。外群一式に基づく対でのqpWaveモデル化は、黄河_仰韶村_龍山が仰韶クラスタと遺伝的にクレードを形成する、とのモデルを却下しました。
f₄対称性検定から、黄河_仰韶村_龍山は仰韶クラスタと比較して、古代のチベットおよびアジア北東部(Ancient Northeast Asia、略してANA)関連祖先系統と余分な類似性を共有していた、と示唆されました。古代チベット人関連系統は、先行研究[8]で説明されているように、そのゲノムが黄河とANAと約10%の標本抽出されていない深く分岐した系統に由来しました。したがって、ANA関連の人々が、黄河_仰韶村_龍山のあり得る第二の祖先系統供給源として選択されました。qpAdmモデル化から、黄河_仰韶村_龍山はANA関連祖先系統(約11~17%)と仰韶クラスタ関連祖先系統(約83~89%)としてモデル化できる、と示唆されました。さらに、黄河_仰韶村_龍山の7個体のうち2個体(つまり、K1-2とK1-6)は仰韶クラスタよりもANA関連の人々とわずかに多くのアレル(対立遺伝子)を共有しており、仰韶クラスタ+ANAクラスタの2方向として最適にモデル化でき、他の黄河_仰韶村_龍山クラスタ個体は仰韶クラスタの1方向で良好に適合する、と分かりました。「黄河_龍山_刊行_o」と分類表示された個体群は仰韶集団と区別できず、qpAdmモデル化では追加のSEA/ANA関連祖先系統は必要ありませんでした(図2b)。以下は本論文の図2です。
まとめると、2回の人口統計学的過程に起因するかもしれない、黄河中流域の後期龍山文化期間の人々の内部における以前には認識されていなかった遺伝的多様性の存在の証拠が観察されました。第一に、定住水稲農耕に依存していたSEA関連人口集団が北方へと移住し、瓦店遺跡や郝家台遺跡や平糧台遺跡の比較的遺伝的に均一な人口集団(つまり、黄河_龍山_刊行)が生じました(図2b)。これは龍山文化期における稲作農耕への依存度増加に反映されていましたが、この遺伝子流動は近隣の仰韶村遺跡には到達しませんでした(図2b)。仰韶村も稲作農耕への依存度を高めたのかどうか、直接的に検証するには、さらなる考古植物学的研究が必要でしょう。現時点では利用できない長江流域の稲作農耕民と関連する古代DNAが、混合モデルの改良に必要であることに要注意です。
第二に、ANAと関連する遺伝子流動が仰韶村の少なくとも一部の龍山文化関連個体に寄与した、と分かりました(図2b)。黄河クラスタとANAクラスタとの間のこの混合パターンは、黄河上流域の斉家(Qijia)文化関連個体群(黄河上流_LN)や黄河湾曲地域の石峁(Shimao)遺跡個体群(石峁_LN)など、後期新石器時代の黄河流域全体で観察されました(図2b)。ANAがかつては以前の観察よりさらな南方に拡大したことも、示唆されました。黄河_仰韶村_龍山は石峁_LN(山西省北部の石峁遺跡の後期新石器時代人口集団)の1方向でもモデル化でき、ANA祖先系統の出現は、中期および後期龍山文化期の中原への河套(Hetao)地域の文化的影響と一致している可能性が高いことを反映しています。さらに、瓦店遺跡の龍山文化関連1個体の祖先系統が仰韶集団に完全に由来していたことも分かりました(図2b)。一部の黄河_仰韶村_龍山クラスタの個体は、仰韶クラスタ関連系統の直接的な子孫としても最適に説明できます。しかし、これらの個体が、他の同時代の個体が受け取ったようなSEA/ANAからの遺伝子流動を受け取らなかった理由は、現時点では不明です。黄河中流域からのさらなる標本抽出が、この問題により多くの光を当てるかもしれません。
●現在の中国人における黄河中流域関連系統の遺伝的遺産
外群f₃統計は、新石器時代黄河関連祖先系統とアジア東部現代人、とくに中国の漢人およびチベット・ビルマ語派話者人口集団との間の遺伝的類似性を示唆しました。本論文では、中国の民族的および言語学的に多様な人口集団利用可能なSNP配列データが再分析され、現在の中国の人々への黄河中流域祖先系統の寄与が定量化されました。後期龍山文化関連人口集団は仰韶クラスタと他の系統との間の混合(つまり、黄河_龍山_刊行は仰韶クラスタとアジア東部南方人との間の混合で、黄河_仰韶村_龍山人口集団は仰韶クラスタとANAクラスタとの間の混合でした)か、仰韶クラスタの直接的子孫(つまり、黄河_龍山_刊行_oと黄河_仰韶村_龍山の一部の個体)でした。したがって、本論文で把握している限りでは、仰韶クラスタ関連祖先系統は、黄河中流域の最古級の利用可能なゲノムで、相対的に混合していない祖先系統かもしれません。本論文では、qpAdmを用いて、現在の中国人について、供給源の一つとして黄河中流域の仰韶集団が適用されました。
現在の中国の民族集団をqpAdmモデル化に当てはめると、新石器時代の仰韶文化関連系統が現在の中国の遺伝的景観に大きく影響を及ぼしていた、と分かりました。これらのモデルは、山東半島の狩猟採集民など他のアジア東部北方系統を外群一式に加えてさえ良好に適合し、対象集団がこれらの集団の寄与なしに適切に説明できることを示唆しています。先行研究では、中国の漢人は仰韶クラスタ関連祖先系統とアジア東部南方関連祖先系統との間の混合としてモデル化でき、地理的に構造化された遺伝的勾配を形成した、と報告されました[13]。タイ・カダイ(Tai-Kadai、略してTK)語族やミャオ・ヤオ(Hmong-Mien、略してHM)語族やオーストロネシア(Austronesian、略してAN)語族やオーストロアジア(Austro-Asiatic、略してAA)語族の話者である中国南部のほぼすべての民族言語集団は、仰韶クラスタとその対応する言語学的代理の2方向混合と一致しました(つまり、他の系統からの限定的な混合兆候の人口集団)。本論文では、TK祖語話者の代理としてリー人(Li)、HM祖語話者の代理としてモン人(Hmong)、AN祖語話者の代理としてムラブリ人(Mlabri)が選択されました。
中国北東部のツングース語族およびモンゴル語族話者人口集団は、ANAクラスタと仰韶クラスタとユーラシア西部人の混合としてモデル化できました。高地チベット人は、仰韶クラスタとANAクラスタと標本抽出されていない深く分岐された系統で構成される5100年前頃のゾングリ(Zongri)遺跡個体関連の遺伝的特性を維持しており、中国南西部の低地チベット人は、追加となる中国南部関連の遺伝子流動を受け取りました。東トルキスタン(中華人民共和国新疆ウイグル自治区)では、テュルク語族話者のウイグル人とキルギス人はANAクラスタと仰韶クラスタとユーラシア西部人の混合としてモデル化できました。河西回廊の先住民族集団は、高い割合の仰韶クラスタ関連祖先系統と限定的なユーラシア西部人関連祖先系統を有していました。これらの結果から、仰韶クラスタ関連系統は現在の中国人の最重要な生物学的起源の一つと示唆され、中華民族の遺伝的形成における黄河の重要性を浮き彫りにします。
参考文献:
Li S. et al.(2024): Ancient genomic time transect unravels the population dynamics of Neolithic middle Yellow River farmers. Science Bulletin, 69, 21, 3365-3370.
https://doi.org/10.1016/j.scib.2024.09.002
[6]Zhang M. et al.(2019): Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic. Nature, 569, 7754, 112–115.
https://doi.org/10.1038/s41586-019-1153-z
関連記事
[7]Ning C. et al.(2020): Ancient genomes from northern China suggest links between subsistence changes and human migration. Nature Communications, 11, 2700.
https://doi.org/10.1038/s41467-020-16557-2
関連記事
[8]Wang H. et al.(2023): Human genetic history on the Tibetan Plateau in the past 5100 years. Science Advances, 9, 11, eadd5582.
https://doi.org/10.1126/sciadv.add5582
関連記事
[9]Tao L. et al.(2023): Ancient genomes reveal millet farming-related demic diffusion from the Yellow River into southwest China. Current Biology, 33, 22, 4995–5002.E7.
https://doi.org/10.1016/j.cub.2023.09.055
関連記事
[10]Zhu KY. et al.(2024): The genetic diversity in the ancient human population of Upper Xiajiadian culture. Journal of Systematics and Evolution, 62, 4, 785–793.
https://doi.org/10.1111/jse.13029
関連記事
[11]Yang MA. et al.(2020): Ancient DNA indicates human population shifts and admixture in northern and southern China. Science, 369, 6501, 282–288.
https://doi.org/10.1126/science.aba0909
関連記事
[13]Wang CC. et al.(2021): Genomic insights into the formation of human populations in East Asia. Nature, 591, 7850, 413–419.
https://doi.org/10.1038/s41586-021-03336-2
関連記事
この記事へのコメント