アフリカ人の大規模なゲノムデータ

 アフリカ人の大規模なゲノムデータを報告した研究(Bird et al., 2023)が公表されました。本論文は、カメルーンとコンゴ共和国とガーナとナイジェリアとスーダンの150以上の民族集団から得られた1333個体のゲノム規模データを報告しています。現生人類(Homo sapiens)の起源地であるアフリカは、最も現代人の遺伝的多様性が高い地域です。現代人の遺伝学的研究は、地域単位での比較では、ヨーロッパおよび北アメリカ大陸が最も進んでおり、それが現代人の遺伝的多様性の検証において基準とされる傾向にありました。現代人では最も遺伝的多様性が高いアフリカの現代人の遺伝学的研究の遅れは、現代人の遺伝的多様性をまだ充分に把握できていないことを意味しており、本論文はアフリカの広範な地域の12人口集団からそれぞれ15個体のゲノム規模データを報告した最近の論文(関連記事)とともに、現代人の遺伝的多様性の理解を深める画期的成果と言えそうです。


●要約

 先行研究は、アフリカ人のゲノムが複雑な一連の歴史的事象によりどのように形成されてきたのか、浮き彫りにしてきました。それにも関わらず、ゲノム規模データは現在の民族言語集団の少ない割合からしか得られていませんでした。カメルーンとコンゴ共和国とガーナとナイジェリアとスーダンの150以上の民族集団から得られた1333個体の新たな常染色体の遺伝的差異のデータ分析により、これらの諸国内における以前には正当に評価されていなかった精細な規模の水準の遺伝的構造、たとえばカメルーン西部の歴史的政体との相関が論証されます。人口集団間の遺伝的差異のパターンを比較することにより、カメルーン北部とスーダンの多くの集団が複数の地理的に異なる人口集団と遺伝的つながりを共有しており、それは長距離移住の結果だった可能性が高い、と推測されます。ガーナとナイジェリアでは、おそらくは気候変動と関連している環境変化の報告に該当する、2000年以上前となる混合の痕跡が推測されます。バントゥー諸語話者の人々の拡大と関連している可能性が高い、コンゴ人を含む複数のアフリカ人口集団における最近の混合兆候も推測されます。


●研究史

 ゲノム規模の遺伝子型決定と配列決定の開始以来、アフリカ人の常染色体ゲノムを分析した研究の数は、他の大陸、とくにヨーロッパのゲノムの研究に遅れをとっています。これは、アフリカ人のゲノムが非アフリカ人と比較してより多くの変異を含んでおり、高度な遺伝的構造を示す、という事実にも関わらず、です。近年では、アフリカの遺伝的多様性研究で複数の発展があり、ほぼ全ての国と全ての主要な語族から得られた常染色体データを提供する研究があります(関連記事1および関連記事2)。

 これらの研究では、遺伝的構造は大小両方の規模で地理および言語と相関するひとが多く、文化的要因も影響を及ぼした、といういくつかの証拠がある、と示されてきました。さらに、複数の期間のさまざまに考古学的文脈内でのアフリカ人の古代DNA研究は、深い人口構造の存在を明らかにしてきており、その一部はより最近の移住により覆われてきました(関連記事1および関連記事2および関連記事3および関連記事4および関連記事5)。

 アフリカ人のゲノムの以前の分析では、地理的に異なる人口集団間の混合が遺伝的多様性のパターンの形成に重要な役割を果たしている、と示されてきました。たとえば、先行研究はスーダンやエチオピアなどアフリカ北東部におけるユーラシア西部関連祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)の存在、ガンビア共和国やブルキナファソやチャドなどサハラ砂漠全体での遺伝子流動、フラニ語(Fulani)/フルベ語(Foulbe)およびナイル・サハラ語族話者など、サハラ砂漠以南の経度に沿った移住を推測してきました。

 3500年前頃に始まった、カメルーンとナイジェリアの国教地域からサハラ砂漠以南の大半を通ってのバントゥー諸語話者の人々の拡大は、アフリカ大陸の遺伝的構造を急速に再形成し(関連記事)、移民と在来の人口集団との間の広範な混合につながりました(関連記事)。ずっと局所的な規模での混合も推測されてきており、地理的近さおよび共有された文化的慣行と相関することが多くなっています。混合事象の年代測定の精度の進歩により、帝国の形成や拡大や移住など、過去の事象が現在のアフリカの人口集団の遺伝的多様性に及ぼしてきた影響についての推測が可能になりました。

 これらの進歩にも関わらず、アフリカ人の遺伝的多様性の研究は、民族集団および/もしくは地理的地域の疎らな標本抽出により制約されることが多く、他の大陸、たとえばヨーロッパ諸国で報告されてきたような、そうした精細な規模の構造を検出する能力が低下しました。アフリカ北東部と中央部と南部における精細な規模の研究では、最近のいくつかの進歩がありましたが、多くの国と地域はまだ充分には研究されていません。より小さな地域内の遺伝的構造の水準の理解は、大規模なゲノム規模関連研究(genome-wide association studies、略してGWAS)における人口集団階層化の修正に不可欠かもしれません。

 さらに、ある地域における連鎖不平衡(linkage disequilibrium、略してLD)のパターンをより深く推定することは、この推測に依存する、補完や精細なマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)や共局在や多遺伝子危険性得点の手法を改善できるかもしれません。さらに、同じ地域の集団で混合の歴史と痕跡が大きく異なることはよくあります。集団の密な標本抽出なしには、ある地域の遺伝的歴史の包括的な理解は不可能です。

 本論文は、標本の大半がアフリカの5ヶ国の1387人から得られた510615の一塩基多型(Single Nucleotide Polymorphism、略してSNP)における、新たに獲得された遺伝的変異のデータを分析します。その5ヶ国とは、カメルーンとコンゴ共和国とガーナとナイジェリアとスーダンで、他の3ヶ国(モザンビークと南アフリカ共和国とジンバブエ)から得られた54点の標本も分析されます。この新たなデータには、166の異なる自己申告の民族集団の人々が含まれ、アフリカにおける主要な4語族のうち3語族(アフロ・アジア語族とナイル・サハラ語族とニジェール・コンゴ語族、他の主要な語族はコイサン諸語)と、スーダンの南コルドファン(South Kordofan)地域のいくつかの推定される孤立言語の話者で構成されます。

 標本抽出された個体はアフリカ大陸全体の東部から西部にまたがり、ナイル渓谷とスーダン南部の山脈の個体群からコンゴの熱帯雨林の住民までを含み、アフリカ大陸のさまざまな環境を占めています(図1)。これらのデータにおける、以前に均一にデータを標本抽出された集団もしくは地域の事例は、カメルーン北部のアフロ・アジア語族のチャド語派話者(図1のC)、カメルーンのグラスフィールド(Grassfields)地域の民族集団(図1のA)、スーダンの南コルドファンの民族集団(図1のB)が含まれます。以下は本論文の図1です。
画像

 これらのデータは、この地域における人々の遺伝的歴史への洞察を可能とします。簡潔にするため、本論文は以下で簡単に述べられる問題に焦点を当てます。

(1)遺伝的構造は、他のアフリカ諸国内で観察されてきたように、カメルーンとコンゴ共和国とナイジェリアとスーダンそれぞれの内部において地理および言語および/もしくは民族集団で異なりますか?

(2)カメルーンの北西部および西部地域に広く位置するグラスフィールド地域(図1のA)には、さまざまな規模の複数の政治組織の長く複雑な歴史があります。遺伝的構造はこれらの歴史的政治組織と相関していますか?

(3)スーダンの南コルドファン地域で話されているコルドファン語派の一部(図1のBの三角)は、ナイル・サハラ語族内に位置づけられてきました。言語学者は他のコルドファン語派言語(図1のBの四角)の位置づけを議論してきており、そうした言語はニジェール・コンゴ語族話者内に位置づけられるべき、と提案する言語学者もいれば、そうした言語は孤立言語と主張する言語学者もいます。遺伝的データはこれら2つの言語分類の間を区別しますか?

(4)アフリカへのアラブ人の拡大はエジプトで7世紀に始まりましたが、他の地域にはその後まで到達しませんでした。スーダンとカメルーンにおいてアラブ人との混合の証拠を見つけて、そうした混合の年代を測定できますか?

(5)700年頃に始まったカネム・ボルヌ(Kanem-Bornu)帝国は、現在のカメルーン北部とナイジェリア北部とチャドにまたがる大規模な交易国家でした。カメルーンで標本抽出された2つの民族集団、つまりカヌリ人(Kanuri)およびコトコ人(Kotoko)において、歴史的に帝国と関連していたその年代および帝国の交易網と相関する混合の証拠はありますか?

(6)フラニ人(Fulani)はアフリカ西部沿岸からスーダンまでのサヘル地帯の大半に居住し、セネガルで話されている言語と密接に関連する言語を話す牧畜民族集団です。他の国々のフラニ人に関する先行研究は、フラニ人がモロッコ人およびアフリカ西部人と関連する人口集団の混合子孫と推測しました。カメルーンから標本抽出されたフラニ人は他の国々のフラニ人の遺伝学的研究で以前に報告されたものと類似の混合の兆候を示しますか?

(7)アフロ・アジア語族のチャド語派はチャドとカメルーン北部とナイジェリア北東部で話されていますが、アフロ・アジア語族内におけるその最も密接な言語は議論されています(図1のC)の菱形)。少数の遺伝子座を用いたチャド語派話者に関する先行研究は、ナイル・サハラ語族話者と関連する大量の最近の祖先系統を推測しました。本論文で分析されたチャド語派話者97個体の標本一式において、ナイル・サハラ語族的祖先系統の痕跡を再現できますか?チャド語派話者がどの標本抽出されたアフロ・アジア語族話者集団とより最近関連しているのか、特定できますか?

(8)バントゥー諸語は、その話者が3500年前頃に南方と東方へ拡大し始める前に、ナイジェリアとカメルーンの国境地域において発達した、と仮定されています(関連記事)。複数の波を示唆するコンゴ盆地からの最近のデータとともに、サハラ砂漠以南のアフリカ全体での拡大経路と拡大の数について、議論があります。提案された「バントゥー諸語の発祥地」からの新しい密な標本抽出を活用して、バントゥー諸語話者の人々の拡大の起源と経路と時期に関して、詳細を提供できますか?

 これらの問題に取り組むため、これらのデータは、現在の世界規模の287人口集団の個体群、および高網羅率のアフリカの古代人20個体の遺伝的変異データを含む、刊行された情報源とともに分析されました。この古代人には、カメルーン西部のカメルーン西部のシュムラカ(Shum Laka)岩陰の後期石器時代1個体(関連記事)が含まれます。新たに報告された遺伝的変異データを有する標本抽出された各個体について、自己申告の民族集団、出生地、第二言語、両親と母方祖母と父方祖父の言語についての情報が、大半の事例(80%)で同じ民族集団および出生記録された祖父母両方とともに記載されました。これは、人口構造と祖先系統についての推測への最近の移住もしくは混合の影響を軽減するよう機能し、上述の問題に取り組むさいに大きな交絡要因の可能性を改善します。特定の識別子(たとえば、地理的地域や言語集団)と関連する「祖先系統」に言及する場合、その識別子を有する標本抽出された個体群と合致する遺伝的変異のパターンを参照しており、これは便宜的に使用している略語であることに要注意です。


●遺伝的構造は地理・言語・民族集団と関連しています

 複数のさまざまな手法が用いられ、データセット内の遺伝的構造が分析されました。遺伝的多様性の主要な軸を視覚化するため、まず個体間で共有される推定上の最近の祖先のパターンについて主成分分析(principal component analysi、略してPCA)が実行されました。具体的には、5253個体それぞれについて、まずハプロタイプに基づくプログラムであるChromoPainterを用いて、各個体が世界規模の260の各人口集団から標本抽出された人々と最も最近の祖先を共有する、DNAのゲノム規模の割合が推定されました。

 次に、カメルーンとガーナとナイジェリアとコンゴ共和国とスーダンの1333個体全体でこれら推定される割合についてPCAが実行され、比較のため他のアフリカ人集団およびサウジアラビア人の選択からのデータが組み込まれました(図2)。さらに、smartPCAを用いて遺伝子型データのより一般的に用いられるPCAが実行されましたが、以前に報告されたように、プロクラステス整列をハプロタイプに基づく分析に適用すると、遺伝学と地理との間でより強い相関が観察されました。クラスタ化(まとまること)演算法であるADMIXTUREも適用され、広範な遺伝的パターンが浮き彫りになります。以下は本論文の図2です。
画像

 第一主成分(PC)はサウジアラビア人からアフリカ西部のニジェール・コンゴ語族話者までの勾配を形成します(図2)。この分析に含まれるほとんどのアフリカ西部のニジェール・コンゴ語族話者は、シエラレオネ人(左上)からコンゴ人まで、地理を反映する方法で第二主成分に沿って位置しますが(図2A)、カメルーン人とフラニ人は顕著な外れ値で、K(系統構成要素数)=8でのADMIXTUREの結果を反映しています。バカ人(Baka)とバコラ人(Bakola)とベヅァン人(Bedzan)で構成されるカメルーンの熱帯雨林狩猟採集民も、南アフリカ共和国とケニアのバントゥー諸語話者と同様に、他のカメルーン人およびコンゴ人とは離れてクラスタ化します(図2Aの左下、K=4のADMIXTUREでは桃色)。第三主成分では、ナイル・サハラ語族話者とコルドファン語派話者のスーダン人が、ナイル・サハラ語族話者であるエチオピアのヌエル人(Nuer)の近くで緊密にクラスタ化し(図2Bの右下)、ほとんどのアラブ語話者のスーダン人は第三主成分に沿ってサウジアラビア人へと転がります(図2Bの右上)。アフロ・アジア語族およびナイル・サハラ語族話者であるカメルーン北部人は、ナイル・サハラ語族話者のスーダン人とアフリカ西部人との中間に位置します。

 次に、(1)民族集団、(2)言語集団、(3)さまざまな距離により出生地が離れている個体の間の遺伝的距離が、遺伝学がこれらの要因のそれぞれとどのように相関しているのか、理解するために計算されました。固定指数(Fst)と全体的な差異の距離(total variation distance、略してTVD)であるハプロタイプに基づく測定の両方を用いて、遺伝的距離が測定され、ここでは、順列検定を用いて有意性が計算され、標本規模での距離の違いが説明されました。Fstとハプロタイプに基づく分析の両方を用いると、同じ国の民族集団は、近い隣人を含めて他国の集団とよりも相互と遺伝的に類似していることが多くなります。たとえば、ナイジェリア南東部の6集団は、近くに居住しているにも関わらず、カメルーン西部の全ての集団と遺伝的に区別できます。一部の地域、具体的にはガーナとカメルーン北西部および西部とスーダン南部の内部では、民族集団は通常、相互と有意に遺伝的に異なります。

 カメルーン内の語族間の遺伝的距離を調べると、ナイル・サハラ語族およびアフロ・アジア語族話者は通常、ニジェール・コンゴ語族話者と遺伝的区別でき、PCAと一致します(図2)。カメルーンのニジェール・コンゴ語族話者内では、バントイド語群を除くバントゥー諸語と草原バントゥー諸語と北バントイド語群(Northern Bantoid)話者は全て区別でき、大西洋北部・中部のフラニ語話者も同様です。各国では、遺伝的類似性と地理的距離との間に負の関係があります。しかし、諸国間で相関の強さに大きな差異があり、ナイジェリアではR²=0.10、カメルーン南部ではR²=0.96です。カメルーンとスーダンの個体群は距離に応じて遺伝的類似性で最大の減少を示し、同じ民族集団に属する人々とのみの比較後でさえ、その傾向は維持されました。しかし、スーダンでは、ナイル川沿いで標本抽出されたスーダン人のみを分析すると、遺伝的類似性と距離との間でより弱い相関が観察されました。これらの相関は距離による孤立か、異なる混合(後述)か、両者の組み合わせに影響を受ける可能性があります。

 次に、fineSTRUCTUREを用いて、個体をクラスタに分類し、個体間の遺伝的関連性の系統樹が推測されました(図3)。PCAの結果と一致して、ガーナの個体群は地理による明確な構造を示し、最初の分岐(つまり、fineSTRUCTUREで推測される系統樹ではより上部)は北部と南部の標本をそれぞれ区分し、その後で南北両方において東西間の分岐が続きます(図3)。ナイジェリアでは、南西部民族集団、つまりヨルバ人(Yoruba)とエサン(Esan)人はfineSTRUCTURE系統樹ではナイジェリア南東部人とよりもガーナ人の方と密接にクラスタ化します。民族集団もしくは地理と関連する明確な分岐は、この標本ではナイジェリア南東部人では推測されません。以下は本論文の図3です。
画像

 同様に、コンゴ共和国では、限定的な遺伝的構造がありますが、ヨンベ人(Yombe)は明確なクラスタを形成します。カメルーン北部人はチャドおよび中央アフリカ共和国の人口集団との1本の枝にクラスタ化し、沿岸部アフリカ西部人の枝でクラスタ化するフラニ人とは離れています。アラベ人(Arabe)やカヌリ人やコトコ人など特定のカメルーン北部の民族集団は、自身の独特なクラスタを形成しますが、他の全ての民族は2つの大きなクラスタに収まります。しかし要注意なのは、より大きな標本規模では、存在する遺伝的構造を検出する可能性がより高くなる、という点で、標本規模がfineSTRUCTUREの推測に影響を及ぼすかもしれない、ということです。


●精細な規模の遺伝的構造はカメルーンのグラスフィールド地域における民族集団と相関します

 カメルーン南部人は、言語集団により大まかではあるものの完全に定義されるわけではない3つの主要な遺伝的クラスタを形成します。それは、北バントイド語群話者、草原バントゥー諸語話者、バントイド語群を除くバントゥー諸語話者です(図3)。例外に含まれるのは、草原バントゥー諸語を話すものの北バントイド語群話者とクラスタ化するヤムバ人(Yamba)、バントイド語群を除くバントゥー諸語を話すものの北バントイド語群話者とクラスタ化するムボ人(Mbo)、北バントイド語群話者を話すもののバントイド語群を除くバントゥー諸語話者とクラスタ化するバミレケ人(Bamileke)です。とくに、北バントイド語群および草原バントゥー諸語話者内では、fineSTRUCTUREは相互に20km未満に住む民族集団を区別しました(図4D)。以下は本論文の図4です。
画像

 対照的に、バントイド語群を除くバントゥー諸語話者は民族集団と関連する遺伝的構造をほぼ示さず、TVD分析と一致します。カメルーンのシュムラカ岩陰の高網羅率の後期石器時代1個体(8000年前頃)はfineSTRUCTURE系統樹では、中央アフリカ共和国のビアカ人(Biaka)、バカ人、バコラ人、カメルーンのベヅァン人と同じ枝でクラスタ化します(図3)。これは、このシュムラカ岩陰の古代人1個体における遺伝的差異のパターンが、カメルーンのグラスフィールド地域のバントイド語群を除くバントゥー諸語話者および草原バントゥー諸語話者よりも、現在の熱帯雨林狩猟採集民の方と類似している、との以前の調査結果(関連記事)と一致します。


●スーダンの南コルドファン地域のナイル・サハラ語族話者とコルドファン語派話者は遺伝的に異なります

 スーダンの南コルドファン地域のナイル・サハラ語族話者とコルドファン語派話者は、スーダンのアラブ語話者およびエチオピアのナイル・サハラ語族話者を含む他のクラスタとの枝で、別々のクラスタを形成します(図3)。南コルドファン地域のクラスタは、自己申告の民族的帰属および言語との顕著な対応を示し(図4C)、例外はともにクラスタ化するケイガ人(Keiga)とコロンゴ人(Korongo)です。しかし、地理との相関は比較的低い、と推測されます。

 南コルドファン地域以外のスーダン人は、4つの主要なクラスタに区分されました。まず、1民族集団であるベニ・アメル人(Beni-Amer)は独自のクラスタを形成します。さまざまな異なる民族集団の個体群の別の集団は、カメルーンのフラニ人と同じ枝にクラスタ化します。残りの個体は、民族集団もしくは地理とほとんど対応を示さないものの、代わりに、異なる量の非アフリカ人と関連する推測される混合を示す、2つの主要な遺伝的クラスタに区分されます(後述)。


●同祖対立遺伝子共有と最近の共有祖先系統と混合分析

 本論文は、カメルーンとコンゴ共和国とガーナとナイジェリアとスーダンの個体群を含む、101の「クラスタ」を定義しました。これらの国では、各集団の個体群は同じ自己申告の民族を有しており、fineSTRUCTUREを用いてともにクラスタ化します。孤立の相対的程度を示唆しているかもしれない、集団における遺伝的均一性の相対的程度を調べるため、hap-ibdを用いて、各クラスタ内の個体の各組み合わせ間で共有される同祖対立遺伝子(identity-by-descent、略してIBD)断片の合計長が計算されました。平均的な推定ゲノム規模IBD共有は、クラスタにおいて3~241 cM(センチモルガン)で、フラニ人において最高値が観察されました。高い値はいくつかの他のカメルーン人およびスーダン人クラスタでも見られました。

 SOURCEFINDを用いて、101の各クラスタの個体群が226の参照人口集団と遺伝的にどのように関連しているのか、推測されました。コンゴ共和国とガーナとナイジェリアとカメルーン南部の個体群における遺伝的差異の大半がアフリカ西部集団およびバントゥー諸語話者集団と最近関連している一方で、カメルーン北部とスーダンの個体群における遺伝的差異のパターンは、アフリカ東部と西部と北部の人々の混合として最適に記載される、と推測されます。より高水準のfineSTRUCTURE系統樹と共にこれらSOURCEFINDの結果を用いて、101のクラスタを18の「超集団」に統合しました。この「超集団」はともにクラスタ化し、これら227の参照人口集団と類似の推測された関連性を示します。個体群のこれらより大きな集団は、混合事象の検出と年代測定の能力を増加させます。

 次に、別々の3手法が適用されました。それは、MALDERとfastGLOBETROTTERとMOSAICで、18の各超集団において別々に混合を推測します。この分析では、カメルーンとコンゴ共和国とガーナとスーダンの集団は、混合供給源の潜在的代理として用いられませんでした。それは、そうすることでこれらの人口集団で共有される混合の兆候が隠されるかもしれないからです。混合は全ての超集団で少なくとも1つの手法により推測され、12の超集団では2つ以上の手法で推測されました。年代推定は紀元前2650~紀元後1800年で(図5)、10の事例において3つの手法のうち少なくとも2つで信頼区間が重なります。より遺伝的に分岐している人口集団間の混合事象は、検出がより容易であることに要注意です。超集団の標本規模は大きく異なるので、混合事象の検出と年代測定の能力と、したがって信頼区間も異なるでしょう。同様に、一部の混合事象については、データセットが適切な参照代理人口集団を欠いているかもしれず、これも能力に影響を及ぼすでしょう。したがって、より大きな信頼区間もしくは手法間の不一致は慎重に扱われます。以下は本論文の図5です。
画像

 
●カメルーン北部人における混合の推測

 非コトコ人のチャド語派話者のカメルーン人(「カメルーン北部」超集団)では、fastGLOBETROTTERは、紀元後710年頃(紀元前10~紀元後840年頃)となる、(1)沿岸部アフリカ西部人、(2)アフリカ東部人、(3)バントゥー諸語話者、(4)チャドの人口集団と関連する供給源間の多方向の混合事象を推測しました。この年代はMALDERによる推測と重なりますが、より正確な信頼区間とは重なりません。対照的には、チャド語派話者のコトコ人では、ナイル・サハラ語族話者のカヌリ人と同様に、3手法全てを用いてより最近(点推定値が紀元後1000年頃以後)の多方向混合が推測されました。これら2集団の推測された混合事象は、アフリカ西部人的およびアフリカ東部人的供給源と、アフリカ北部人およびレヴァント人およびアラブ人集団と関連する第三の供給源を含んでおり、年代はカネム・ボルヌ帝国と重複します(紀元後700~紀元後1890年、図6)。さらに、MALDERはコトコ人におけるより古い混合事象を推測しました。以下は本論文の図6です。
画像

 フラニ人では、MOSAICとMALDERを用いて、モロッコのベルベル人(Berber)と関連する供給源およびガンビアとセネガルフラニ人の仮定される故地の人口集団と関連する供給源との間の、紀元後670~紀元後1190年頃の混合が推測されました。fastGLOBETROTTERは混合の類似の供給源を推測しましたが、紀元後1800年頃(紀元後1510~紀元後1850年頃)および紀元前680年頃(紀元前2090~紀元後130年頃)という複数の年代があります。さらに、fastGLOBETROTTERとMOSAICの両方は、これらカメルーンのフラニ人はスーダン人の1集団における紀元後1650~紀元後1800年頃の1回の混合事象の供給源の一つを最適に表しており、他の供給源はカメルーン北部人的と推定される、と推測しました。


●カメルーンとスーダンにおけるアラブ人的供給源からの2000年にわたる推測される混合

 カメルーンとスーダンの4超集団は、アラブ人/レヴァント人関連供給源からの混合の証拠を示します(図5Aの赤色の事象)。カメルーンのアラブ人およびナイル川沿いに暮らすスーダン人のクラスタでは、サウジアラビア人的な供給源からの混合の波が、紀元後1340~紀元後1720年頃と年代測定されました。一部のナイル川を拠点とするスーダン人では、fastGLOBETROTTERは、現在のサウジアラビア人と関連する供給源からの紀元後640年頃(紀元後160~紀元後800年頃)となるより古い混合事象を推測し、長期にわたるアラビア半島からの継続的な遺伝子流動と一致します。対照的に、ベニ・アメル人における推測されるアラブ人関連の混合は、ソマリ人(Somali)とより密接に関連するアフリカ人供給源を含み、その年代はMOSAICとfastGLOBETROTTERでは紀元後680~紀元後1130年頃、MALDERでは紀元前170~紀元後580年頃です。MOSAICとfastGLOBETROTTERを用いると、南コルドファン地域の2クラスタではアラブ人関連の混合は推測されません。MALDERはこれら両方の超集団で古い混合を推測しますが、信頼区間は大きくなっています(紀元前4590~紀元後990年頃)。


●カメルーン南部人とガーナ人とナイジェリア人とコンゴ人における混合はバントゥー諸語話者の最初の拡大と相関します

 fastGLOBETROTTERは、沿岸部アフリカ西部人およびバントゥー諸語話者と関連する供給源間の、カメルーンとナイジェリアとガーナのバントイド語群を除くバントゥー諸語話者と草原バントゥー諸語話者の歴史における類似の混合事象を推測しました。MALDERも、カメルーンの北バントイド語群話者と草原バントゥー諸語話者におけるアフリカの2人口集団間の混合を推測しており、信頼区間はこれらの事象と重複しますが、MOSAICはこれら超集団における混合を推測しませんでした(図5A)。fastGLOBETROTTERの推定点推定値年代は、より西方の超集団であるガーナ(紀元前450年頃)とナイジェリア西部(紀元前200年頃)ではより新しく、ナイジェリア東部(紀元前1420年頃)とカメルーンのグラスフィールド地域(紀元前980年頃)およびバントイド語群を除くバントゥー諸語(紀元前820年頃)ではより古いものの、95%信頼区間は全ての年代で重なります。

 コンゴ人では、fastGLOBETROTTERによる複数の混合の波の証拠は、バントゥー諸語話者と関連する供給源とは紀元前560年頃(紀元前1790~紀元前320年頃)、ビアカ人的な熱帯雨林狩猟採集民と関連する供給源とは紀元後1260年頃(紀元後950~紀元後1710年頃)と推測されました。MALDERとMOSAICは両方、より最近の事象を再現し、これらの手法は同じ供給源を含む複数の混合事象の検出ができません。


●拡大および「後期分岐」経路の複数の波と一致するバントゥー諸語話者における混合

 言語学的証拠から、バントゥー諸語話者の拡大はカメルーンとナイジェリアの国境に起源がある、と示唆されておりこの地域のゲノムは他の人口集団におけるバントゥー諸語話者と関連する祖先系統の適切な代理である可能性が高い、と提案されます。これを調べるため、現在の14人口集団と、現在のバントゥー諸語話者と関連する遺伝的変異があると以前に報告された古代人4個体(関連記事1および関連記事2)で、SOURCEFINDが実行されました。

 混合供給源の潜在的な代理として、データセットにおいて4個体以上の270の他の標本抽出された人口集団が用いられ、この中にはバントゥー諸語話者のカメルーン人の8集団と、非バントゥー諸語話者の262集団が含まれます。これら非バントゥー諸語話者は、カメルーンとナイジェリアの南バントイド語群話者を含んでおり、南バントイド語群はバントゥー諸語の起源となった語族です。現在および古代の18集団すべてで、SOURCEFINDはカメルーンの非バントゥー諸語の南バントイド語群話者のバミレケ人(具体的にはバミレケ人北部クラスタ)が、バントゥー諸語話者と関連する遺伝的差異のパターンを最適に反映している、と推測しました(図7)。以下は本論文の図7です。
画像

 前と同様に、fastGLOBETROTTERとMALDERとMOSAICの3手法を用いて、現在の13人口集団(前に分析されたコンゴ共和国は除きます)と、現在のバントゥー諸語話者と関連する遺伝的変異を有すると以前に報告された古代人4個体における、カメルーン的供給源と在来供給源との間の混合が年代測定されました。アフリカ西部人的供給源と、地理的に近い人口集団と関連する供給源との間の混合は、現在の11集団について2つ以上の手法で推測され、そのうち10集団は少なくとも2つの手法において推定された混合年代で信頼区間が重なります。

 これらの混合事象の多くで、MOSAICは以前に報告されたようにMALDERとfastGLOBETROTTERによる推測よりも最近の年代を推定します。3集団で混合の複数の波がfastGLOBETROTTERにより推測され、1つの事象は各事例で紀元前と推測されました。より最近の混合事象と年代が一つ推定された混合事象のうち、年代点推定値の範囲は紀元前170~紀元後1630年頃でした。SOURCEFINDの推測と一致して、fastGLOBETROTTERと MOSAICはバミレケ人が集団の大半においてバントゥー諸語話者関連混合供給源の最適な代表的供給源である、と報告しました。

 次に、バントゥー諸語話者の拡大の経路が調べられました。拡大期における南部および東部の枝へのバントゥー諸語話者の後期分岐の証拠について検証した以前の手法(関連記事1および関連記事2)に倣って、バントゥー諸語話者関連祖先系統の潜在的代理として、(1)カメルーン人とコンゴ人のバントゥー諸語話者のみ、(2)バントゥー諸語話者全員を用いて、fastGLOBETROTTERが実行されました。コンゴ人集団は、分析において全てのバントゥー諸語話者の対象人口集団の代理としてカメルーン人を上回り(1)、マラウイとモザンビークのバントゥー諸語話者集団は、分析では南部および東部バントゥー諸語話者集団の代理として選好されました(2)。これらの観察は、後期分岐モデルを支持する以前の結果と一致します。後期分岐モデルでは、バントゥー諸語話者はまず現在のコンゴ共和国(および恐らくはさらに南方のアンゴラへと)移動した、とされます。これに続いて、東部と南部の枝の分岐前に、東方への移動があり、マラウイとモザンビークにまで達したかもしれません。

 考古学的証拠は最近、コンゴ盆地における紀元後600年頃の人口崩壊と、その約800年後に起きた第二次拡大事象への裏づけを提供しました。この遺伝的痕跡を評価するため、GONEとIBDNeを用いて、コンゴ共和国における有効人口規模(Ne)の最近の変化が推測されました。その結果、両手法を用いての約60世代前もしくはそれ以前に始まる小さな人口拡大の証拠と、IBDNeを用いての継続的な拡大に続く最近(20世代前)の減少の証拠が見つかりました。より古い人口崩壊の兆候はありませんでした。しかし、GONEとIBDNeを、考古学的データからの有効人口規模の提案された変化を模倣するいくつかの模擬実験に適用することにより、そうした崩壊を特定する能力が評価されました。

 その結果、「拡大・ボトルネック(瓶首効果)・拡大」のシナリオは、本論文の遺伝子型配列データと現在の手法を用いると、単一の最近の拡大と区別するのはひじょうに困難なので、本論文のデータはこれらの技術を用いてこの仮説を検証するのに適していないようです、と示されます。さらに、混合が有効人口規模推定を増加させるかもしれない、と考えると、人口規模の変化からコンゴ共和国の人口集団における推定された混合を解明するのは難しい可能性が高そうです。


●考察

 本論文は、カメルーンとコンゴ共和国とガーナとナイジェリアとスーダンで大半が標本抽出された1387個体の、新たに報告されたゲノム規模常染色体の分析を提示します。これらのデータは、利用可能な人類学および考古学的記録に基づく仮説など、一連の仮説を調べるのに使用できます。以下では、上述の研究史の項目で記載された各問題との関連で、遺伝的データが活用されます。これら遺伝的痕跡の一部は歴史的事象へと関連づけられますが、歴史的な混合の正確な原因の確定は不可能であることに要注意です。これは、推定される年代の信頼区間が大きい場合、とくに当てはまります。本論文は代わりに、重複する年代と人口集団と地理的領域に基づくあり得る説明を提供します。


●遺伝学はカメルーンとコンゴ共和国とガーナとナイジェリアとスーダンという各国内の地理・自己申告の民族的帰属・言語と相関します

 アフリカ西部および中央部の人々とスーダン人の密に標本抽出されたデータセットを活用して、以前には過小評価されていたアフリカの人口集団における精細な規模の遺伝的構造が推測されました。カメルーンとガーナとスーダン内における、国単位(図2)と地理および/もしくは民族単位(図4)のクラスタ化が観察されます。遺伝学は主要な語族と相関することが多く(たとえば、カメルーンにおけるニジェール・コンゴ語族対アフロ・アジア語族、スーダンにおけるナイル・サハラ語族対アフロ・アジア語族)、時には、たとえばカメルーンのバントイド語群話者間など、より小さな言語分類と相関します。コンゴ盆地内などこれらの遺伝的違いの一部は、以前には把握が困難でした(関連記事)。本論文で推測される遺伝的構造は、ハプロタイプに基づく技術を用いると、より検出できることが多く、ハプロタイプが精細な規模の構造をどのようにより深く記載できるのか、示唆した最近の研究を裏づけます。これは、大規模なGWASの階層化を適切に調節するさいに影響を及ぼすかもしれません。

 おそらくは意外なことに、ナイジェリア南東部とカメルーン西部の民族集団は、国境が紀元後1913年以降にしか存在せず、その国家創立時に民族集団の分布がほとんど考慮されなかったにも関わらず、出身国ごとにほぼクラスタ化します。これは、本論文で標本抽出された集団が、この国境形成前に相互に分離されており、それは恐らく現在両側に存在する下位集団間のより古い構造に起因することを示唆します。この構造は、国境がたどりがちな地形的な障壁に起因しているかもしれません。しかし、標本抽出された民族集団には両国の個体が含まれていなかったので、本論文の標本収集ではよく表れておらず、国境の両側の集団は遺伝的により類似している事例がある可能性に要注意です。

 遺伝学と民族的帰属と地理との間で観察された関連とは顕著に対照的に、横断区手法を用いて、ナイル川沿いで標本抽出されたアラブ人とヌビア人の民族集団に属するスーダン人の間の遺伝的差異のパターンは、民族的帰属との一致をほぼ示さず、距離関係による微妙な分離のみを示します。対照的に、単一の場所から各スーダンの人口集団を標本抽出した先行研究は、アラブ人とヌビア人の集団が遺伝的に区別できる、と分かりました。これは、ミトコンドリアDNA(mtDNA)データを用いて以前に示唆されたように、たとえば遺伝子流動の回廊としてなど、ナイル川がスーダンの集団間の混合を促進するよう作用したことと一致します。ほぼ全てのアラブ人とベジャ人(Beja)とヌビア人の個体群は、主要な違いがアラブ人集団と最近関連すると推測された遺伝的差異のパターンの割合(48%と12%)である、2つの遺伝的クラスタに収まり、ベジャ人とヌビア人の個体群におけるそうした推測されたアラブ人関連祖先系統は平均的に少なくなっています。


●遺伝的構造はカメルーンのグラスフィールド地域における歴史的政体と相関しますか?

 図4Dは、グラスフィールド地域を含むカメルーン南部および西部における精細な規模の構造を示します。カメルーンのグラスフィールド地域(広くは北西部および西部地域)は、バムン人(Bamun)など紀元後19世紀末に大規模で統一された王国(fondomとして知られています)を有した民族集団から、アゲム人(Aghem)などわずか数村落で構成されるより小さな民族集団まで、さまざまな歴史と政体のある民族集団の故地です。グラスフィールド地域の個体群における顕著な精細な規模の構造が推測され、ほとんどの民族集団は、標本抽出された個体群が相互に20km以内に暮らしている集団でさえ、独自の遺伝的クラスタを構成しています。この構造は異なる混合ではなく集団間の孤立の結果と考えられ、それは、これらの集団はすべて非グラスフィールド地域人口集団と遺伝的に同様に関連しているからです。代理として154のアフリカ人集団が標本抽出されましたが、(未知の)祖先供給源に寄与した充分に適切な代理を有していない場合、そうした集団間の真の混合の違いの検出能力に制約がある可能性に要注意です。

 民族集団が遺伝的クラスタと一致しない、2つの重要な例外が見つかりました。まず、ンソ人(Nso’)とウィンバム人(Wimbum)は、草原バントゥー諸語の異なる枝の言語を話し、70km離れて暮らしているにも関わらず、ともにクラスタ化します。ンソ人は先植民地期に大規模で統一された王国を形成し、近隣の民族集団に影響を及ぼし、恐らくは遺伝子流動を促進しました。もう一方の民族集団であるノニ人(Noni)は、ンソ人とは20km以内で暮らしていますが、ンソ人とクラスタ化しません。ノニ人はンソ王国により支配されることもありましたが、別々の独自性を維持し、植民地期と植民地期後の両方で独立を確立しようとしており、これが2集団間の遺伝子流動を制約したかもしれません。第二の例外は、ティカール人(Tikari)と自己認識している民族集団で、この集団は2つの別々の遺伝的クラスタに収まります。とくに、ティカール語を話し、アダマワ(Adamawa)地域に暮らすと申告しているティカール人と自己認識している人々は全員、他の北バントイド語群話者の間にクラスタ化します。対照的に、ティカール語を話し、グラスフィールド地域で暮らしていると申告しているティカール人は、他のグラスフィールド地域の民族集団とクラスタ化します。

 標本抽出されたグラスフィールド地域の民族集団のうち、バムン人とバミレケ人は最低の推定集団内IBD共有を示します。バムン人の王国はグラスフィールド地域において最大と報告されており、近隣の民族集団との戦闘および交易で知られています。これらの相互作用は、バムン人における遺伝的孤立/族内婚を減少させるよう、作用したかもしれません。一般的にこれらの結果から、カメルーンのグラスフィールド地域における異なる政治的構造は類似の遺伝的痕跡と一致しない、と示唆されます。グラスフィールド地域における遺伝的差異のパターンを解釈するさいには、植民地の歴史を検討することも重要です。たとえば、バミレケ人との分類は、植民地期にドイツ人によっていくつかのより小さなフォンドム(fondom、政体)に与えられ、これは、そうした広範な植民地期の分類を課されなかった近隣の民族集団と比較して相対的に高い遺伝的多様性を説明できるかもしれません。


●スーダン南部においてコルドファン語派話者とナイル・サハラ語族話者との間で構造が検出されますか?

 ナイル川沿いに標本抽出されたスーダン人で観察された遺伝的構造の欠如とは対照的に、南コルドファンのヌバ(Nuba)山脈で標本抽出された個体群ではひじょうに精細な規模の構造が推測され、民族言語集団と相関します(図4C)。この地域は、近寄りにくい性質のため、歴史的な退避地として記載されてきました。エスノローグ(Ethnologue、キリスト教系の少数言語の研究団体が公開しているウェブサイトで、少数民族言語の概況を説明しています)は南コルドファンの言語を2つの大語族に位置づけています。それは、ニジェール・コンゴ語族(コルドファン語派)とナイル・サハラ語族ですが、分類について論争があり、いくつかの言語は孤立言語として分類されることが多くなっています。

 本論文は、コルドファン語派話者として分類される集団はナイル・サハラ語族話者として分類される集団と遺伝的に異なっている、と推測し、後者はエチオピアの標本抽出されたナイル・サハラ語族話者とより大きな遺伝的類似性を示します(図2)。これらの違いは、最近の族内婚の影響を軽減した後にも残り、異なる大語族と相関する、恐らくはコルドファン語派とナイル・サハラ語族の話者間のいくつかの古代の構造が示唆されます。この地域における遺伝学と地理との間の比較的低い相関も推測されますが、これは、アケローン人(Acheron)など主成分を歪める比較的孤立した集団の結果である可能性が高そうです。以前の報告を再現して、スーダンへのアラブ人の拡大後の南コルドファンにおけるアラブ人関連の混合の証拠は推測されず、再び退避地としての山脈の役割と一致します。


●アフリカへのアラブ人の拡大の結果としての混合を年代測定できますか?

 アラブ人的供給源と関連する、スーダン人における混合の複数の波が推測されました。他の標本抽出されたスーダンの民族集団とは対照的に、沿岸部ベジャ人民族集団であるベニ・アメル人は、エチオピアのアフロ・アジア語族話者集団と関連する遺伝的変異のより大きな推定割合(図5C)、および紀元後千年紀のサウジアラビア人およびイエメン人と関連する供給源からの混合のより古い波を示します。アクスム王国(The Kingdom of Aksum)はこの期間にエチオピア北部全域と沿岸部スーダンとイエメンに広がり、アラビア半島と交易したと知られており、推測された遺伝子流動について説明できる可能性を提供しますが、この帝国と無関係な他の相互作用もこの兆候を説明できます。この混合事象は、ベニ・アメル人においてそれ以前の期間の追加の非アフリカ人との混合とともに以前に報告されており、この以前の兆候は、より最近の兆候により隠されたため推測できないかもしれません。

 紀元後1340~紀元後1730年頃の、(1)現在のアラブ人および(2)アフリカ東部のナイル・サハラ語族話者と関連する供給源間の、おもにナイル川住民を含む他のスーダン人の2クラスタにおける混合が推測されました。この推測された混合の年代と供給源は以前の調査結果と一致しており、この期間のマクリア王国(the Kingdom of Makuria)の崩壊を反映しているかもしれず、これによりアラブ人集団はナイル川を下ってスーダンへと拡大することが可能になりました。これらのクラスタのうち1つでは、類似の供給源間の紀元後640年頃(紀元後160~紀元後800年頃)となる混合のより古い波についての以前の報告が再現され、紀元後7世紀のアラブ人の拡大に先行するか一致するスーダンへの移住の波の可能性が示唆されます。最後に、紀元後16世紀頃となるカメルーンの最北地域のアラブ人におけるアラブ人的混合が推測され、紀元後14世紀半ば以降の湖地域へのアラブ人集団の報告された移動と重なります。


●カネム・ボルヌ帝国は関連するカメルーン北部人口集団の遺伝的構成にどのような影響を及ぼしましたか?

 チャド語派話者のコトコ人とナイル・サハラ語族話者のカヌリ人の両方で、コトコ人では紀元後960~紀元後1690年頃、カヌリ人では紀元後820~紀元後1760年頃となる混合事象が推測され、これには現在の、アフリカ東部人、アフリカ西部および南部のバントゥー諸語話者、アフリカ北部人とレヴァント人とアラブ人それぞれと関連する、3つの異なる供給源が含まれます。その推定年代は、この期間にカメルーン北部に存在したカネム・ボルヌ帝国と重なります(図6)。カネム・ボルヌ帝国は紀元後700年頃以降、チャド湖の東側のカネムに拠点を置きました。紀元後14世紀後半には、カネム・ボルヌ帝国の中心地はナイジェリア北東部のボルノ(Borno)へと移り、19世紀後半までそこに留まり続けました。

 文化的および言語的にコトコ人と関連している在来のチャド語派話者人口集団が、ナイル・サハラ語族話者のカネム・ボルヌ帝国へと同化され、カヌリ人が民族集団として出現したのは、この後期のことです。これは、カネム・ボルヌ帝国の後半にコトコ人における混合年代を2つの手法が推測した理由を説明できるかもしれません(図6)。カヌリ人では、MOSAICはカネム・ボルヌ帝国の期間内の複数の混合事象を推測し、それは、前期もしくは帝国期と後期で、おそらくはより長期にわたるより継続的な混合を反映しています。カネム・ボルヌ帝国はアフリカの北部と西部と東部の間の交易関係で知られており、恐らくはこれらの地域の人々の混合を促進しました。しかし、本論文の信頼区間は長期にまたがっており、この期間におけるカメルーン北部への遺伝子流動はカネム・ボルヌ帝国と無関係な長距離の相互作用と関連しているかもしれないことに要注意です。


●カメルーン北部のフラニ人の歴史において混合を年代測定できますか?

 カメルーンの最北とアダマワ地域で標本抽出されたフラニ人において類似の混合供給源が推測され、これは他の国々のフラニ人の研究でも報告されました。その1供給源は12%ほど寄与したモロッコのベルベル人関連で、残りのDNAはガンビア人およびセネガル人と関連する供給源からの寄与でした。モロッコのベルベル人およびガンビア人と関連する供給源間の混合は、これらカメルーンのフラニ人において、MALDERとMOSAICを用いると紀元後670~紀元後1190年頃で、ガンビアとブルキナファソとニジェールとチャドで標本抽出されたフラニ人での紀元後200年頃という、一部の以前の混合年代推定よりも最近となります。fastGLOBETROTTERは混合の複数の年代を推測し、上述の供給源間のより古い事象は紀元前700年頃ですが、信頼区間がひじょうに大きくなっています。fastGLOBETROTTERが推測したひじょうに最近の混合は、以前に示されたように、より古い事象へとその年代推定値がさかのぼるかもしれません。サハラ砂漠を横断する交易および移動経路は、アフリカのり北部と西部を何千年もつなげ、推測される遺伝子流動を促進したかもしれません。フラニ人クラスタ内でのIBD共有のより大きな量も推測され、民族集団の歴史的な族内婚慣行の結果かもしれません。

 いくつかのスーダン人個体において、フラニ人的供給源とカメルーン北部的供給源との間の、紀元後1650~紀元後1800年頃となる混合が推測されました。非フラニ人供給源はスーダン人よりもカメルーン人の方と密接に関連しているので、混合はスーダンよりも西方で起きた可能性が高い、と示唆されます。推定信頼区間は、ナイジェリア北部とカメルーンのフラニ人とハウサ(Hausa)人と他のチャド語派話者人口集団との間の、歴史的に証明された、相互作用増加期間と重なっており、ウスマン・ダン・フォディオ(Usman dan Fodio)のフラニ人のジハード、および多民族のソコト人カリフの確立と拡大で最高に達ました。この混合の一部の子孫は、その後でスーダンに移住したかもしれませんが、それ以前の時点で東方に移動した集団間のスーダン内での混合など、いくつかの他の説明も可能です。


●どのアフロ・アジア語族話者人口集団がカメルーン北部のアフロ・アジア語族チャド語派話者と遺伝的に最も密接に関連していますか?

 14のカメルーン北部のアフロ・アジア語族チャド語派話者民族集団のうち11集団を含む超集団(カメルーン北部超集団、図3)では、現在の沿岸部アフリカ西部人、バントゥー諸語話者集団、エチオピアとチャドのナイル・サハラ語族話者により表される複数の供給源間の混合年代が、紀元後710年頃(紀元前10~紀元後840年頃)と推測されました。この混合は複数の祖先供給源を含んでいるので、移住事象の方向性は推測困難です。紀元前6000~紀元前2000年頃となるカメルーンへのチャド語派話者の最初の移住と関連するには最近すぎる一方で、混合の類似の年代と供給源が、ナイジェリア北部のニジェール・コンゴ語族話者であるベロム人(Berom)について報告されました(関連記事)。

 まとめると、これらの結果は紀元後千年紀におけるカメルーン北部とナイジェリア北部での少し特徴的な混合事象を示唆しており、この混合事象は東西のアフリカ人と遺伝的に関連する供給源が含まれます。この期間は外来的な副葬品の存在の顕著な増加についての考古学的証拠、したがって、この地域における外部供給源との交易と一致しています。以前の報告と一致して、チャド語派話者では、カメルーンとチャドのナイル・サハラ語族話者と最近関連する大量の遺伝的変異の証拠が見つかり、チャド語派の最も密接なアフロ・アジア語族話者の識別が困難となります。カメルーン北部内の標本抽出されたナイル・サハラ語族話者とチャド語派話者は、本論文の手法を用いると、遺伝的に区別できないようです。


●現代のアフリカの人口集団にバントゥー諸語話者の拡大はどのような影響を及ぼしましたか?

 ナイジェリアとカメルーンの国境およびその周辺の「バントゥー諸語の発祥地」の個体群の密な標本抽出を考慮して、どの標本抽出されたカメルーンとナイジェリアの集団が、アフリカ全域のバントゥー諸語話者集団と関連する祖先系統を最もよく代表しているのか、調べられました。バントゥー諸語における初期の分岐に関して愚論があり、祖型バントゥー諸語はより広範な南バントイド語群内で側系統である可能性が高いので、バントゥー諸語と非バントゥー諸語の南バントイド語群との間の区別が議論になることもあります。これと一致して、OURCEFINDとfastGLOBETROTTERとMOSAICを用いての手法では、全ての人口集団におけるバントゥー諸語話者的構成要素は、カメルーンのバントゥー諸語話者人口集団と比較しても、非バントゥー諸語の南バントイド語群話者であるバミレケ人と最も密接に関連している、と推測されました(図7)。しかしこれは、バミレケ人をより適切な祖先系統の代理とする可能性がある、少ない最近の族内婚と一致する、バミレケ人における集団内IBD共有の結果かもしれません。この地域の遺伝的構造がバントゥー諸語の拡大開始と同じ4000年前頃ではなかった可能性が高そうなので、この結果からバミレケ人は拡大の供給源だった、とは示唆されない、と本論文は強調します。

 南アフリカ共和国で発見された古代人3個体(530~310年前頃)を含めて、混合の単一の年代が推定されたバントゥー諸語話者集団では、混合事象はバントゥー諸語話者的気湯と在来の供給源を含んでいました。年代点推定値は紀元前170~紀元後1630年頃の範囲で、先行研究における推測と一致します。バントゥー諸語話者が在来の人口集団と混合した年代についての本論文の推測は、考古学および言語学的証拠において示唆された、地域への最初の到来よりも最近であることが多くなっています。これは、最初の移住および/もしくは、類似の経路に沿って、元々の混合事象を覆い隠す類似の供給源を含む、複数の「拡大の上書き(spread over spread)」の移住後の、バントゥー諸語話者の長い孤立により説明できるかもしれません。後者と一致して、コンゴ共和国のバントゥー諸語話者からの新たなデータでは、紀元前560年頃と紀元後1260年頃の複数の混合事象の証拠が見つかり、両者は現在のバントゥー諸語話者および熱帯雨林狩猟採集民と関連する供給源を含んでいます(図5A・B)。

 より古い年代は、コンゴの熱帯雨林への紀元前800年頃となるバントゥー諸語話者の拡大の最初の段階と一致しており、コンゴ民主共和国の集団における以前の混合推定(関連記事)と合致します。推測された最近の事象と類似する混合は、ガボンとアンゴラの集団でも以前に報告されており、第二の「拡大」事象を表しているかもしれません(関連記事)。「拡大の上書き」理論と一致して、南アフリカ共和国のズールー人(Zulu)やケニアおよびウガンダのバントゥー諸語話者における、バントゥー諸語話者供給源と在来の供給源との間の複数の混合年代の証拠も見つかり、より古い年代はこれらの地域へのバントゥー諸語話者の最初の移住と重なります。これら3クラスタはバントゥー諸語話者では最大の標本規模で、これらより古い年代を検出する能力が増加します。

 ガーナ人とナイジェリア人とカメルーン南部の3超集団では、fastGLOBETROTTERと、時にはMALDERが、アフリカ西部人的供給源とバントゥー諸語話者的供給源との間の混合事象を推測しており、信頼区間は大きいものの、点推定値は紀元前200年頃より早い年代を示唆します。これらの事象は全ての手法を用いては再現されませんが、重なる信頼区間のある類似の混合兆候は、ガーナ人とナイジェリアのヨルバ人で以前に報告されました。これらの結果は、バントゥー諸語話者の拡大の初期段階の頃となる、アフリカ西部の近隣集団間の混合を反映しているかもしれません。この初期の移住段階は、カメルーン中央部(4000~3500年前頃)とその後のアフリカ中央部森林帯の2500年前頃となる気候要因のサバンナ拡大への対応だった、との証拠がそろっています。さらに西方の古気候データはこの時点では限られていますが、急速な乾燥期が3200年前頃となるガーナのボスムトゥイ湖(Lake Bosumtwi)の推移の急激な低下により証明されています。したがって、気候変化が同様に、ガーナへと伸びる熱帯雨林の周辺における集団間の移住と混合の増加を引き起こしたかもしれません。トーゴやベニンやさらに西方などより多くのアフリカ西部の人口集団での将来の研究は、この兆候をさらに説明するのに役立つかもしれません。

 全体的に、本論文の結果は、考古学と言語学と歴史学のデータの文脈内での解釈から得ることができる、特別な洞察を浮き彫りにします。この事例には、カメルーンのグラスフィールド地域における遺伝的構造への歴史的な影響の可能性の理解や、アフリカへのアラブ人の拡大時期の調査が含まれます。もちろん、各集団は独自の歴史を有しており、本論文で刊行された新たなデータ情報源により、150超の民族言語集団の将来の仮説駆動型分析が可能となるよう、期待されます。

 本論文は、集団間の孤立効果と広範な混合の両方について証拠を提供してきました。この遺伝的不均質は、これらの地域の集団の現在の疎らな標本抽出が、得られる遺伝的変異および祖先情報の大半をどのように見落としているのか、補強します。アフリカ人関連祖先系統のある人々を含む将来のGWASは、これらの人口集団が薬理学的に関連するアレル(対立遺伝子)のひじょうに異なる頻度をどのように有しているかもしれないのか、ということを検討しなければならず、地理と言語と民族的帰属を考慮した密な標本抽出が必要です。


参考文献:
Bird N. et al.(2023): Dense sampling of ethnic groups within African countries reveals fine-scale genetic structure and extensive historical admixture. Science Advances, 9, 13, eabq2616.
https://doi.org/10.1126/sciadv.abq2616

この記事へのコメント