中東の人口史
中東の人口史に関する研究(Almarri et al., 2021)が公表されました。この研究はオンライン版での先行公開となります。世界的な全ゲノム配列計画は、ヒトの多様性と拡散と過去の混合事象への洞察を提供してきました(関連記事1および関連記事2)。しかし、多くの人口集団はまだ研究されておらず、そのため、遺伝的多様性と人口史の理解を制約し、健康の不平等性を悪化させるかもしれません。大規模な配列計画によりとくに研究対象とされている地域は中東です。中東はアフリカとヨーロッパとアジア南部の間に位置しており、ヒトの進化と歴史と移住を理解するうえで重要地域となります。中東ではアフリカ外の現生人類(Homo sapiens)の最初の証拠のいくつかが得られており、177000年前頃のレヴァント(関連記事)や85000年前頃のアラビア半島北西部(関連記事)で年代測定された化石が発見されています。さらに、現生人類のものとされる12万年前頃の道具と足跡も、アラビア半島で特定されました(関連記事1および関連記事2)。
現在、アラビア半島の大半は超乾燥砂漠ですが、過去には「緑のアラビア」をもたらしたいくつかの湿潤期があり、その時期にはヒトの拡散が促進され、現在の砂漠気候の始まりは6000年前頃に始まった、と考えられています。後期更新世と完新世における湿潤期から乾燥期への移行は、気候に適応した人口集団の移動をもたらした、と提案されてきました。アラビア半島内の新石器時代の移行は、地域内で独立して発展したか、あるいはレヴァントの新石器時代農耕民の南方への拡大によるものでした。こうした問題に取り組むため、アラビア半島とレヴァントとイラクの人口集団からの高網羅率の物理的に位相の揃ったデータセットが生成され、分析されました。将来の医学研究に役立つだろうあまり研究されていない地域における遺伝的多様性の目録の作成に加えて、人口構造、人口統計学および選択の歴史、現生人類および絶滅ホモ属(古代型ホモ属)との混合事象が調べられました。
●データセット
短い読み取りから長い情報を保存する手法を用いて中東の8人口集団(図1A)の137個体の全ゲノムが配列され、その平均網羅率は32倍です。この「連鎖読み取り(linked-read)」技術を用いる利点は、短い読み取りの整列を区別しない反復領域における、物理的に位相のそろったハプロタイプの再構築と、改善された整列です。調査対象の全人口集団はアフロ・アジア語族のセム語派であるアラブ語を話しますが、例外はイラクのクルド人集団で、インド・ヨーロッパ語族のイラン語群であるクルド語を話します。
品質管理の後、2310万ヶ所の一塩基多様体(SNV)が特定されました。このデータセットが、ヒトゲノム多様性計画(HGDP)で特定された多様体(関連記事)と比較されました。本論文のデータセットでは、HGDPでは見つかっていない480万ヶ所のSNVが見つかりました。予測されたように、これらの多様体のほとんどは稀で、その93%は1%未満の頻度ですが、37万ヶ所は一般的(頻度1%以上)です。興味深いことに、これらの一般的な多様体のほとんどは、以前の研究(関連記事)により定義された利用可能性被覆外となります(246000ヶ所の多様体)。これは、中東人など遺伝的にあまり知られていない人口集団の配列決定と、将来の医学研究における地域固有の多様体の包摂の重要性を示します。これは、標準的な短い読み取りを利用しにくい領域に、かなりの量の未知の変異が存在することも示します。以下は本論文の図1です。
●人口構造と混合
人口構造と過去の混合事象を明らかにすることは、人口史の理解と医学研究の設計および解釈に重要です。単一の多様体およびハプロタイプの両方に基づく手法を用いて、本論文のデータセットの構造と多様性が調べられました。本論文のデータセットを世界規模の人口集団と統合した後、fineSTRUCTUREで、地理と合致した遺伝的クラスタが識別され、自己標識された人口集団は一般的に異なるクラスタを形成する、と示されました(図1C)。レヴァントとイラク(レバノン人、シリア人、ヨルダン人、ドゥルーズ派、ベドウィンA、イラクのアラブ人)が一まとまりになったのに対して、イラクのクルド人はイラン中央部人口集団とまとまりました。アラビア半島の人口集団(エミラティA、サウジ人、イエメン人、オマーン人)はHGDPのベドウィンBとまとまりました。エミラティ人口集団(アラブ首長国連邦集団)内では、過剰なイランおよびアジア南部祖先系統(祖先系譜、ancestry)を有する下位人口集団(エミラティBおよびエミラティC)が特定されました(図1B)。また、比較的高いアフリカ祖先系統を有する下位人口集団(サウジBおよびエミラティD)も見つかりました。
次に古代の地域的および世界的人口集団の文脈で本論文の標本が分析されました。主成分分析(図1D)では、現代の中東人は古代レヴァントの狩猟採集民であるナトゥーフィアン人(Natufian)と新石器時代レヴァント人(レヴァントN)と青銅器時代ヨーロッパ人と古代イラン人との間に位置する、と示されます。アラブ人とベドウィンは古代レヴァント人の近くに位置しますが、現代のレヴァント人は青銅器時代ヨーロッパ人の方に引き寄せられています。イラクのアラブ人およびクルド人とアッシリア人は古代イラン人に比較的近いようです。
ほとんどの中東現代人は、4古代人口集団の祖先系統からの派生としてモデル化できる、と明らかになりました。それは、レヴァントN、新石器時代イラン人であるガンジュダレー(GanjDareh)N、ヨーロッパ東部狩猟採集民(EHG)、4500年前頃のアフリカ東部人であるモタ(Mota)個体です。レヴァントとアラビア半島の人口集団間での差異が観察されました。レヴァント人は過剰なEHG祖先系統を有しており(図1E)、これは以前の研究(関連記事)で示された、青銅器時代後に古代ヨーロッパ南東部およびアナトリア半島祖先系統を有する人々とともに到来した祖先系統です。本論文の結果は、この祖先系統がアラビア半島と比較してレヴァントでずっと高い、と示します。
レヴァントとアラビア半島との間の別の差異は、アラビア半島の人口集団におけるアフリカ祖先系統の過剰です。本論文のデータセットにおけるほとんどの人口集団にとってのアフリカ祖先系統の密接な供給源は、エチオピアのナイル・サハラ語族話者に加えて、ケニアのバンツー語族話者である、と明らかになりました。中東におけるアフリカ人との混合は過去2000年以内に起きたと推定され、ほとんどの人口集団は1000~500年前頃の混合の兆候を示しており、以前の研究と一致します。
4方向混合の選択は、レヴァントNおよびガンジュダレーNが古代近東人にかなりの祖先系統をもたらしたこと(関連記事)、EHG/草原地帯祖先系統が青銅器時代後に中東に浸透したこと(関連記事)、ほとんどのレヴァント人とアラブ人でアフリカ祖先系統が現在見られることといった、中東に関する以前の知識に基づきます。本論文では検証において7つの外群が用いられ、それは、45000年前頃となるシベリア西部のウスチイシム(Ust’-Ishim)近郊のイルティシ川(Irtysh River)の土手で発見された個体と、ヨーロッパロシアにあるコステンキ-ボルシェヴォ(Kostenki-Borshchevo)遺跡群の一つであるコステンキ14(Kostenki 14)遺跡で発見された38000年前頃の若い男性1個体と、ヨーロッパ西部狩猟採集民(WHG)と、コーカサス狩猟採集民(CHG)と、ナトゥーフィアン人もしくはレヴァントNと、パプア人と、ムブティ人です。
EHGとアフリカの祖先系統における違いに加えて、レヴァントと比較してアラビア半島ではナトゥーフィアン祖先系統の過剰が観察されました(図1BおよびE)。中東における祖先系統の供給源としてレヴァントNをナトゥーフィアン人と置換すると、アラブ人はモデル化に成功できますが、レヴァントの現代人はどれもそのようにモデル化できませんでした。モデル準拠クラスタ化でも、アラビア半島の人口集団はレヴァント現代人と比較してかなり低いアナトリア半島新石器時代(アナトリアN)祖先系統を有する、と示されました(図1Bの紫色の構成要素)。古代アナトリア半島祖先系統におけるこの違いは、アラビア半島への限定的なレヴァントNの拡大に由来するかもしれません。なぜならば、レヴァントNはアナトリアNとかなりの祖先系統を共有しているものの(関連記事)、レヴァントへのアナトリアN祖先系統を有する人口集団の拡大とともに青銅器時代後の事象にも由来するからです(関連記事)。
続旧石器時代/新石器時代の人々からの在来の祖先系統に加えて、古代イラン人と関連する祖先系統が見つかり、それは現在すべての中東人に遍在します(図1Bの橙色の構成要素)。以前の研究では、この祖先系統は新石器時代のレヴァントには存在しなかったものの、青銅器時代には見られ、在来の祖先系統の最大50%が古代イラン人関連祖先系統を有する人口集団に置換された、と示されました。この祖先系統がレヴァントとアラビア半島の両方に同時に浸透したのかどうか調べられ、混合年代は北方から南方への勾配にほぼ従っており、最古の混合はレヴァントで5900~3300年前頃に置き、その後アラビア半島で3500~2000年前頃に、アフリカ東部で3300~2100年前頃に混合が起きた、と明らかになりました。
これらの年代は、語彙データから推定された中東およびアフリカ東部におけるセム語派の青銅器時代起源および拡大の年代と重なります(図2)。この人口集団は、レヴァントとアラビア半島にY染色体ハプログループ(YHg)J1をもたらした可能性があります。本論文のデータセットにおけるYHg-J1の大半は5600年前頃に合着(合祖)し、青銅器時代の拡大の可能性と一致しますが、17000年前頃に分岐した稀なより早期の系統も見つかりました。そのYHgはナトゥーフィアン人で一般的なE1b1bで、本論文のデータセットでもよく見られ、ほとんどの系統は8300年前頃に合着しますが、39000年前頃に合着する稀なより深く分岐したYHgも見つかりました。以下は本論文の図2です。
次に、標本抽出された地域的な青銅器時代人口集団の一つからの祖先系統の派生として人口集団がモデル化できるのかどうか検証され、レバノンのシドン(Sidon)遺跡の中東青銅器時代人口集団(シドンBA)が一部の現代のレヴァントおよびアラビア半島の人口集団の祖先系統の供給源であり得る、と明らかになりました。本論文の系統発生モデル化では、レヴァント現代人はシドンBA関連人口集団に直接的に由来する祖先系統を有しているかもしれない、と示唆されます。しかし、アラブ人はナトゥーフィアン関連人口集団からの追加の祖先系統が必要です(図3)。以下は本論文の図3です。
●有効人口規模と分離の歴史
歴史的な有効人口規模は、母集団から標本抽出された染色体間の合着年代の分布から推測できます。しかし、単一のヒトゲノムを用いた場合、最近の期間では解像度が限定されますが、複数のゲノムを用いると、ハプロタイプ位相のエラーにより不自然な結果が作成されます。位相のないゲノムからアレル(対立遺伝子)頻度範囲を組み込むことによりこれらの範囲を拡張する手法が開発されましたが、最近では、たとえば金属器時代を通じて解像度がありません。
ゲノム規模系統生成における最近の発展と、本論文の多数の物理的位相標本を活用することで、本論文のデータセットにおける各人口集団のごく最近(1000年前頃)までの有効人口規模を推定できます(図4A)。全中東人の祖先は、7万~5万年前頃の出アフリカ事象の頃に人口規模の顕著な減少を示す、と明らかになりました。このボトルネック(瓶首効果)からの回復は、レヴァントとアラビア半島の間の差異が出現し始める20000~15000年前頃まで、同様のパターンをたどります。レヴァントとイラクの全人口集団はかなりの人口拡大を示し続けますが、アラブ人は類似の人口規模を維持しました。この差異は注目に値します。それは、この差異が最終氷期極大期(Last Glacial Maximum、略してLGM)の終了後に始まり、新石器時代に顕著になるからで、新石器時代には肥沃な三日月地帯で農耕が発達し、より大きな人口集団を支える定住社会へとつながりました。
新石器時代に続いて、6000年前頃となるアラビア半島の乾燥化の始まりとともに、アラビア半島の人口集団はボトルネックを経ましたが、レヴァント人は人口規模が増加し続けました。その後、レヴァント人の拡大は停滞期に入り、4200年前頃の乾燥化事象で人口規模は減少します。エミラティ人(アラブ首長国連邦人)の減少はとくに顕著で、有効人口規模は5000人となり、同時期のレヴァント人およびイラク人の1/20程度でした。人口回復は過去2000年で観察されます。本論文の結果は、以前の人口規模推定に影響を及ぼした可能性のある、中東で一般的な最近の近親結婚に対しても堅牢で、それは、分析において標本ごとに単一のハプロタイプを含めたからです。
次に、中東の人口集団の、中東人口集団内および世界の人口集団との人口分離の歴史が調べられました。この分析における正確な位相調整の重要性は、統計的に位相データに基づいて、現代パプア人がアフリカからの現生人類(Homo sapiens)の初期の拡大の祖先系統を有している、と提案した以前の知見(関連記事)により示されます。しかし、その以前の知見は、物理的に位相化されたゲノムデータを用いて複製されなかったので、統計的に不自然な結果が原因だった、と示唆されました(関連記事)。
逆に、最近の人口分離の歴史を調べるさいには、稀な多様体がより多くの情報をもたらすものの、統計的手法により正確に位相化されておらず、参照パネルに存在する可能性は低くなります。本論文ではまず、中東の現代人が出アフリカ現生人類の初期拡大からの祖先系統を有しているのかどうか、HGDPからの物理的に位相化された標本と本論文の人口集団との分岐年代の比較により検証されました(図4B)。分岐年代の発見的推定値として相対的な交差合着率(rCCR)を0.5とすると、レヴァント人とアラブ人とサルデーニャ島人と漢人は同じ分岐年代と、さらに12万年前頃以降のムブティ人からの同じ漸進的な分離パターンを共有している、と明らかになりました。次に、本論文のデータセットの人口集団とサルデーニャ島人が比較され、両者は2万年前頃に分岐し、レヴァント人はアラブ人よりもわずかに最近の分岐を示す、と明らかになりました。
ムブティ人との漸進的な分離パターンとは対照的に、サルデーニャ島人は中東の全人口集団とのより明確な分岐を示します。注目すべきことに、レヴァントおよびアラビア半島内の全系統と、さらに全ての中東人口集団およびサルデーニャ島人の内部の系統は、過去4万年以内で合着します。これらの結果をまとめると、現代の中東人口集団は、出アフリカ現生人類のより早期の拡大からの顕著な痕跡を有しておらず、全ての人口集団は6万~5万年前頃にアフリカから拡大した同じ人口集団の子孫だった、と示唆されます。
次に、中東内の人口集団の分離年代が比較され、最古の分離年代はアラビア半島とレヴァント/イラクとの間だった、と明らかになりました(図4C)。エミラティ人はイラクのクルド人と1万年前頃に、ヨルダン人およびシリア人およびイラクのアラブ人とはもっと新しく7000年前頃に分岐しました。同じ人口集団からのサウジ人の分岐年代はもっと最近のようで7000~5000年前頃ですが、イエメン人の分離曲線はエミラティ人とサウジ人の曲線間の中間です。アラビア半島とレヴァントの人口集団間の分岐年代は青銅器時代に先行し、本論文の系統発生モデル化と一致しますが、青銅器時代にアラビア半島への拡大が起きたならば、祖先系統の完全な置換は起きませんでした。以下は本論文の図4です。
レヴァントとイラクの内部では、全ての分岐は過去3000~4000年間に起きました。アラビア半島内では、イエメン人がエミラティ人と4000年前頃に分岐し、サウジ人はエミラティ人およびイエメン人の両方と最も分岐度の低い人口集団として現れ、過去2000年以内となる最近の分岐です。注意すべきは、この地域内の分離曲線が漸進的なように見えることで、明確な分岐よりもむしろ、分離後の継続的な遺伝子流動が示唆されます。また、この分離曲線にはこれらの人口集団の混合史が反映されていることにも要注意です。
●中東における古代の遺伝子移入と深い祖先系統
ほとんどの非アフリカ人口集団における類似のネアンデルタール人(Homo neanderthalensis)祖先系統量と、遺伝子移入されたハプロタイプの低い多様性から、現生人類はアフリカ外に拡大したさいにネアンデルタール人との単一の混合の波を経た可能性が高い、と示唆されています(関連記事)。中東の人口集団は以前に、ヨーロッパおよびアジア東部の人口集団よりもネアンデルタール人祖先系統が少ない、と示されましたが、この知見の解釈は、ネアンデルタール人祖先系統を「希釈する」最近のアフリカ人との混合により複雑になっています。
さらに、一部の分析では外群の使用が必要ですが、外群にネアンデルタール人祖先系統が含まれる場合、推定を偏らせる可能性があります(関連記事)。本論文のデータセットにおけるネアンデルタール人からの遺伝子移入を調べるため、標本の正確な位相調整を利用し、高網羅率となるクロアチアのヴィンディヤ洞窟(Vindija Cave)のネアンデルタール人のゲノム(関連記事)と、交差合着率が比較されました。全ての中東人は、他のユーラシア人と同様の時期に古代型混合の兆候を示しました(図5A)。
次に、同祖対立遺伝子(identity-by-descent、略してIBD。かつて共通祖先を有していた2個体のDNAの一部が同一であることを示し、IBD領域の長さは2個体が共通祖先を有していた期間に依存し、たとえばキョウダイよりもハトコの方が短くなります)に基づく手法であるIBDmixが用いられました。IBDmixは、標的集団とネアンデルタール人のゲノムを直接的に比較し、ネアンデルタール人起源のハプロタイプを検出します(関連記事)。
本論文の標本とHGDPデータセットでIBDmixが実行され、ネアンデルタール人起源の可能性が高そうな合計12億7000万塩基対の区域が回収されました。本論文のデータセットに固有ではあるものの、他の非中東地域ユーラシア人には存在しないネアンデルタール人のハプロタイプの量を比較すると、合計で2500万塩基対しか見つからず、中東人におけるネアンデルタール人のハプロタイプの大半が他の人口集団と共有されている、と示されます。しかし、世界では比較的稀であるものの、アラビア半島では高頻度に達する、比較的大きな遺伝子移入されたハプロタイプ(最大50万塩基対程度)が見つかりました。
次に、人口集団あたりの合計のネアンデルタール人由来の塩基対の平均数が比較され、レヴァント人を含む他のユーラシア人口集団と比較してアラビア半島ではより低い値が見つかりました。たとえば、ドゥルーズ派とサルデーニャ島人は類似の量(1個体平均5640万塩基対)のネアンデルタール人祖先系統を有しています(図5B)。対照的にアラビア半島では、エミラティAとサウジAのネアンデルタール人祖先系統は平均してそれぞれ5270万塩基対と5210万塩基対で、ドゥルーズ派やサルデーニャ島人よりも8%、漢人よりも20%少なくなっています。
エミラティAとサウジAのアフリカ祖先系統は3%未満なので、アラビア半島におけるネアンデルタール人祖先系統の希釈はアフリカ祖先系統だけでは説明できません。以前の研究では、ネアンデルタール人祖先系統の割合が低いか皆無の基底部ユーラシア人集団が、古代および現代のユーラシア人にさまざまな割合で寄与し、新石器時代イラン人とナトゥーフィアン人では50%に達する、と提案されました(関連記事)。アラブ人は中東の他地域集団と比較してナトゥーフィアン的祖先系統を過剰に有しているので、アラブ人はネアンデルタール人祖先系統を減少させるだろう基底部ユーラシア人祖先系統も過剰に有している、と明らかになりました。
さらに、ほとんどの中東現代人は最近の混合からアフリカ祖先系統を有しており、それも主要なユーラシア祖先系統を有する時期と比較して、中東現代人の深い祖先系統に寄与しています。中東現代人では、深い祖先系統の増加とネアンデルタール人祖先系統量との間で負の相関関係が見つかりました。全ての古代人口集団を検証すると、ネアンデルタール人祖先系統の希釈を説明する2つの勾配(図5C)が明らかになりました。一方はアフリカ祖先系統により、もう一方は基底部ユーラシア人祖先系統により形成されます。中東人は、両方の祖先系統を有するので、両方の勾配に影響を受けたようです。以下は本論文の図5です。
●選択
現在の超乾燥気候は、アラビア半島の人口集団における適応に選択圧を及ぼした可能性があります。これを調べるため、控えめなゲノム規模閾値でひじょうに急速に拡大した変異を有する系統のゲノム規模系図が調べられました。以前の研究では、アラビア半島におけるラクターゼ(乳糖分解酵素)活性持続(LP)と関連する、ヨーロッパの既知の多様体(rs4988235)とは異なる2つの相関する多様体(rs41380347とrs55660827)が特定されました。アラブ人の多様体rs41380347について、本論文では強い選択の証拠が明らかになりました(図6A)。同様ではあるものの、やや弱く、ヨーロッパ人ではrs4988235における強い選択が報告されています。
rs41380347はアラビア半島人口集団において最高頻度で存在し、サウジ人とエミラティ人では50%となりますが、レヴァントとイラクでは4%とずっと低頻度になります。注目すべきことに、この多様体は1000人ゲノム計画(1KG)ではユーラシアもしくはアフリカの人口集団に存在しませんが、一部のアフリカ東部集団には低頻度で見られます。この多様体は、レヴァントとイランの古代人を含む既知の古代ユーラシア人157個体でも見つからず、中東内のハプロタイプの最近の起源および選択によるその後の頻度増加と一致します。この多様体は9000年前頃から現代の間に頻度が急速に増加した、と明らかになりました(図6A)。注目すべきことに、この期間はアラビア半島における狩猟採集民から牧畜採集民への生活様式移行と重なります。
最近の頻度増加を示す追加の多様体も特定されました。多くの遺伝子には発現量的形質遺伝子座(eQTL)でもある、LMTK2遺伝子内の多様体rs11762534は、推定上の選択の証拠を示します(図6B)。LMTK2遺伝子は、アポトーシスや成長因子シグナリングを含む多様な細胞過程に関わり、マウスでは精子形成に不可欠と思われる、セリン/セロトニンキナーゼをコードします。中東以外では、この多様体はひじょうに層序化されており、ヨーロッパ人で最高頻度(1KGで45%)となりますが、アフリカ人とアジア東部人では1%未満と稀です。
この多様体の頻度は、アラビア半島人口集団では66%、ベドウィンBでは81%ですが、ドゥルーズ派とパレスチナ人ではともに55%とやや頻度か低いようです。rs35241117における強い推定上の選択の兆候も見つかりました(図6C)。この多様体は、サウジ人とイエメン人で最高の世界規模の頻度(最大で60%)を示し、糸球体濾過や利尿や高血圧やBMIなど、多くの代謝や骨格や免疫特性と関連しています。rs35241117はクウェート人サウジ人で選択下にあると最近示唆された40万塩基対外に位置しますが、それとは中程度の連鎖不平衡(LD)です。
さらに、アラビア半島とレヴァント/イラクとの間の強く違う多様体が探されました。エミラティ人とサウジ人の両方では、7番染色体の97000塩基対で分化の強い兆候が見つかりました。このハプロタイプ(rs1734235)の多様体はアラブ人ではほぼ固定しており、培養線維芽細胞におけるlincRNA AC003088.1の発現増加と関連しています。イエメンで最も極端な人口集団分枝統計はrs2814778で、rs2814778では派生的アレルがダッフィー・ヌル(Duffy null)表現型をもたらし、1KGではアフリカの人口集団においてほぼ排他的に見られます。
しかし、この多様体はイエメン人ではひじょうに一般的で(74%)、アラビア半島を北上するにつれて頻度が減少します(サウジ人では59%ですが、イラクのアラブ人では6%です)。ゲノム全体でこの領域は中東においてアフリカ祖先系統が最も濃縮されており、以前の研究と一致する、と明らかになりました。イエメン人とサウジ人におけるアフリカ祖先系統の平均量はそれぞれ9%と3%なので、この多様体の高頻度はアフリカ人との混合後の正の選択と一致しているようです。この派生的なアレルは、アラビア半島において歴史的に存在してきた三日熱マラリア原虫感染を防ぐ、と考えられてきました。
ゲノム規模の系統を用いる利点は、比較的弱い選択を検出する力があることです。そこで、とくに過去2000年間の、20の多遺伝子性特徴全体のアラビア半島人口集団における多遺伝子適応の証拠が探されました。ほとんどの特徴では、身長や肌の色やBMIなど、最近の方向選択の証拠は見つからないか、決定的ではありませんでした(図6D)。しかし、いくつかの特徴は証拠を示しており、最も強い選択兆候は、現代西洋社会の教育年数と関連する遺伝子多様体に現れ、全アラビア半島人口集団で一貫しています。これはイギリスの人口集団でも報告されていますが、その兆候は他の特徴で条件付けした後には減少すると示されており、相関する特性を介した間接的選択が示唆されます。
イギリスの人口集団の知見とは対照的に、日焼けや髪の色などの特徴に作用する推定上の選択の証拠は見つかりませんでした。アラビア半島内では、ほとんどの特徴の推定上の選択の方向性は、おそらく共有された祖先系統の結果として、人口集団全体で類似しています。しかし注意すべきは、アラビア半島全体の現在の変化している環境は、さまざまな最近の選択圧を起こす可能性がある、ということです。エミラティ人では、2型糖尿病を増加させる多様体の推定上の選択の証拠が見つかりました。エミラティ人における2型糖尿病の発症率は世界で最も高く、それは部分的に定住性生活様式への強い最近の変化に起因すると考えられているので、興味深い結果です。同じ人口集団で、低密度リポ蛋白質の水準を向上させ、アポリプロテインBの水準を減少させる推定上の選択のわずかな証拠も見つかりましたが、多重検定を調整すると、これらの証拠は示唆的になりました。以下は本論文の図6です。
●考察
本論文は、遺伝的に充分に研究されていなかった中東地域の高網羅率のゲノム配列の生成を報告しました。研究された全ての標本は、連鎖読み取り配列を用いて実験的に位相化され、大規模で正確なハプロタイプの再構築を可能とします。以前の世界規模の配列計画では分類されていなかった何百万もの多様体が見つかり、そのかなりの割合が中東では一般的です。これら一般的な多様体の大半は短い読み取りの利用可能な被覆外にあり、標準的な短い読み取りの配列に基づく研究の限界を浮き彫りにします。
多数の物理的に位相化されたハプロタイプにより、比較的古い期間(10万年以上前)からごく最近(1000年前頃)までの人口史の研究が可能になりました。アフリカからのヒトの初期拡大が、中東の現代の人口集団に遺伝的に寄与した証拠は見つかりませんでした。この知見は、全ての非アフリカ系現代人はアフリカからの単一の拡大の子孫で、その後すぐにネアンデルタール人と混合し、それは世界の他地域に移住する前だった、という支持を集めつつする合意に追加されます(関連記事)。
中東の人口集団は地域固有のネアンデルタール人由来のDNAをほとんど有しておらず、その大半が他のユーラシア人と共有されている、と明らかになりました。アラビア半島の人口集団は、レヴァントやヨーロッパやアジア東部の人口集団よりもネアンデルタール人祖先系統の割合が低く、これは、ネアンデルタール人と混合しなかった基底部ユーラシア人からの祖先系統の増加と、ネアンデルタール人の遺伝的影響をユーラシア西部現生人類から間接的にしか受けなかったアフリカ人との最近の混合に起因する、と示されます。
古代人のゲノムを用いて現代の人口集団をモデル化することにより、レヴァントとアラビア半島の人口集団間の違いが識別されました。レヴァントの人口集団はヨーロッパ/アナトリア半島関連祖先系統の割合がより高い一方で、アラビア半島人口集団はアフリカおよびナトゥーフィアン的祖先系統の割合がより高くなっています。レヴァントとアラビア半島との間の差異は、人口規模の歴史によっても示されます。両者は新石器時代前の20000~15000年前頃に分岐し、定住農耕生活様式への移行はレヴァントで人口増加を可能にしたものの、アラビア半島では並行していなかったことを示唆します。
アラビア半島では後期更新世と前期完新世の間で人口集団の不連続性が起き、アラビア半島は肥沃な三日月地帯からの新石器時代農耕民により再移住された、と示唆されています。本論文の結果は、レヴァントの農耕民によるアラビア半島人口集団の完全な置換を支持しません。さらに、本論文のモデルでは、アラビア半島の人々は、レヴァントの農耕民ではなく、ナトゥーフィアン的な在来狩猟採集民人口集団に祖先系統が由来する、と示唆されます。アラビア半島北部石器群は、その一部がレヴァントの農耕民により製作された石器群と類似しているように見えると識別されており、さらにレヴァントとアラビア半島との間の家畜動物の移動から、人口集団の移動もしくは文化的拡散のどちらかによるものだった、と提案されてきました。本論文の結果は、文化的拡散および/もしくはレヴァントからの限定的な移住を示唆します。
中東現代人のモデル化に必要な系統の追加の供給源は、古代イラン人と関連しています。本論文の混合検証では、古代イラン人祖先系統がまずレヴァントに到達し、その後でアラビア半島とアフリカ東部に到達した、と示されます。これらの事象の年代は、興味深いことにセム語派の起源および拡大と重なっており、この祖先系統を有する(おそらくはレヴァントもしくはメソポタミアのまだ標本抽出されていない)人口集団がセム語派を拡大させた、と示唆されます。乾燥化事象と関連する気候変化が人口集団のボトルネックと関連していることも明らかになり、アラビア半島では6000年前頃に砂漠気候の始まりとともに人口規模が減少しましたが、レヴァントでは、4200年前頃の乾燥化事象で人口が減少しました。この深刻な旱魃は、中東とアジア南部の王国および帝国の崩壊の原因になった、と示唆されており、本論文で特定された兆候に遺伝的に反映されている可能性があります。
多様体の進化史の再構築への祖先的組換え図の適用は、自然選択研究に強力な手法を提供します。本論文は、アラビア半島の人口集団において、選択の兆候を洗練して特定しました。過去数千年に50%にまで頻度が達し、アラビア半島外ではほぼ存在しない多様体と関連するラクターゼ活性持続の事例は、ヒトの歴史と適応の理解において、あまり研究されていない人口集団の研究が重要だと示します。
本論文の結果から、多遺伝子性選択は、過去に有益だった可能性があるものの、現在では2型糖尿病などの疾患と関連している多様体の頻度増加に役割を果たしたかもしれない、と示唆されます。本論文では、他の人口集団と比較して、アラビア半島人口集団では多遺伝子性選択の兆候がほとんど見つからず、これは理論的に選択の強度を低下させるだろう長期の小さな有効人口規模の結果かもしれません。長期の小さな有効人口規模は、とくに最近の近親結婚の習慣(関連記事)と相まって、メンデル型や複雑な特徴の研究に利用できます。なぜならば、個体群はホモ接合型の機能喪失変異を有し、自然な「ヒトノックアウト」として機能するからです。本論文と中東地域における最近の国立バイオバンク設立は、健康格差是正への第一歩であり、将来、中東における複雑で疾患性の特徴を調べるための、刺激的な機会を提供します。以下は本論文の要約図です。
本論文は最後に限界も指摘しています。アラビア半島人口集団の形成を洗練し、レヴァントとアラビア半島との間の先史時代のつながりをさらに明らかにするには、アラビア半島からの将来の古代DNA研究が必要です。中東の人口集団はゲノム規模関連解析では最も注目されていない集団の一つなので、選択兆候の理解や多遺伝子性特徴の分析には限界があります。中東集団に関する将来のゲノム規模関連解析は、これらの人口集団における多遺伝子性選択の影響を理解するのに必要です。
参考文献:
Almarri MA. et al.(2021): The genomic history of the Middle East. Cell, 184, 18, 4612–4625.E14.
https://doi.org/10.1016/j.cell.2021.07.013
現在、アラビア半島の大半は超乾燥砂漠ですが、過去には「緑のアラビア」をもたらしたいくつかの湿潤期があり、その時期にはヒトの拡散が促進され、現在の砂漠気候の始まりは6000年前頃に始まった、と考えられています。後期更新世と完新世における湿潤期から乾燥期への移行は、気候に適応した人口集団の移動をもたらした、と提案されてきました。アラビア半島内の新石器時代の移行は、地域内で独立して発展したか、あるいはレヴァントの新石器時代農耕民の南方への拡大によるものでした。こうした問題に取り組むため、アラビア半島とレヴァントとイラクの人口集団からの高網羅率の物理的に位相の揃ったデータセットが生成され、分析されました。将来の医学研究に役立つだろうあまり研究されていない地域における遺伝的多様性の目録の作成に加えて、人口構造、人口統計学および選択の歴史、現生人類および絶滅ホモ属(古代型ホモ属)との混合事象が調べられました。
●データセット
短い読み取りから長い情報を保存する手法を用いて中東の8人口集団(図1A)の137個体の全ゲノムが配列され、その平均網羅率は32倍です。この「連鎖読み取り(linked-read)」技術を用いる利点は、短い読み取りの整列を区別しない反復領域における、物理的に位相のそろったハプロタイプの再構築と、改善された整列です。調査対象の全人口集団はアフロ・アジア語族のセム語派であるアラブ語を話しますが、例外はイラクのクルド人集団で、インド・ヨーロッパ語族のイラン語群であるクルド語を話します。
品質管理の後、2310万ヶ所の一塩基多様体(SNV)が特定されました。このデータセットが、ヒトゲノム多様性計画(HGDP)で特定された多様体(関連記事)と比較されました。本論文のデータセットでは、HGDPでは見つかっていない480万ヶ所のSNVが見つかりました。予測されたように、これらの多様体のほとんどは稀で、その93%は1%未満の頻度ですが、37万ヶ所は一般的(頻度1%以上)です。興味深いことに、これらの一般的な多様体のほとんどは、以前の研究(関連記事)により定義された利用可能性被覆外となります(246000ヶ所の多様体)。これは、中東人など遺伝的にあまり知られていない人口集団の配列決定と、将来の医学研究における地域固有の多様体の包摂の重要性を示します。これは、標準的な短い読み取りを利用しにくい領域に、かなりの量の未知の変異が存在することも示します。以下は本論文の図1です。
●人口構造と混合
人口構造と過去の混合事象を明らかにすることは、人口史の理解と医学研究の設計および解釈に重要です。単一の多様体およびハプロタイプの両方に基づく手法を用いて、本論文のデータセットの構造と多様性が調べられました。本論文のデータセットを世界規模の人口集団と統合した後、fineSTRUCTUREで、地理と合致した遺伝的クラスタが識別され、自己標識された人口集団は一般的に異なるクラスタを形成する、と示されました(図1C)。レヴァントとイラク(レバノン人、シリア人、ヨルダン人、ドゥルーズ派、ベドウィンA、イラクのアラブ人)が一まとまりになったのに対して、イラクのクルド人はイラン中央部人口集団とまとまりました。アラビア半島の人口集団(エミラティA、サウジ人、イエメン人、オマーン人)はHGDPのベドウィンBとまとまりました。エミラティ人口集団(アラブ首長国連邦集団)内では、過剰なイランおよびアジア南部祖先系統(祖先系譜、ancestry)を有する下位人口集団(エミラティBおよびエミラティC)が特定されました(図1B)。また、比較的高いアフリカ祖先系統を有する下位人口集団(サウジBおよびエミラティD)も見つかりました。
次に古代の地域的および世界的人口集団の文脈で本論文の標本が分析されました。主成分分析(図1D)では、現代の中東人は古代レヴァントの狩猟採集民であるナトゥーフィアン人(Natufian)と新石器時代レヴァント人(レヴァントN)と青銅器時代ヨーロッパ人と古代イラン人との間に位置する、と示されます。アラブ人とベドウィンは古代レヴァント人の近くに位置しますが、現代のレヴァント人は青銅器時代ヨーロッパ人の方に引き寄せられています。イラクのアラブ人およびクルド人とアッシリア人は古代イラン人に比較的近いようです。
ほとんどの中東現代人は、4古代人口集団の祖先系統からの派生としてモデル化できる、と明らかになりました。それは、レヴァントN、新石器時代イラン人であるガンジュダレー(GanjDareh)N、ヨーロッパ東部狩猟採集民(EHG)、4500年前頃のアフリカ東部人であるモタ(Mota)個体です。レヴァントとアラビア半島の人口集団間での差異が観察されました。レヴァント人は過剰なEHG祖先系統を有しており(図1E)、これは以前の研究(関連記事)で示された、青銅器時代後に古代ヨーロッパ南東部およびアナトリア半島祖先系統を有する人々とともに到来した祖先系統です。本論文の結果は、この祖先系統がアラビア半島と比較してレヴァントでずっと高い、と示します。
レヴァントとアラビア半島との間の別の差異は、アラビア半島の人口集団におけるアフリカ祖先系統の過剰です。本論文のデータセットにおけるほとんどの人口集団にとってのアフリカ祖先系統の密接な供給源は、エチオピアのナイル・サハラ語族話者に加えて、ケニアのバンツー語族話者である、と明らかになりました。中東におけるアフリカ人との混合は過去2000年以内に起きたと推定され、ほとんどの人口集団は1000~500年前頃の混合の兆候を示しており、以前の研究と一致します。
4方向混合の選択は、レヴァントNおよびガンジュダレーNが古代近東人にかなりの祖先系統をもたらしたこと(関連記事)、EHG/草原地帯祖先系統が青銅器時代後に中東に浸透したこと(関連記事)、ほとんどのレヴァント人とアラブ人でアフリカ祖先系統が現在見られることといった、中東に関する以前の知識に基づきます。本論文では検証において7つの外群が用いられ、それは、45000年前頃となるシベリア西部のウスチイシム(Ust’-Ishim)近郊のイルティシ川(Irtysh River)の土手で発見された個体と、ヨーロッパロシアにあるコステンキ-ボルシェヴォ(Kostenki-Borshchevo)遺跡群の一つであるコステンキ14(Kostenki 14)遺跡で発見された38000年前頃の若い男性1個体と、ヨーロッパ西部狩猟採集民(WHG)と、コーカサス狩猟採集民(CHG)と、ナトゥーフィアン人もしくはレヴァントNと、パプア人と、ムブティ人です。
EHGとアフリカの祖先系統における違いに加えて、レヴァントと比較してアラビア半島ではナトゥーフィアン祖先系統の過剰が観察されました(図1BおよびE)。中東における祖先系統の供給源としてレヴァントNをナトゥーフィアン人と置換すると、アラブ人はモデル化に成功できますが、レヴァントの現代人はどれもそのようにモデル化できませんでした。モデル準拠クラスタ化でも、アラビア半島の人口集団はレヴァント現代人と比較してかなり低いアナトリア半島新石器時代(アナトリアN)祖先系統を有する、と示されました(図1Bの紫色の構成要素)。古代アナトリア半島祖先系統におけるこの違いは、アラビア半島への限定的なレヴァントNの拡大に由来するかもしれません。なぜならば、レヴァントNはアナトリアNとかなりの祖先系統を共有しているものの(関連記事)、レヴァントへのアナトリアN祖先系統を有する人口集団の拡大とともに青銅器時代後の事象にも由来するからです(関連記事)。
続旧石器時代/新石器時代の人々からの在来の祖先系統に加えて、古代イラン人と関連する祖先系統が見つかり、それは現在すべての中東人に遍在します(図1Bの橙色の構成要素)。以前の研究では、この祖先系統は新石器時代のレヴァントには存在しなかったものの、青銅器時代には見られ、在来の祖先系統の最大50%が古代イラン人関連祖先系統を有する人口集団に置換された、と示されました。この祖先系統がレヴァントとアラビア半島の両方に同時に浸透したのかどうか調べられ、混合年代は北方から南方への勾配にほぼ従っており、最古の混合はレヴァントで5900~3300年前頃に置き、その後アラビア半島で3500~2000年前頃に、アフリカ東部で3300~2100年前頃に混合が起きた、と明らかになりました。
これらの年代は、語彙データから推定された中東およびアフリカ東部におけるセム語派の青銅器時代起源および拡大の年代と重なります(図2)。この人口集団は、レヴァントとアラビア半島にY染色体ハプログループ(YHg)J1をもたらした可能性があります。本論文のデータセットにおけるYHg-J1の大半は5600年前頃に合着(合祖)し、青銅器時代の拡大の可能性と一致しますが、17000年前頃に分岐した稀なより早期の系統も見つかりました。そのYHgはナトゥーフィアン人で一般的なE1b1bで、本論文のデータセットでもよく見られ、ほとんどの系統は8300年前頃に合着しますが、39000年前頃に合着する稀なより深く分岐したYHgも見つかりました。以下は本論文の図2です。
次に、標本抽出された地域的な青銅器時代人口集団の一つからの祖先系統の派生として人口集団がモデル化できるのかどうか検証され、レバノンのシドン(Sidon)遺跡の中東青銅器時代人口集団(シドンBA)が一部の現代のレヴァントおよびアラビア半島の人口集団の祖先系統の供給源であり得る、と明らかになりました。本論文の系統発生モデル化では、レヴァント現代人はシドンBA関連人口集団に直接的に由来する祖先系統を有しているかもしれない、と示唆されます。しかし、アラブ人はナトゥーフィアン関連人口集団からの追加の祖先系統が必要です(図3)。以下は本論文の図3です。
●有効人口規模と分離の歴史
歴史的な有効人口規模は、母集団から標本抽出された染色体間の合着年代の分布から推測できます。しかし、単一のヒトゲノムを用いた場合、最近の期間では解像度が限定されますが、複数のゲノムを用いると、ハプロタイプ位相のエラーにより不自然な結果が作成されます。位相のないゲノムからアレル(対立遺伝子)頻度範囲を組み込むことによりこれらの範囲を拡張する手法が開発されましたが、最近では、たとえば金属器時代を通じて解像度がありません。
ゲノム規模系統生成における最近の発展と、本論文の多数の物理的位相標本を活用することで、本論文のデータセットにおける各人口集団のごく最近(1000年前頃)までの有効人口規模を推定できます(図4A)。全中東人の祖先は、7万~5万年前頃の出アフリカ事象の頃に人口規模の顕著な減少を示す、と明らかになりました。このボトルネック(瓶首効果)からの回復は、レヴァントとアラビア半島の間の差異が出現し始める20000~15000年前頃まで、同様のパターンをたどります。レヴァントとイラクの全人口集団はかなりの人口拡大を示し続けますが、アラブ人は類似の人口規模を維持しました。この差異は注目に値します。それは、この差異が最終氷期極大期(Last Glacial Maximum、略してLGM)の終了後に始まり、新石器時代に顕著になるからで、新石器時代には肥沃な三日月地帯で農耕が発達し、より大きな人口集団を支える定住社会へとつながりました。
新石器時代に続いて、6000年前頃となるアラビア半島の乾燥化の始まりとともに、アラビア半島の人口集団はボトルネックを経ましたが、レヴァント人は人口規模が増加し続けました。その後、レヴァント人の拡大は停滞期に入り、4200年前頃の乾燥化事象で人口規模は減少します。エミラティ人(アラブ首長国連邦人)の減少はとくに顕著で、有効人口規模は5000人となり、同時期のレヴァント人およびイラク人の1/20程度でした。人口回復は過去2000年で観察されます。本論文の結果は、以前の人口規模推定に影響を及ぼした可能性のある、中東で一般的な最近の近親結婚に対しても堅牢で、それは、分析において標本ごとに単一のハプロタイプを含めたからです。
次に、中東の人口集団の、中東人口集団内および世界の人口集団との人口分離の歴史が調べられました。この分析における正確な位相調整の重要性は、統計的に位相データに基づいて、現代パプア人がアフリカからの現生人類(Homo sapiens)の初期の拡大の祖先系統を有している、と提案した以前の知見(関連記事)により示されます。しかし、その以前の知見は、物理的に位相化されたゲノムデータを用いて複製されなかったので、統計的に不自然な結果が原因だった、と示唆されました(関連記事)。
逆に、最近の人口分離の歴史を調べるさいには、稀な多様体がより多くの情報をもたらすものの、統計的手法により正確に位相化されておらず、参照パネルに存在する可能性は低くなります。本論文ではまず、中東の現代人が出アフリカ現生人類の初期拡大からの祖先系統を有しているのかどうか、HGDPからの物理的に位相化された標本と本論文の人口集団との分岐年代の比較により検証されました(図4B)。分岐年代の発見的推定値として相対的な交差合着率(rCCR)を0.5とすると、レヴァント人とアラブ人とサルデーニャ島人と漢人は同じ分岐年代と、さらに12万年前頃以降のムブティ人からの同じ漸進的な分離パターンを共有している、と明らかになりました。次に、本論文のデータセットの人口集団とサルデーニャ島人が比較され、両者は2万年前頃に分岐し、レヴァント人はアラブ人よりもわずかに最近の分岐を示す、と明らかになりました。
ムブティ人との漸進的な分離パターンとは対照的に、サルデーニャ島人は中東の全人口集団とのより明確な分岐を示します。注目すべきことに、レヴァントおよびアラビア半島内の全系統と、さらに全ての中東人口集団およびサルデーニャ島人の内部の系統は、過去4万年以内で合着します。これらの結果をまとめると、現代の中東人口集団は、出アフリカ現生人類のより早期の拡大からの顕著な痕跡を有しておらず、全ての人口集団は6万~5万年前頃にアフリカから拡大した同じ人口集団の子孫だった、と示唆されます。
次に、中東内の人口集団の分離年代が比較され、最古の分離年代はアラビア半島とレヴァント/イラクとの間だった、と明らかになりました(図4C)。エミラティ人はイラクのクルド人と1万年前頃に、ヨルダン人およびシリア人およびイラクのアラブ人とはもっと新しく7000年前頃に分岐しました。同じ人口集団からのサウジ人の分岐年代はもっと最近のようで7000~5000年前頃ですが、イエメン人の分離曲線はエミラティ人とサウジ人の曲線間の中間です。アラビア半島とレヴァントの人口集団間の分岐年代は青銅器時代に先行し、本論文の系統発生モデル化と一致しますが、青銅器時代にアラビア半島への拡大が起きたならば、祖先系統の完全な置換は起きませんでした。以下は本論文の図4です。
レヴァントとイラクの内部では、全ての分岐は過去3000~4000年間に起きました。アラビア半島内では、イエメン人がエミラティ人と4000年前頃に分岐し、サウジ人はエミラティ人およびイエメン人の両方と最も分岐度の低い人口集団として現れ、過去2000年以内となる最近の分岐です。注意すべきは、この地域内の分離曲線が漸進的なように見えることで、明確な分岐よりもむしろ、分離後の継続的な遺伝子流動が示唆されます。また、この分離曲線にはこれらの人口集団の混合史が反映されていることにも要注意です。
●中東における古代の遺伝子移入と深い祖先系統
ほとんどの非アフリカ人口集団における類似のネアンデルタール人(Homo neanderthalensis)祖先系統量と、遺伝子移入されたハプロタイプの低い多様性から、現生人類はアフリカ外に拡大したさいにネアンデルタール人との単一の混合の波を経た可能性が高い、と示唆されています(関連記事)。中東の人口集団は以前に、ヨーロッパおよびアジア東部の人口集団よりもネアンデルタール人祖先系統が少ない、と示されましたが、この知見の解釈は、ネアンデルタール人祖先系統を「希釈する」最近のアフリカ人との混合により複雑になっています。
さらに、一部の分析では外群の使用が必要ですが、外群にネアンデルタール人祖先系統が含まれる場合、推定を偏らせる可能性があります(関連記事)。本論文のデータセットにおけるネアンデルタール人からの遺伝子移入を調べるため、標本の正確な位相調整を利用し、高網羅率となるクロアチアのヴィンディヤ洞窟(Vindija Cave)のネアンデルタール人のゲノム(関連記事)と、交差合着率が比較されました。全ての中東人は、他のユーラシア人と同様の時期に古代型混合の兆候を示しました(図5A)。
次に、同祖対立遺伝子(identity-by-descent、略してIBD。かつて共通祖先を有していた2個体のDNAの一部が同一であることを示し、IBD領域の長さは2個体が共通祖先を有していた期間に依存し、たとえばキョウダイよりもハトコの方が短くなります)に基づく手法であるIBDmixが用いられました。IBDmixは、標的集団とネアンデルタール人のゲノムを直接的に比較し、ネアンデルタール人起源のハプロタイプを検出します(関連記事)。
本論文の標本とHGDPデータセットでIBDmixが実行され、ネアンデルタール人起源の可能性が高そうな合計12億7000万塩基対の区域が回収されました。本論文のデータセットに固有ではあるものの、他の非中東地域ユーラシア人には存在しないネアンデルタール人のハプロタイプの量を比較すると、合計で2500万塩基対しか見つからず、中東人におけるネアンデルタール人のハプロタイプの大半が他の人口集団と共有されている、と示されます。しかし、世界では比較的稀であるものの、アラビア半島では高頻度に達する、比較的大きな遺伝子移入されたハプロタイプ(最大50万塩基対程度)が見つかりました。
次に、人口集団あたりの合計のネアンデルタール人由来の塩基対の平均数が比較され、レヴァント人を含む他のユーラシア人口集団と比較してアラビア半島ではより低い値が見つかりました。たとえば、ドゥルーズ派とサルデーニャ島人は類似の量(1個体平均5640万塩基対)のネアンデルタール人祖先系統を有しています(図5B)。対照的にアラビア半島では、エミラティAとサウジAのネアンデルタール人祖先系統は平均してそれぞれ5270万塩基対と5210万塩基対で、ドゥルーズ派やサルデーニャ島人よりも8%、漢人よりも20%少なくなっています。
エミラティAとサウジAのアフリカ祖先系統は3%未満なので、アラビア半島におけるネアンデルタール人祖先系統の希釈はアフリカ祖先系統だけでは説明できません。以前の研究では、ネアンデルタール人祖先系統の割合が低いか皆無の基底部ユーラシア人集団が、古代および現代のユーラシア人にさまざまな割合で寄与し、新石器時代イラン人とナトゥーフィアン人では50%に達する、と提案されました(関連記事)。アラブ人は中東の他地域集団と比較してナトゥーフィアン的祖先系統を過剰に有しているので、アラブ人はネアンデルタール人祖先系統を減少させるだろう基底部ユーラシア人祖先系統も過剰に有している、と明らかになりました。
さらに、ほとんどの中東現代人は最近の混合からアフリカ祖先系統を有しており、それも主要なユーラシア祖先系統を有する時期と比較して、中東現代人の深い祖先系統に寄与しています。中東現代人では、深い祖先系統の増加とネアンデルタール人祖先系統量との間で負の相関関係が見つかりました。全ての古代人口集団を検証すると、ネアンデルタール人祖先系統の希釈を説明する2つの勾配(図5C)が明らかになりました。一方はアフリカ祖先系統により、もう一方は基底部ユーラシア人祖先系統により形成されます。中東人は、両方の祖先系統を有するので、両方の勾配に影響を受けたようです。以下は本論文の図5です。
●選択
現在の超乾燥気候は、アラビア半島の人口集団における適応に選択圧を及ぼした可能性があります。これを調べるため、控えめなゲノム規模閾値でひじょうに急速に拡大した変異を有する系統のゲノム規模系図が調べられました。以前の研究では、アラビア半島におけるラクターゼ(乳糖分解酵素)活性持続(LP)と関連する、ヨーロッパの既知の多様体(rs4988235)とは異なる2つの相関する多様体(rs41380347とrs55660827)が特定されました。アラブ人の多様体rs41380347について、本論文では強い選択の証拠が明らかになりました(図6A)。同様ではあるものの、やや弱く、ヨーロッパ人ではrs4988235における強い選択が報告されています。
rs41380347はアラビア半島人口集団において最高頻度で存在し、サウジ人とエミラティ人では50%となりますが、レヴァントとイラクでは4%とずっと低頻度になります。注目すべきことに、この多様体は1000人ゲノム計画(1KG)ではユーラシアもしくはアフリカの人口集団に存在しませんが、一部のアフリカ東部集団には低頻度で見られます。この多様体は、レヴァントとイランの古代人を含む既知の古代ユーラシア人157個体でも見つからず、中東内のハプロタイプの最近の起源および選択によるその後の頻度増加と一致します。この多様体は9000年前頃から現代の間に頻度が急速に増加した、と明らかになりました(図6A)。注目すべきことに、この期間はアラビア半島における狩猟採集民から牧畜採集民への生活様式移行と重なります。
最近の頻度増加を示す追加の多様体も特定されました。多くの遺伝子には発現量的形質遺伝子座(eQTL)でもある、LMTK2遺伝子内の多様体rs11762534は、推定上の選択の証拠を示します(図6B)。LMTK2遺伝子は、アポトーシスや成長因子シグナリングを含む多様な細胞過程に関わり、マウスでは精子形成に不可欠と思われる、セリン/セロトニンキナーゼをコードします。中東以外では、この多様体はひじょうに層序化されており、ヨーロッパ人で最高頻度(1KGで45%)となりますが、アフリカ人とアジア東部人では1%未満と稀です。
この多様体の頻度は、アラビア半島人口集団では66%、ベドウィンBでは81%ですが、ドゥルーズ派とパレスチナ人ではともに55%とやや頻度か低いようです。rs35241117における強い推定上の選択の兆候も見つかりました(図6C)。この多様体は、サウジ人とイエメン人で最高の世界規模の頻度(最大で60%)を示し、糸球体濾過や利尿や高血圧やBMIなど、多くの代謝や骨格や免疫特性と関連しています。rs35241117はクウェート人サウジ人で選択下にあると最近示唆された40万塩基対外に位置しますが、それとは中程度の連鎖不平衡(LD)です。
さらに、アラビア半島とレヴァント/イラクとの間の強く違う多様体が探されました。エミラティ人とサウジ人の両方では、7番染色体の97000塩基対で分化の強い兆候が見つかりました。このハプロタイプ(rs1734235)の多様体はアラブ人ではほぼ固定しており、培養線維芽細胞におけるlincRNA AC003088.1の発現増加と関連しています。イエメンで最も極端な人口集団分枝統計はrs2814778で、rs2814778では派生的アレルがダッフィー・ヌル(Duffy null)表現型をもたらし、1KGではアフリカの人口集団においてほぼ排他的に見られます。
しかし、この多様体はイエメン人ではひじょうに一般的で(74%)、アラビア半島を北上するにつれて頻度が減少します(サウジ人では59%ですが、イラクのアラブ人では6%です)。ゲノム全体でこの領域は中東においてアフリカ祖先系統が最も濃縮されており、以前の研究と一致する、と明らかになりました。イエメン人とサウジ人におけるアフリカ祖先系統の平均量はそれぞれ9%と3%なので、この多様体の高頻度はアフリカ人との混合後の正の選択と一致しているようです。この派生的なアレルは、アラビア半島において歴史的に存在してきた三日熱マラリア原虫感染を防ぐ、と考えられてきました。
ゲノム規模の系統を用いる利点は、比較的弱い選択を検出する力があることです。そこで、とくに過去2000年間の、20の多遺伝子性特徴全体のアラビア半島人口集団における多遺伝子適応の証拠が探されました。ほとんどの特徴では、身長や肌の色やBMIなど、最近の方向選択の証拠は見つからないか、決定的ではありませんでした(図6D)。しかし、いくつかの特徴は証拠を示しており、最も強い選択兆候は、現代西洋社会の教育年数と関連する遺伝子多様体に現れ、全アラビア半島人口集団で一貫しています。これはイギリスの人口集団でも報告されていますが、その兆候は他の特徴で条件付けした後には減少すると示されており、相関する特性を介した間接的選択が示唆されます。
イギリスの人口集団の知見とは対照的に、日焼けや髪の色などの特徴に作用する推定上の選択の証拠は見つかりませんでした。アラビア半島内では、ほとんどの特徴の推定上の選択の方向性は、おそらく共有された祖先系統の結果として、人口集団全体で類似しています。しかし注意すべきは、アラビア半島全体の現在の変化している環境は、さまざまな最近の選択圧を起こす可能性がある、ということです。エミラティ人では、2型糖尿病を増加させる多様体の推定上の選択の証拠が見つかりました。エミラティ人における2型糖尿病の発症率は世界で最も高く、それは部分的に定住性生活様式への強い最近の変化に起因すると考えられているので、興味深い結果です。同じ人口集団で、低密度リポ蛋白質の水準を向上させ、アポリプロテインBの水準を減少させる推定上の選択のわずかな証拠も見つかりましたが、多重検定を調整すると、これらの証拠は示唆的になりました。以下は本論文の図6です。
●考察
本論文は、遺伝的に充分に研究されていなかった中東地域の高網羅率のゲノム配列の生成を報告しました。研究された全ての標本は、連鎖読み取り配列を用いて実験的に位相化され、大規模で正確なハプロタイプの再構築を可能とします。以前の世界規模の配列計画では分類されていなかった何百万もの多様体が見つかり、そのかなりの割合が中東では一般的です。これら一般的な多様体の大半は短い読み取りの利用可能な被覆外にあり、標準的な短い読み取りの配列に基づく研究の限界を浮き彫りにします。
多数の物理的に位相化されたハプロタイプにより、比較的古い期間(10万年以上前)からごく最近(1000年前頃)までの人口史の研究が可能になりました。アフリカからのヒトの初期拡大が、中東の現代の人口集団に遺伝的に寄与した証拠は見つかりませんでした。この知見は、全ての非アフリカ系現代人はアフリカからの単一の拡大の子孫で、その後すぐにネアンデルタール人と混合し、それは世界の他地域に移住する前だった、という支持を集めつつする合意に追加されます(関連記事)。
中東の人口集団は地域固有のネアンデルタール人由来のDNAをほとんど有しておらず、その大半が他のユーラシア人と共有されている、と明らかになりました。アラビア半島の人口集団は、レヴァントやヨーロッパやアジア東部の人口集団よりもネアンデルタール人祖先系統の割合が低く、これは、ネアンデルタール人と混合しなかった基底部ユーラシア人からの祖先系統の増加と、ネアンデルタール人の遺伝的影響をユーラシア西部現生人類から間接的にしか受けなかったアフリカ人との最近の混合に起因する、と示されます。
古代人のゲノムを用いて現代の人口集団をモデル化することにより、レヴァントとアラビア半島の人口集団間の違いが識別されました。レヴァントの人口集団はヨーロッパ/アナトリア半島関連祖先系統の割合がより高い一方で、アラビア半島人口集団はアフリカおよびナトゥーフィアン的祖先系統の割合がより高くなっています。レヴァントとアラビア半島との間の差異は、人口規模の歴史によっても示されます。両者は新石器時代前の20000~15000年前頃に分岐し、定住農耕生活様式への移行はレヴァントで人口増加を可能にしたものの、アラビア半島では並行していなかったことを示唆します。
アラビア半島では後期更新世と前期完新世の間で人口集団の不連続性が起き、アラビア半島は肥沃な三日月地帯からの新石器時代農耕民により再移住された、と示唆されています。本論文の結果は、レヴァントの農耕民によるアラビア半島人口集団の完全な置換を支持しません。さらに、本論文のモデルでは、アラビア半島の人々は、レヴァントの農耕民ではなく、ナトゥーフィアン的な在来狩猟採集民人口集団に祖先系統が由来する、と示唆されます。アラビア半島北部石器群は、その一部がレヴァントの農耕民により製作された石器群と類似しているように見えると識別されており、さらにレヴァントとアラビア半島との間の家畜動物の移動から、人口集団の移動もしくは文化的拡散のどちらかによるものだった、と提案されてきました。本論文の結果は、文化的拡散および/もしくはレヴァントからの限定的な移住を示唆します。
中東現代人のモデル化に必要な系統の追加の供給源は、古代イラン人と関連しています。本論文の混合検証では、古代イラン人祖先系統がまずレヴァントに到達し、その後でアラビア半島とアフリカ東部に到達した、と示されます。これらの事象の年代は、興味深いことにセム語派の起源および拡大と重なっており、この祖先系統を有する(おそらくはレヴァントもしくはメソポタミアのまだ標本抽出されていない)人口集団がセム語派を拡大させた、と示唆されます。乾燥化事象と関連する気候変化が人口集団のボトルネックと関連していることも明らかになり、アラビア半島では6000年前頃に砂漠気候の始まりとともに人口規模が減少しましたが、レヴァントでは、4200年前頃の乾燥化事象で人口が減少しました。この深刻な旱魃は、中東とアジア南部の王国および帝国の崩壊の原因になった、と示唆されており、本論文で特定された兆候に遺伝的に反映されている可能性があります。
多様体の進化史の再構築への祖先的組換え図の適用は、自然選択研究に強力な手法を提供します。本論文は、アラビア半島の人口集団において、選択の兆候を洗練して特定しました。過去数千年に50%にまで頻度が達し、アラビア半島外ではほぼ存在しない多様体と関連するラクターゼ活性持続の事例は、ヒトの歴史と適応の理解において、あまり研究されていない人口集団の研究が重要だと示します。
本論文の結果から、多遺伝子性選択は、過去に有益だった可能性があるものの、現在では2型糖尿病などの疾患と関連している多様体の頻度増加に役割を果たしたかもしれない、と示唆されます。本論文では、他の人口集団と比較して、アラビア半島人口集団では多遺伝子性選択の兆候がほとんど見つからず、これは理論的に選択の強度を低下させるだろう長期の小さな有効人口規模の結果かもしれません。長期の小さな有効人口規模は、とくに最近の近親結婚の習慣(関連記事)と相まって、メンデル型や複雑な特徴の研究に利用できます。なぜならば、個体群はホモ接合型の機能喪失変異を有し、自然な「ヒトノックアウト」として機能するからです。本論文と中東地域における最近の国立バイオバンク設立は、健康格差是正への第一歩であり、将来、中東における複雑で疾患性の特徴を調べるための、刺激的な機会を提供します。以下は本論文の要約図です。
本論文は最後に限界も指摘しています。アラビア半島人口集団の形成を洗練し、レヴァントとアラビア半島との間の先史時代のつながりをさらに明らかにするには、アラビア半島からの将来の古代DNA研究が必要です。中東の人口集団はゲノム規模関連解析では最も注目されていない集団の一つなので、選択兆候の理解や多遺伝子性特徴の分析には限界があります。中東集団に関する将来のゲノム規模関連解析は、これらの人口集団における多遺伝子性選択の影響を理解するのに必要です。
参考文献:
Almarri MA. et al.(2021): The genomic history of the Middle East. Cell, 184, 18, 4612–4625.E14.
https://doi.org/10.1016/j.cell.2021.07.013
この記事へのコメント