非アフリカ系現代人のX染色体における強い選択
非アフリカ系現代人のX染色体における強い選択に関する研究(Skov et al., 2023)が公表されました。本論文は、非アフリカ系現代人の祖先集団において、選択的一掃のようなX染色体上で強い選択があったことを、現時点で最古級となるゲノムが解析された現生人類(Homo sapiens)遺骸も用いて明らかにしており、ネアンデルタール人(Homo neanderthalensis)など古代型のヒト【絶滅ホモ属、非現生人類ホモ属】と現生人類の混合との関連についても検証しています。選択的一掃とは、正の自然選択が作用し、その標的となる多型周辺のゲノム領域の塩基配列の均一性が高くなることです(関連記事)。現時点で最古級となる現生人類個体とは、シベリア西部のウスチイシム(Ust'-Ishim)近郊のイルティシ川(Irtysh River)の土手で発見された44380年前頃となる男性遺骸です(関連記事)。なお、以下のbpは塩基対(base pair)、1kbpは1000塩基対、1Mbは100万塩基対です。
●要約
非アフリカ系のヒトのX染色体は、中立的進化から予測されるよりも低い多様性およびネアンデルタール人からの遺伝子移入を示します。世界中のヒトの男性162個体のX染色体の分析により、14ヶ所の染色体上の領域が特定され、そうした領域では、数百kbにまたがるほぼ同一のハプロタイプが非アフリカ系人において高頻度で見られます。遺伝的浮動だけではこれらのハプロタイプの存在を説明できず、これらのハプロタイプは部分的な選択的一掃における強い正の選択と関連していたはずです。
さらに、一掃されたハプロタイプには、同じゲノム領域において一掃されなかったハプロタイプとは対照的に、古代型【非現生人類ホモ属型】の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)が完全に欠けています。45000年前頃となる古代のウスチイシムの男性個体も一掃されたハプロタイプを有しており、このハプロタイプの選択は55000~45000年前頃に起きたに違いない、と示唆されます。最後に、一掃の染色体上の部位は、大型類人猿における選択的一掃の以前に報告された多発域【hotspot、変異の起きる可能性が高いゲノム領域】と重なっていると分かり、X染色体に特有の選択の機序が示唆されます。
●研究史
哺乳類のX染色体は、常染色体と比較しての異常な進化と、雄の生殖能力および種間の遺伝的不適合性に不釣り合いな影響を示します。それらは精巣で発現する遺伝子で濃縮されており、雄の減数分裂中に特有の沈黙化(silencing)を経ます。ハツカネズミ(Mus musculus)とウシ(Bos taurus)では、X染色体とY染色体との間の軍拡競争の証拠があります。ここでは、Y染色体およびX染色体と関連する多コピー相同体(増幅産物遺伝子)の相対的な数が、X染色体もしくはY染色体を有する生存可能な精子細胞の割合に影響を及ぼします。このゲノム内競合は、Y染色体およびX染色体と関連する相同体の動的な共増幅を促進します。この相同体は、性染色体の進化と、新たな種間の不適合性の蓄積を加速する、と予測されています。
報告された証拠では、X染色体は大型類人猿において繰り返し強い正の選択を受けた、と示されています。この選択は、X染色体の広い領域における多様性喪失として明らかにされています。類人猿の各種における選択の標的となったこの領域は重複しており、ヒトとチンパンジーの祖先種において繰り返し選択の標的となったより広い領域、およびヒトとオランウータンの祖先において同様に影響を受けた重複領域内に収まる傾向にあります。まとめると、これらの調査結果から、減数分裂分離比の歪み(meiotic drive)は霊長類のX染色体の進化に重要な役割を果たしている、との仮説につながります。
X染色体とY染色体における古代型のヒト【非現生人類ホモ属】からの遺伝子移入のパターンは、常染色体で観察されたパターンとは異なります。25万年以上前に、現生人類はネアンデルタール人と混合し、ネアンデルタール人のY染色体を置換しました(関連記事)。この機にネアンデルタール人は、少なくとも常染色と同じくらいX染色体でも現生人類との混合を受けました(関連記事)。中東での55000年前頃とより最近の現生人類とネアンデルタール人の遭遇では、混合の方向は逆で、定性的に異なっていました。ここで、ネアンデルタール人のY染色体は出アフリカ現生人類へと遺伝子移入せず、ネアンデルタール人のX染色体は常染色体よりもずっと少ない程度で遺伝子移入しました(関連記事)。現在、X染色体の数Mbの長さの区画は、ネアンデルタール人からの遺伝子移入が枯渇しています。これらの区画は上述のように、大型類人猿では自然選択により繰り返し標的とされたX染色体の領域です。
本論文は、ヒトX染色体の領域における減少したヌクレオチド多様性が、正の選択に起因するのかどうか、調べます。その結果、合計17Mb以上となるX染色体の大規模な領域には、急速に高頻度に上昇した、すべての非アフリカ系人口集団により共有されるハプロタイプが含まれる、と分かりました。驚くべきことに、全てのこれらのハプロタイプは、古代型の遺伝子移入が完全に欠けています。次に、この調査結果に基づいて、どの選択機序がこの不可解な観察結果の組み合わせを引き起こし得たのか、推測されます。
●非アフリカ系人のX染色体では一般的な長さがMbに及ぶ高頻度のハプロタイプ
サイモンズゲノム多様性計画(Simons Genome Diversity Project、略してSGDP)の世界規模の高網羅率ゲノムが分析されました。まず、X染色体に沿って200kbの解析単位(window)で各人口集団のヌクレオチド多様性が調査され、その多様性が、類似の長さの代表的な常染色体である7番染色体の多様性と比較されました。図1A・Bは、アフリカと非アフリカ系の人口集団の代表的な一式について多様性のパターンを示しており、各人口集団の位置は図1Cに示されています。図1Dは、これら200kbの解析単位における対での違いの分布を示します。アフリカの人口集団が、代表的な常染色体に沿って観察されるように、X染色体全体で比較的均等な量の多様性を示すのに対して、アフリカ外の全ての人口集団は、きょくたんに減少した多様性のMb規模の領域を示し、それはX染色体上で類似の部分であることが多くなっています。そうした低い多様性の類似の事例は代表的な常染色体では見られず、そうした多様性の極端な低下はX染色体固有の特性である、と示唆されます。以下は本論文の図1です。
これら最初の観察から、高頻度のハプロタイプは非アフリカ系人口集団全体で共有されている、と示唆されます。そうしたハプロタイプを特定するため、その後の分析では、X染色体が半数体である男性に限定されました。2018年の先行研究にしたがって、データが欠落している男性と、XY核型を示さない男性は除外されました。さらに、最近のヨーロッパ人とのア混合の証拠がないフリカ系の男性は除外されました。この選別により男性162個体が残り、そのうち140個体は非アフリカ系人でした。これらの個体の一覧は補足表3に示されています。分析された人口集団の標本抽出位置は図2Aに示されています。以下は本論文の図2です。
次に、全構成員のハプロタイプ間の最大の遺伝的分岐がほぼ0.005%である長いハプロタイプ(500kb超)のクレード(単系統群)について、これらX染色体が区切られました。この分岐閾値は、6万年前以内(50%の確率質量で67059~51119年前)と予測される共通祖先系統に相当します。つまり、そうしたクレードは、出アフリカ事象よりも新しいことになる最も近い共通祖先を有しています。そうしたハプロタイプクレードが本論文のデータセットにおいて少なくとも25%含まれている場合、それらは拡張共通ハプロタイプ(extended common haplotypes、略してECH)と呼ばれます(図2B)。
500kbの滑動解析単位(sliding window)におけるECHのクレードが、クリーク(任意の完全部分)発見演算法を用いての100kbの段階的規模で特定されました。各個体で特定されたEHCは図2Cに示されています。それらのECHは非アフリカ系人口集団においてほぼ排他的に見られ、アフリカ外では明らかな地理的差異がありません。非アフリカ人におけるハプロタイプの共有から、そうしたハプロタイプはアフリカからの主要な移住後ではあるものの、非アフリカ系人口集団のその後の分化の前に高頻度に上昇した、と示唆されます。
全てのECHを合わせた長さは、17.3Mbもしくは完全なX染色体の11%です。影響を受けた19ヶ所の染色体領域のうち5ヶ所では、EHCは非アフリカ人男性の75%以上が有しており、14ヶ所の領域では、ECH は50%以上の非アフリカ人が有しています。後者の一式は14ヶ所の最も極端な領域と呼ばれます。ECHは高頻度の派生的多様体のより高い割合により特徴づけられており、これは各EHCが最近単一の最初のハプロタイプから発生した場合に予測されます。
次に、各EHCが見られる染色体領域のハプロタイプ構造が視覚化され、ECHのない領域と比較されました。図3Aは最も拡張されて最高頻度のEHCの中核的な900kbの領域を示しており、非参照一塩基多型(Single Nucleotide Polymorphism、略してSNP)は黒い座標制御点として図示され、個々の半数体のX染色体は算術平均での非加重結合法(unweighted pair group method with arithmetic mean、略してUPGMA)によりクラスタ化します(まとまります)。以下は本論文の図3です。
すべての非アフリカ人のX染色体はアフリカ人のX染色体と比較してひじょうに減少した多様性で単一のクレードを形成し、単一の祖先的ハプロタイプが非アフリカ人において高頻度に上昇した、と示唆されます。この事例では、EHCは少なくとも1.8Mbにまたがります。残りのECHのハプロタイプ構造は同じパターンを示しており、1つのハプロタイプ(および一部の事例では2つのハプロタイプ)は、非アフリカ系人のX染色体の大規模な部分集合により共有されています。比較のため、図3BはECHが見られない典型的な900kbの領域を示しています。ここでは、非アフリカ人のハプロタイプが単一のクレードを形成せず、それは、より多くのアフリカ人のX染色体の多様性が非アフリカ人で表れているからです。
●ウスチイシム個体に先行するECH頻度の上昇
45000(46880~43210)年前頃のウスチイシム個体が含められ、これらの頻度変化がいつ起きたのか、さらに推定されました。男性のウスチイシム個体はヨーロッパ人とアジア人に均等に関連しており【現代人ではヨーロッパよりもアジア東部の方に近い、との見解(関連記事)もあります】、この系統がヨーロッパとアジアの人口集団の分岐の前に分岐し、現代人の多様性には直接的に寄与しなかった、と示唆されます。ハプロタイプ頻度が主要な出アフリカ事象の直後に上昇したならば、ウスチイシム個体が現在の非アフリカ人と同じようにECHを有している、と予測できます。
これを調べるため、ウスチイシム個体を含めて本論文ECH発見手順が繰り返されました。ウスチイシム個体14個の最高頻度のECHのうち6個を共有していました。古代人の配列において偽陽性のSNP呼び出しに堅牢な代替的手法を用いて、図4の各最高点に集中している500kb解析単位のハプロタイプ図示にウスチイシム個体が追加されました。ウスチイシム個体は14ヶ所の最も極端な領域のうち9ヶ所でECHのクラスタ内に収まり、現在の非アフリカ人の平均9.7に近くなります。ウスチイシム個体が有しているこの類似の数から、ECHのほとんどはすでに45000年前頃には高頻度に上昇していた、と示唆されます。以下は本論文の図4です。
●自然選択なしでのECH観察の確率推定
本論文の観察から、ECHは出アフリカ事象(8万~6万年前頃)後ではあるものの、ウスチイシム個体が生きていた(45000年前頃)前には単一のハプロタイプから高頻度に上昇した、と示唆されます。そうした永井ハプロタイプの頻度におけるこの急速な変化は著しく、強い正の選択の特徴です。しかし、とくに極端な人口ボトルネック(瓶首効果)機関の遺伝的浮動も、長いハプロタイプの頻度増加を引き起こす可能性があり、X染色体はそのより小さな有効人口規模(Ne)のためにボトルネックの影響をより強く受けます。
第一に、遺伝的浮動の単純な頻度模擬実験が実行され、中立進化下でのハプロタイプ観察の確率が評価されました。頻度の軌跡が模擬実験され、染色体全域にわたって、1個のハプロタイプがウスチイシム個体の45000年前頃と、6万年前頃という予測される最大のECH分岐との間の期間に遺伝的浮動により高頻度に上昇する確率が計算されました。模擬実験では500kbのハプロタイプが想定されましたが、ほとんどのECHはそれより長くなります。さまざまなシナリオを網羅するため、5000年と10000年と15000年と20000年と25000年の期間について模擬実験が実行されました。本論文の模擬実験に適切なボトルネックNeを見つけるため、SMC++を用いて、本論文の分析で用いられた非アフリカ人の人口動態が推定されました。この結果から、ボトルネックの最低の常染色体Neは4125と推定されました。
本論文の模擬実験では、控えめに3000の常染色体Neが想定され、比較のため、1500のより可能性が低い常染色体Neが含められました。有効人口規模の2つの異なるX染色体と常染色体の比率について模擬実験が実行されました。0.65の比率は本論文のデータセットではアフリカ人個体群の中央値比に、より低い0.51の比率は非アフリカ人の中央値比に相当します。後者の推定は、男性主導の移住に起因するかもしれませんが、上述のように、ECHにおける多様性喪失によっても低下するかもしれません。3000の常染色体Neでは、2つのX染色体と常染色体の比率が、X染色体のNeでは1950と975に相当します(図5)。さらに女性のX染色体の組換え率が1.16e−8と仮定されます。媒介変数の各組み合わせについて50万回の模擬実験が実行されます。以下は本論文の図5です。
模擬実験は図5に要約されており、「A」は染色体に沿って少なくとも500kbのハプロタイプが特定の期間において特定の頻度に上昇する確率を表します。現実的な媒介変数である5000~15000年の期間と常染色体ボトルネック人口規模3000を仮定すると、浮動が低頻度のECHをもたらす可能性がある一方で、各高頻度ECHがもたらされる確率はきょくたんに低い、と分かりました。図5Bは、それぞれで起きる頻度における全ての特定されたECHの観察の同時確率を定量化しています。各点は、より低い頻度における全ての観察されたECHとともに、その頻度における観察されたECHの同時確率を表しています。したがって、各面の右端点は全ての観察されたECHの同時確率を示します。
上述の媒介変数の範囲については、観察されたECHが中立的に上昇した可能性はきょくたんに低そうです。灰色と黒色の点は、1500の常染色体人口規模の確率を示します。この非現実的に低い常染色体人口規模でさえ、有効な時間は全ての観察されたECHを説明するには遺伝的浮動について、非現実的な長さ(20000~25000年)である必要があります。追加の証拠を用いて、5000~15000年の期間のみが現実的である理由は後述されます。これは、中立的過程のみが観察されたECHを引き起こした可能性はひじょうに低い、と示します。
第二に、刊行された人口動態と組換え図を用いて、完全なX染色体の順方向模擬実験が実行されました。SGDPのデータはひじょうに広範な人口構造と模擬実験にあまり適していない人口統計から得られたので、本論文のモデル人口集団として、1000人ゲノムから均質なCEU人口集団(ヨーロッパ北部および西部祖先系統を有するアメリカ合衆国ユタ州住民)が選択されました。CEU人口集団で推測手順が繰り返され、その後で順方向模擬実験が実行され、この人口集団で呼び出されたECHが遺伝的浮動の産物だった確率が評価されました。
CEUの男性49個体のX染色体でのECHの推測では、この単一の均質な人口集団からの大規模な標本が、ひじょうに構造化されたSGDPよりも最近の共通祖先を見つけることがずっと多いだろう、と考慮する必要があります。この寄与をそうした初期合着(合祖)のクレード規模に調節するため、本論文の主要な分析で用いられたECHのクレード規模が25%から50%に増加されました。このクレード規模を用いての推測は、SGDP の男性で同定された19のECH最高点のうち15を再現します。
CEU人口集団では、ECHは合わせて染色体全体の10%を網羅し、SGDPデータセットで観察された11%と類似しています。SLiM3を用いて実行された過去20万世代のその後の順方向模擬実験では、本論文が把握している限りでは最強のボトルネックを推定する、以前に刊行されたCEU人口規模の軌跡が用いられます。その模擬実験は、X染色体の詳細な規模での家系図に基づく組換え図も使用します。上述の頻度模擬実験で用いられた、同じX染色体と常染色体のNe比(0.51と0.65)を使用して、模擬実験が実行されました。
男性49個体のX染色体の500回の模擬実験で、ECHが呼び出され、全ての模擬実験された染色体全体で100kb配列解析単位の分析された割合がECHを呼び出した、X染色体の分析された割合が計算されました。アフリカ人のX染色体と常染色体の比率0.65を想定すると、これら2つの割合は0.3%(0~2%)と0.2%(0~1.2%)です(間隔は全染色体模擬実験で2.5番目と97.5番目の百分位数です)。代わりに、より低い非アフリカ人のX染色体と常染色体の比率0.51(部分的には一掃に起因してより低いのでしょう)を想定すると、その数は1.1%(0~4%)と0.7%(0~2.5%)です。
CEUの49個体標本の本論文の分析では、これら2つの割合がより大きくなる、と分かりました(11.1%と7.6%)。CEU人口集団におけるこの2つの割合も模擬実験で得られた割合の97.5番目の百分位数の2.8倍と3倍であることをさらに考えると(図6)、ECHがCEU人口集団において中立的に上昇した可能性はきょくたんに低そうです。SGDPの男性データセットの分析により明らかにされたように、そうしたECHウスチイシム個体の生存した45000年前頃以前に中立的に上昇した可能性はさらに低そうです。以下は本論文の図6です。
●X染色体の選択的一掃が繰り返された可能性
ヒトとチンパンジーの祖先において、選択的一掃の証拠が以前に報告されました。したがって、これらが本論文で報告されたECH領域の独立した観察と重複するのかどうか、検証されました。その結果、図4の橙色の塊で示される、ヒトとチンパンジーおよびヒトとゴリラの種分化事象(関連記事)を分離した200万~400万年間に少なくとも1回の、ECHと染色体の一掃区画との間で強い重複が見つかりました。
●選択的一掃によるX染色体の古代型の遺伝子移入配列の置換
主要な出アフリカ事象に続いた古代型のヒトとの混合は、X染色体において常染色体よりもずっと低い割合の遺伝子移入された配列を残しました。したがって、非アフリカ系人口集団では、ネアンデルタール人に由来する構成要素は常染色体の1.4%と比較してわずか0.3%です。種区分未定のホモ属であるデニソワ人(Denisovan)との混合はX染色体において実質的に存在せず、オセアニア人のみ低い割合(0.18%)で有しています(関連記事)。
古代型の混合と検出された選択的一掃との間の関係を調べるため、hmmixが適用され、各非アフリカ人男性のX染色体における古代型のヒトの祖先系統のゲノム断片が呼び出されました。この手法は隠れマルコフモデルを用いて、アフリカ人のゲノムの混合していない集団で観察されなかった派生的SNPのクラスタを探します。以前の報告(関連記事)における推測と比較して、本論文で適用された手法は、配列決定された古代型のゲノムで表されていない古代型の断片を特定できます。
個体全体の平均混合割合は0.8%と推定されます。しかし、シベリア南部のアルタイ山脈のデニソワ洞窟(Denisova Cave)で発見されたネアンデルタール人およびデニソワ人とクロアチアのヴィンディヤ洞窟(Vindija Cave)で発見されたネアンデルタール人から構成される、高網羅率の古代型のヒトのゲノムと共有される古代型断片に限定すると、以前の報告(関連記事)と類似した遺伝子移入された配列の割合(0.36%)が確認されます。
一部の個体がECHを有する100kbの解析単位(X染色体の11%)に分析を限定すると、古代型の割合は個体がECHを有さない解析単位での0.9%と比較して0.3%と観察されます。この現象がとくにECHにおける低水準の混合により起きたのかどうか調べるため、まずどの個体もECHを有している常染色体の100kbの解析単位の部分集合が抽出されました。これら各100kbの解析単位で、ECHとECHクレードの一部ではない同じ部位におけるハプロタイプの平均的な古代型との混合割合が計算されました。その結果、ECHは推定される古代型の混合がほぼ完全にない、と分かりました。対照的に、同じゲノム解析単位における残りのハプロタイプは、平均0.70%の混合割合で、その範囲は0.35~1.03%となり、地理的地域に依存します。この混合割合は、ECHと重複しない染色体領域における古代型の寄与に近くなっています。
したがって、この分析から、ECHにおける混合の欠如自体が、その出現する染色体領域における減少した古代型との混合を説明する、と明らかになります。ECH内では、平均的な古代型との混合割合は0.0045%で、同じ染色体解析単位における非ECHハプロタイプと比較して99%の減少に相当します。本論文での混合推定は低い偽陽性率と関連しているので、この割合は古代型との混合の完全な欠如と一致します。各地理的地域はECHにおける古代型との混合のこの欠如を示しているので(図7A)、各ECHの中核領域も同様です(図7B)。以下は本論文の図7です。
古代型の遺伝子移入は、現生人類の多様性に寄与しました。したがって、寄与した古代型の混合はECHの本論文の定義で要求された低い多様性と一致しなかっただけなので、ECHは混合を含まない、と誤って結論づける可能性があります。しかし、各個体で特定された混合断片をマスクした(隠した)後で本論文のECH推測を繰り返すと、依然としてECHは混合がないと分かるので、この潜在的な確認の偏りは除外されます。
●古代型の置換は正の選択をさらに裏づけます
ECHが古代型との混合を置換した一方で、その頻度上昇は、古代型からの寄与に対する選択浄化の結果ではないかもしれません。そうした負の選択が起きた可能性が最も高いものの(関連記事)、多くのハプロタイプではなく、単一の混合のないハプロタイプが急速に頻度上昇した理由を説明できません。対照的に、単一のハプロタイプが古代型との混合とは関連しない理由で正の選択下にあったならば、これが予測されるでしょう。したがって、この文脈では、古代型との混合は単に混合のないECHが見える背景として機能するだけです。
ECHが45000年前頃のウスチイシム個体でもネアンデルタール人との混合を置換した、との本論文の調査結果によりさらに、ECHの頻度上昇した期間を狭めることが可能となります。それは、一掃が混合事象とウスチイシム個体との間に必ず起きたに違いないからです。ウスチイシム個体におけるネアンデルタール人との混合断片の長さから、主要なネアンデルタール人との混合事象はウスチイシム個体の9599(13000~7000)年前頃と年代測定されました(関連記事)。この推定の信頼区間として4つの標準誤差を用いると、一掃は少なくとも3724年、最大で15341年の期間で起きたに違いない、と示唆されます。したがって、本論文の模擬実験に含まれる20000~25000年の間隔(図5)は、関連する媒介変数の範囲外に位置し、ECHが中立的過程から生じた可能性はさらに低下します。
●考察
本論文の分析から、合計で11%の長さになるX染色体の領域には長くて高頻度のハプロタイプ(ECH)があり、それはすべての非アフリカ系人口集団で共有されている、と示唆されます。これらのハプロタイプの頻度は出アフリカ事象とそれに続く古代型のヒトとの混合事象の後ですぐに上昇しました。これらの劇的な頻度変化は、45000年前頃のウスチイシム個体の時までに完全もしくはほぼ完全に完了していたようです。これらのハプロタイプの大きな規模は、頻度の急速な増加と一致し、遺伝的浮動の中立的過程と一致しません。本論文では、これらのハプロタイプは正の選択により頻度が増加したに違いない、と結論づけられます。驚くべきことに、ECHには完全に古代型との混合がなく、どのような多様体がその頻度上昇を促進したとしても、これらは古代型との混合なしにハプロタイプで発生した、と示唆されます。
特定されたECHのうち14個はそれぞれ、非アフリカ人の少なくとも50%では500kbから1.8Mbにまたがっています。最強の一掃は非アフリカ人の91%で900kbにまたがっており、1.8Mbの領域にわたって非アフリカ人の53%に影響を及ぼしています。比較すると、ヒト多様性データから報告された最強の選択的一掃はラクターゼ(乳糖分解酵素)遺伝子にあり、ヨーロッパ系アメリカ人の77%では800kbにまたがっています。原因となる多様体での選択係数は1.6~1.8%と推定されてきており、いくつかのECHと原因となる選択係数が1%をはるかに上回っていたかもしれない、と示唆されます。
マウスの精巣で減数分裂後の発現を示し、マウスとショウジョウバエにおいて性染色体の減数分裂分離比の歪み過程に関わる増幅遺伝子の役割が以前に示唆されました。しかし、ヒトの増幅領域は一掃領域と有意に近位であるものの、一般的に重複しません。ほとんどの個体により共有される各ECHの中核領域は、それぞれいくつかの遺伝子を含んでおり、あらゆる遺伝子概念体系で濃縮は検出されません。タンパク質をコードする遺伝子も、精巣での発言増加がある遺伝子の濃縮を示しません。しかし、1つの一掃は、精細胞形成と関連している単一のタンパク質コード遺伝子であるACTRT1をその中心に有しています。
現時点では、本論文の全ての観察を説明する可能性の高いシナリオを予想できません。選択的一掃が性染色体の減減数分裂分離比の歪みな起因するかもしれない、本論文は慎重に仮定します。X染色体とY染色体の精子の平均的に均等な伝達がX染色体とY染色体で歪みに対抗する動的平衡により維持されているならば、ボトルネックを経た主要な出アフリカ人口集団は、より初期の出アフリカ人口集団において維持された性染色体の歪みにより浸食されたかもしれません。この仮説は最近の証拠により間接的に裏づけられており、その証拠では、Y染色体ハプログループ(YHg)FTの急速な拡大はアジア東部/南東部に起源があり、アフリカからのその後の主要な拡散の波が有していたYHg系統を置換した、と示唆されています(関連記事)。ユーラシア全域でのY染色体の歪みの拡大は、同じ供給源人口集団から拡大したX染色体のハプロタイプに続いて、Y染色体の歪みにより浸食された人口集団における均等な減数分裂伝達が復元されたでしょう。
YHg-FTを有するウスチイシム個体の年代は、これらの事象を55000~45000年前頃の時間枠に位置づけ、その期間に一掃が起きた、と本論文は結論づけます。ECHのアジア起源とアフリカからの主要な拡散の波のその後の置換は、ECHがユーラシア西部におけるネアンデルタール人との混合だけではなく、アジアにおけるデニソワ人との混合も置換した、という本論文の観察とも一致します。この仮説が正しいならば、一掃領域はネアンデルタール人と混合していない初期の非アフリカ系人口集団から残ったハプロタイプのみを表しています。この仮説は、将来の研究の指針となる検証可能な予測を提供するでしょう。以下は本論文の要約図です。
どのような説明であれ、その説明はX染色体にとって特有だったに違いなく、おそらくは生殖能力もしくは減数分裂の正確さへの他の結果の形態においてだろう、と本論文は考えています。したがって本論文は、将来の研究が、おそらくは特定のYHgとの組み合わせで、本論文で報告されたECHの男性の生殖能力の結果の調査に焦点を当てることができる、と提案します。男性の生殖能力のデータとゲノム規模の配列決定もしくは遺伝子型決定のある大規模なコホートが、そうした研究ですぐに利用可能になるでしょう。
●この研究の限界
本論文のECHの推測の解像度は限定的で、それはECHが少なくとも500kbにまたがることを必要とするからです。この解像度では、一掃の原因となる候補遺伝子の精細なマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が可能ではなく、遺伝子概念体系濃縮を特定できません。別の限界は、SGDPデータセットが、非アフリカ人と比較して多様性のあるアフリカの人口集団に固有のECHを特定するのに充分なアフリカ人男性を含んでないことです。本論文の観察が中立的に起きたかもしれない確率の評価にも限界があります。
第一に、X染色体が正の選択により強く影響を受けているならば、X染色体の多様性からX染色体の動態を有意義に推定できません。したがって、X染色体と常染色体の比率により常染色体の動態を拡大縮小することにより、X染色体の動態の再構築が行なわれました。第二に、一掃が5000~15000年の期間に起きた、という推定は単一の高網羅率の古代人ゲノムに基づいています。この期間のより高網羅率の古代人のゲノムの利用可能性が、さらにこの間隔を狭めることができるでしょう。最後に、多くの選択的一掃の原因についての推測を裏づける直接的証拠を、本論文は提供できません。本論文で暫定的に提案された仮説は、さらに多くの調査で科学的に調査される必要があるでしょう。
参考文献:
Skov L. et al.(2023): Extraordinary selection on the human X chromosome associated with archaic admixture. Cell Genomics, 3, 3, 100274.
https://doi.org/10.1016/j.xgen.2023.100274
●要約
非アフリカ系のヒトのX染色体は、中立的進化から予測されるよりも低い多様性およびネアンデルタール人からの遺伝子移入を示します。世界中のヒトの男性162個体のX染色体の分析により、14ヶ所の染色体上の領域が特定され、そうした領域では、数百kbにまたがるほぼ同一のハプロタイプが非アフリカ系人において高頻度で見られます。遺伝的浮動だけではこれらのハプロタイプの存在を説明できず、これらのハプロタイプは部分的な選択的一掃における強い正の選択と関連していたはずです。
さらに、一掃されたハプロタイプには、同じゲノム領域において一掃されなかったハプロタイプとは対照的に、古代型【非現生人類ホモ属型】の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)が完全に欠けています。45000年前頃となる古代のウスチイシムの男性個体も一掃されたハプロタイプを有しており、このハプロタイプの選択は55000~45000年前頃に起きたに違いない、と示唆されます。最後に、一掃の染色体上の部位は、大型類人猿における選択的一掃の以前に報告された多発域【hotspot、変異の起きる可能性が高いゲノム領域】と重なっていると分かり、X染色体に特有の選択の機序が示唆されます。
●研究史
哺乳類のX染色体は、常染色体と比較しての異常な進化と、雄の生殖能力および種間の遺伝的不適合性に不釣り合いな影響を示します。それらは精巣で発現する遺伝子で濃縮されており、雄の減数分裂中に特有の沈黙化(silencing)を経ます。ハツカネズミ(Mus musculus)とウシ(Bos taurus)では、X染色体とY染色体との間の軍拡競争の証拠があります。ここでは、Y染色体およびX染色体と関連する多コピー相同体(増幅産物遺伝子)の相対的な数が、X染色体もしくはY染色体を有する生存可能な精子細胞の割合に影響を及ぼします。このゲノム内競合は、Y染色体およびX染色体と関連する相同体の動的な共増幅を促進します。この相同体は、性染色体の進化と、新たな種間の不適合性の蓄積を加速する、と予測されています。
報告された証拠では、X染色体は大型類人猿において繰り返し強い正の選択を受けた、と示されています。この選択は、X染色体の広い領域における多様性喪失として明らかにされています。類人猿の各種における選択の標的となったこの領域は重複しており、ヒトとチンパンジーの祖先種において繰り返し選択の標的となったより広い領域、およびヒトとオランウータンの祖先において同様に影響を受けた重複領域内に収まる傾向にあります。まとめると、これらの調査結果から、減数分裂分離比の歪み(meiotic drive)は霊長類のX染色体の進化に重要な役割を果たしている、との仮説につながります。
X染色体とY染色体における古代型のヒト【非現生人類ホモ属】からの遺伝子移入のパターンは、常染色体で観察されたパターンとは異なります。25万年以上前に、現生人類はネアンデルタール人と混合し、ネアンデルタール人のY染色体を置換しました(関連記事)。この機にネアンデルタール人は、少なくとも常染色と同じくらいX染色体でも現生人類との混合を受けました(関連記事)。中東での55000年前頃とより最近の現生人類とネアンデルタール人の遭遇では、混合の方向は逆で、定性的に異なっていました。ここで、ネアンデルタール人のY染色体は出アフリカ現生人類へと遺伝子移入せず、ネアンデルタール人のX染色体は常染色体よりもずっと少ない程度で遺伝子移入しました(関連記事)。現在、X染色体の数Mbの長さの区画は、ネアンデルタール人からの遺伝子移入が枯渇しています。これらの区画は上述のように、大型類人猿では自然選択により繰り返し標的とされたX染色体の領域です。
本論文は、ヒトX染色体の領域における減少したヌクレオチド多様性が、正の選択に起因するのかどうか、調べます。その結果、合計17Mb以上となるX染色体の大規模な領域には、急速に高頻度に上昇した、すべての非アフリカ系人口集団により共有されるハプロタイプが含まれる、と分かりました。驚くべきことに、全てのこれらのハプロタイプは、古代型の遺伝子移入が完全に欠けています。次に、この調査結果に基づいて、どの選択機序がこの不可解な観察結果の組み合わせを引き起こし得たのか、推測されます。
●非アフリカ系人のX染色体では一般的な長さがMbに及ぶ高頻度のハプロタイプ
サイモンズゲノム多様性計画(Simons Genome Diversity Project、略してSGDP)の世界規模の高網羅率ゲノムが分析されました。まず、X染色体に沿って200kbの解析単位(window)で各人口集団のヌクレオチド多様性が調査され、その多様性が、類似の長さの代表的な常染色体である7番染色体の多様性と比較されました。図1A・Bは、アフリカと非アフリカ系の人口集団の代表的な一式について多様性のパターンを示しており、各人口集団の位置は図1Cに示されています。図1Dは、これら200kbの解析単位における対での違いの分布を示します。アフリカの人口集団が、代表的な常染色体に沿って観察されるように、X染色体全体で比較的均等な量の多様性を示すのに対して、アフリカ外の全ての人口集団は、きょくたんに減少した多様性のMb規模の領域を示し、それはX染色体上で類似の部分であることが多くなっています。そうした低い多様性の類似の事例は代表的な常染色体では見られず、そうした多様性の極端な低下はX染色体固有の特性である、と示唆されます。以下は本論文の図1です。
これら最初の観察から、高頻度のハプロタイプは非アフリカ系人口集団全体で共有されている、と示唆されます。そうしたハプロタイプを特定するため、その後の分析では、X染色体が半数体である男性に限定されました。2018年の先行研究にしたがって、データが欠落している男性と、XY核型を示さない男性は除外されました。さらに、最近のヨーロッパ人とのア混合の証拠がないフリカ系の男性は除外されました。この選別により男性162個体が残り、そのうち140個体は非アフリカ系人でした。これらの個体の一覧は補足表3に示されています。分析された人口集団の標本抽出位置は図2Aに示されています。以下は本論文の図2です。
次に、全構成員のハプロタイプ間の最大の遺伝的分岐がほぼ0.005%である長いハプロタイプ(500kb超)のクレード(単系統群)について、これらX染色体が区切られました。この分岐閾値は、6万年前以内(50%の確率質量で67059~51119年前)と予測される共通祖先系統に相当します。つまり、そうしたクレードは、出アフリカ事象よりも新しいことになる最も近い共通祖先を有しています。そうしたハプロタイプクレードが本論文のデータセットにおいて少なくとも25%含まれている場合、それらは拡張共通ハプロタイプ(extended common haplotypes、略してECH)と呼ばれます(図2B)。
500kbの滑動解析単位(sliding window)におけるECHのクレードが、クリーク(任意の完全部分)発見演算法を用いての100kbの段階的規模で特定されました。各個体で特定されたEHCは図2Cに示されています。それらのECHは非アフリカ系人口集団においてほぼ排他的に見られ、アフリカ外では明らかな地理的差異がありません。非アフリカ人におけるハプロタイプの共有から、そうしたハプロタイプはアフリカからの主要な移住後ではあるものの、非アフリカ系人口集団のその後の分化の前に高頻度に上昇した、と示唆されます。
全てのECHを合わせた長さは、17.3Mbもしくは完全なX染色体の11%です。影響を受けた19ヶ所の染色体領域のうち5ヶ所では、EHCは非アフリカ人男性の75%以上が有しており、14ヶ所の領域では、ECH は50%以上の非アフリカ人が有しています。後者の一式は14ヶ所の最も極端な領域と呼ばれます。ECHは高頻度の派生的多様体のより高い割合により特徴づけられており、これは各EHCが最近単一の最初のハプロタイプから発生した場合に予測されます。
次に、各EHCが見られる染色体領域のハプロタイプ構造が視覚化され、ECHのない領域と比較されました。図3Aは最も拡張されて最高頻度のEHCの中核的な900kbの領域を示しており、非参照一塩基多型(Single Nucleotide Polymorphism、略してSNP)は黒い座標制御点として図示され、個々の半数体のX染色体は算術平均での非加重結合法(unweighted pair group method with arithmetic mean、略してUPGMA)によりクラスタ化します(まとまります)。以下は本論文の図3です。
すべての非アフリカ人のX染色体はアフリカ人のX染色体と比較してひじょうに減少した多様性で単一のクレードを形成し、単一の祖先的ハプロタイプが非アフリカ人において高頻度に上昇した、と示唆されます。この事例では、EHCは少なくとも1.8Mbにまたがります。残りのECHのハプロタイプ構造は同じパターンを示しており、1つのハプロタイプ(および一部の事例では2つのハプロタイプ)は、非アフリカ系人のX染色体の大規模な部分集合により共有されています。比較のため、図3BはECHが見られない典型的な900kbの領域を示しています。ここでは、非アフリカ人のハプロタイプが単一のクレードを形成せず、それは、より多くのアフリカ人のX染色体の多様性が非アフリカ人で表れているからです。
●ウスチイシム個体に先行するECH頻度の上昇
45000(46880~43210)年前頃のウスチイシム個体が含められ、これらの頻度変化がいつ起きたのか、さらに推定されました。男性のウスチイシム個体はヨーロッパ人とアジア人に均等に関連しており【現代人ではヨーロッパよりもアジア東部の方に近い、との見解(関連記事)もあります】、この系統がヨーロッパとアジアの人口集団の分岐の前に分岐し、現代人の多様性には直接的に寄与しなかった、と示唆されます。ハプロタイプ頻度が主要な出アフリカ事象の直後に上昇したならば、ウスチイシム個体が現在の非アフリカ人と同じようにECHを有している、と予測できます。
これを調べるため、ウスチイシム個体を含めて本論文ECH発見手順が繰り返されました。ウスチイシム個体14個の最高頻度のECHのうち6個を共有していました。古代人の配列において偽陽性のSNP呼び出しに堅牢な代替的手法を用いて、図4の各最高点に集中している500kb解析単位のハプロタイプ図示にウスチイシム個体が追加されました。ウスチイシム個体は14ヶ所の最も極端な領域のうち9ヶ所でECHのクラスタ内に収まり、現在の非アフリカ人の平均9.7に近くなります。ウスチイシム個体が有しているこの類似の数から、ECHのほとんどはすでに45000年前頃には高頻度に上昇していた、と示唆されます。以下は本論文の図4です。
●自然選択なしでのECH観察の確率推定
本論文の観察から、ECHは出アフリカ事象(8万~6万年前頃)後ではあるものの、ウスチイシム個体が生きていた(45000年前頃)前には単一のハプロタイプから高頻度に上昇した、と示唆されます。そうした永井ハプロタイプの頻度におけるこの急速な変化は著しく、強い正の選択の特徴です。しかし、とくに極端な人口ボトルネック(瓶首効果)機関の遺伝的浮動も、長いハプロタイプの頻度増加を引き起こす可能性があり、X染色体はそのより小さな有効人口規模(Ne)のためにボトルネックの影響をより強く受けます。
第一に、遺伝的浮動の単純な頻度模擬実験が実行され、中立進化下でのハプロタイプ観察の確率が評価されました。頻度の軌跡が模擬実験され、染色体全域にわたって、1個のハプロタイプがウスチイシム個体の45000年前頃と、6万年前頃という予測される最大のECH分岐との間の期間に遺伝的浮動により高頻度に上昇する確率が計算されました。模擬実験では500kbのハプロタイプが想定されましたが、ほとんどのECHはそれより長くなります。さまざまなシナリオを網羅するため、5000年と10000年と15000年と20000年と25000年の期間について模擬実験が実行されました。本論文の模擬実験に適切なボトルネックNeを見つけるため、SMC++を用いて、本論文の分析で用いられた非アフリカ人の人口動態が推定されました。この結果から、ボトルネックの最低の常染色体Neは4125と推定されました。
本論文の模擬実験では、控えめに3000の常染色体Neが想定され、比較のため、1500のより可能性が低い常染色体Neが含められました。有効人口規模の2つの異なるX染色体と常染色体の比率について模擬実験が実行されました。0.65の比率は本論文のデータセットではアフリカ人個体群の中央値比に、より低い0.51の比率は非アフリカ人の中央値比に相当します。後者の推定は、男性主導の移住に起因するかもしれませんが、上述のように、ECHにおける多様性喪失によっても低下するかもしれません。3000の常染色体Neでは、2つのX染色体と常染色体の比率が、X染色体のNeでは1950と975に相当します(図5)。さらに女性のX染色体の組換え率が1.16e−8と仮定されます。媒介変数の各組み合わせについて50万回の模擬実験が実行されます。以下は本論文の図5です。
模擬実験は図5に要約されており、「A」は染色体に沿って少なくとも500kbのハプロタイプが特定の期間において特定の頻度に上昇する確率を表します。現実的な媒介変数である5000~15000年の期間と常染色体ボトルネック人口規模3000を仮定すると、浮動が低頻度のECHをもたらす可能性がある一方で、各高頻度ECHがもたらされる確率はきょくたんに低い、と分かりました。図5Bは、それぞれで起きる頻度における全ての特定されたECHの観察の同時確率を定量化しています。各点は、より低い頻度における全ての観察されたECHとともに、その頻度における観察されたECHの同時確率を表しています。したがって、各面の右端点は全ての観察されたECHの同時確率を示します。
上述の媒介変数の範囲については、観察されたECHが中立的に上昇した可能性はきょくたんに低そうです。灰色と黒色の点は、1500の常染色体人口規模の確率を示します。この非現実的に低い常染色体人口規模でさえ、有効な時間は全ての観察されたECHを説明するには遺伝的浮動について、非現実的な長さ(20000~25000年)である必要があります。追加の証拠を用いて、5000~15000年の期間のみが現実的である理由は後述されます。これは、中立的過程のみが観察されたECHを引き起こした可能性はひじょうに低い、と示します。
第二に、刊行された人口動態と組換え図を用いて、完全なX染色体の順方向模擬実験が実行されました。SGDPのデータはひじょうに広範な人口構造と模擬実験にあまり適していない人口統計から得られたので、本論文のモデル人口集団として、1000人ゲノムから均質なCEU人口集団(ヨーロッパ北部および西部祖先系統を有するアメリカ合衆国ユタ州住民)が選択されました。CEU人口集団で推測手順が繰り返され、その後で順方向模擬実験が実行され、この人口集団で呼び出されたECHが遺伝的浮動の産物だった確率が評価されました。
CEUの男性49個体のX染色体でのECHの推測では、この単一の均質な人口集団からの大規模な標本が、ひじょうに構造化されたSGDPよりも最近の共通祖先を見つけることがずっと多いだろう、と考慮する必要があります。この寄与をそうした初期合着(合祖)のクレード規模に調節するため、本論文の主要な分析で用いられたECHのクレード規模が25%から50%に増加されました。このクレード規模を用いての推測は、SGDP の男性で同定された19のECH最高点のうち15を再現します。
CEU人口集団では、ECHは合わせて染色体全体の10%を網羅し、SGDPデータセットで観察された11%と類似しています。SLiM3を用いて実行された過去20万世代のその後の順方向模擬実験では、本論文が把握している限りでは最強のボトルネックを推定する、以前に刊行されたCEU人口規模の軌跡が用いられます。その模擬実験は、X染色体の詳細な規模での家系図に基づく組換え図も使用します。上述の頻度模擬実験で用いられた、同じX染色体と常染色体のNe比(0.51と0.65)を使用して、模擬実験が実行されました。
男性49個体のX染色体の500回の模擬実験で、ECHが呼び出され、全ての模擬実験された染色体全体で100kb配列解析単位の分析された割合がECHを呼び出した、X染色体の分析された割合が計算されました。アフリカ人のX染色体と常染色体の比率0.65を想定すると、これら2つの割合は0.3%(0~2%)と0.2%(0~1.2%)です(間隔は全染色体模擬実験で2.5番目と97.5番目の百分位数です)。代わりに、より低い非アフリカ人のX染色体と常染色体の比率0.51(部分的には一掃に起因してより低いのでしょう)を想定すると、その数は1.1%(0~4%)と0.7%(0~2.5%)です。
CEUの49個体標本の本論文の分析では、これら2つの割合がより大きくなる、と分かりました(11.1%と7.6%)。CEU人口集団におけるこの2つの割合も模擬実験で得られた割合の97.5番目の百分位数の2.8倍と3倍であることをさらに考えると(図6)、ECHがCEU人口集団において中立的に上昇した可能性はきょくたんに低そうです。SGDPの男性データセットの分析により明らかにされたように、そうしたECHウスチイシム個体の生存した45000年前頃以前に中立的に上昇した可能性はさらに低そうです。以下は本論文の図6です。
●X染色体の選択的一掃が繰り返された可能性
ヒトとチンパンジーの祖先において、選択的一掃の証拠が以前に報告されました。したがって、これらが本論文で報告されたECH領域の独立した観察と重複するのかどうか、検証されました。その結果、図4の橙色の塊で示される、ヒトとチンパンジーおよびヒトとゴリラの種分化事象(関連記事)を分離した200万~400万年間に少なくとも1回の、ECHと染色体の一掃区画との間で強い重複が見つかりました。
●選択的一掃によるX染色体の古代型の遺伝子移入配列の置換
主要な出アフリカ事象に続いた古代型のヒトとの混合は、X染色体において常染色体よりもずっと低い割合の遺伝子移入された配列を残しました。したがって、非アフリカ系人口集団では、ネアンデルタール人に由来する構成要素は常染色体の1.4%と比較してわずか0.3%です。種区分未定のホモ属であるデニソワ人(Denisovan)との混合はX染色体において実質的に存在せず、オセアニア人のみ低い割合(0.18%)で有しています(関連記事)。
古代型の混合と検出された選択的一掃との間の関係を調べるため、hmmixが適用され、各非アフリカ人男性のX染色体における古代型のヒトの祖先系統のゲノム断片が呼び出されました。この手法は隠れマルコフモデルを用いて、アフリカ人のゲノムの混合していない集団で観察されなかった派生的SNPのクラスタを探します。以前の報告(関連記事)における推測と比較して、本論文で適用された手法は、配列決定された古代型のゲノムで表されていない古代型の断片を特定できます。
個体全体の平均混合割合は0.8%と推定されます。しかし、シベリア南部のアルタイ山脈のデニソワ洞窟(Denisova Cave)で発見されたネアンデルタール人およびデニソワ人とクロアチアのヴィンディヤ洞窟(Vindija Cave)で発見されたネアンデルタール人から構成される、高網羅率の古代型のヒトのゲノムと共有される古代型断片に限定すると、以前の報告(関連記事)と類似した遺伝子移入された配列の割合(0.36%)が確認されます。
一部の個体がECHを有する100kbの解析単位(X染色体の11%)に分析を限定すると、古代型の割合は個体がECHを有さない解析単位での0.9%と比較して0.3%と観察されます。この現象がとくにECHにおける低水準の混合により起きたのかどうか調べるため、まずどの個体もECHを有している常染色体の100kbの解析単位の部分集合が抽出されました。これら各100kbの解析単位で、ECHとECHクレードの一部ではない同じ部位におけるハプロタイプの平均的な古代型との混合割合が計算されました。その結果、ECHは推定される古代型の混合がほぼ完全にない、と分かりました。対照的に、同じゲノム解析単位における残りのハプロタイプは、平均0.70%の混合割合で、その範囲は0.35~1.03%となり、地理的地域に依存します。この混合割合は、ECHと重複しない染色体領域における古代型の寄与に近くなっています。
したがって、この分析から、ECHにおける混合の欠如自体が、その出現する染色体領域における減少した古代型との混合を説明する、と明らかになります。ECH内では、平均的な古代型との混合割合は0.0045%で、同じ染色体解析単位における非ECHハプロタイプと比較して99%の減少に相当します。本論文での混合推定は低い偽陽性率と関連しているので、この割合は古代型との混合の完全な欠如と一致します。各地理的地域はECHにおける古代型との混合のこの欠如を示しているので(図7A)、各ECHの中核領域も同様です(図7B)。以下は本論文の図7です。
古代型の遺伝子移入は、現生人類の多様性に寄与しました。したがって、寄与した古代型の混合はECHの本論文の定義で要求された低い多様性と一致しなかっただけなので、ECHは混合を含まない、と誤って結論づける可能性があります。しかし、各個体で特定された混合断片をマスクした(隠した)後で本論文のECH推測を繰り返すと、依然としてECHは混合がないと分かるので、この潜在的な確認の偏りは除外されます。
●古代型の置換は正の選択をさらに裏づけます
ECHが古代型との混合を置換した一方で、その頻度上昇は、古代型からの寄与に対する選択浄化の結果ではないかもしれません。そうした負の選択が起きた可能性が最も高いものの(関連記事)、多くのハプロタイプではなく、単一の混合のないハプロタイプが急速に頻度上昇した理由を説明できません。対照的に、単一のハプロタイプが古代型との混合とは関連しない理由で正の選択下にあったならば、これが予測されるでしょう。したがって、この文脈では、古代型との混合は単に混合のないECHが見える背景として機能するだけです。
ECHが45000年前頃のウスチイシム個体でもネアンデルタール人との混合を置換した、との本論文の調査結果によりさらに、ECHの頻度上昇した期間を狭めることが可能となります。それは、一掃が混合事象とウスチイシム個体との間に必ず起きたに違いないからです。ウスチイシム個体におけるネアンデルタール人との混合断片の長さから、主要なネアンデルタール人との混合事象はウスチイシム個体の9599(13000~7000)年前頃と年代測定されました(関連記事)。この推定の信頼区間として4つの標準誤差を用いると、一掃は少なくとも3724年、最大で15341年の期間で起きたに違いない、と示唆されます。したがって、本論文の模擬実験に含まれる20000~25000年の間隔(図5)は、関連する媒介変数の範囲外に位置し、ECHが中立的過程から生じた可能性はさらに低下します。
●考察
本論文の分析から、合計で11%の長さになるX染色体の領域には長くて高頻度のハプロタイプ(ECH)があり、それはすべての非アフリカ系人口集団で共有されている、と示唆されます。これらのハプロタイプの頻度は出アフリカ事象とそれに続く古代型のヒトとの混合事象の後ですぐに上昇しました。これらの劇的な頻度変化は、45000年前頃のウスチイシム個体の時までに完全もしくはほぼ完全に完了していたようです。これらのハプロタイプの大きな規模は、頻度の急速な増加と一致し、遺伝的浮動の中立的過程と一致しません。本論文では、これらのハプロタイプは正の選択により頻度が増加したに違いない、と結論づけられます。驚くべきことに、ECHには完全に古代型との混合がなく、どのような多様体がその頻度上昇を促進したとしても、これらは古代型との混合なしにハプロタイプで発生した、と示唆されます。
特定されたECHのうち14個はそれぞれ、非アフリカ人の少なくとも50%では500kbから1.8Mbにまたがっています。最強の一掃は非アフリカ人の91%で900kbにまたがっており、1.8Mbの領域にわたって非アフリカ人の53%に影響を及ぼしています。比較すると、ヒト多様性データから報告された最強の選択的一掃はラクターゼ(乳糖分解酵素)遺伝子にあり、ヨーロッパ系アメリカ人の77%では800kbにまたがっています。原因となる多様体での選択係数は1.6~1.8%と推定されてきており、いくつかのECHと原因となる選択係数が1%をはるかに上回っていたかもしれない、と示唆されます。
マウスの精巣で減数分裂後の発現を示し、マウスとショウジョウバエにおいて性染色体の減数分裂分離比の歪み過程に関わる増幅遺伝子の役割が以前に示唆されました。しかし、ヒトの増幅領域は一掃領域と有意に近位であるものの、一般的に重複しません。ほとんどの個体により共有される各ECHの中核領域は、それぞれいくつかの遺伝子を含んでおり、あらゆる遺伝子概念体系で濃縮は検出されません。タンパク質をコードする遺伝子も、精巣での発言増加がある遺伝子の濃縮を示しません。しかし、1つの一掃は、精細胞形成と関連している単一のタンパク質コード遺伝子であるACTRT1をその中心に有しています。
現時点では、本論文の全ての観察を説明する可能性の高いシナリオを予想できません。選択的一掃が性染色体の減減数分裂分離比の歪みな起因するかもしれない、本論文は慎重に仮定します。X染色体とY染色体の精子の平均的に均等な伝達がX染色体とY染色体で歪みに対抗する動的平衡により維持されているならば、ボトルネックを経た主要な出アフリカ人口集団は、より初期の出アフリカ人口集団において維持された性染色体の歪みにより浸食されたかもしれません。この仮説は最近の証拠により間接的に裏づけられており、その証拠では、Y染色体ハプログループ(YHg)FTの急速な拡大はアジア東部/南東部に起源があり、アフリカからのその後の主要な拡散の波が有していたYHg系統を置換した、と示唆されています(関連記事)。ユーラシア全域でのY染色体の歪みの拡大は、同じ供給源人口集団から拡大したX染色体のハプロタイプに続いて、Y染色体の歪みにより浸食された人口集団における均等な減数分裂伝達が復元されたでしょう。
YHg-FTを有するウスチイシム個体の年代は、これらの事象を55000~45000年前頃の時間枠に位置づけ、その期間に一掃が起きた、と本論文は結論づけます。ECHのアジア起源とアフリカからの主要な拡散の波のその後の置換は、ECHがユーラシア西部におけるネアンデルタール人との混合だけではなく、アジアにおけるデニソワ人との混合も置換した、という本論文の観察とも一致します。この仮説が正しいならば、一掃領域はネアンデルタール人と混合していない初期の非アフリカ系人口集団から残ったハプロタイプのみを表しています。この仮説は、将来の研究の指針となる検証可能な予測を提供するでしょう。以下は本論文の要約図です。
どのような説明であれ、その説明はX染色体にとって特有だったに違いなく、おそらくは生殖能力もしくは減数分裂の正確さへの他の結果の形態においてだろう、と本論文は考えています。したがって本論文は、将来の研究が、おそらくは特定のYHgとの組み合わせで、本論文で報告されたECHの男性の生殖能力の結果の調査に焦点を当てることができる、と提案します。男性の生殖能力のデータとゲノム規模の配列決定もしくは遺伝子型決定のある大規模なコホートが、そうした研究ですぐに利用可能になるでしょう。
●この研究の限界
本論文のECHの推測の解像度は限定的で、それはECHが少なくとも500kbにまたがることを必要とするからです。この解像度では、一掃の原因となる候補遺伝子の精細なマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が可能ではなく、遺伝子概念体系濃縮を特定できません。別の限界は、SGDPデータセットが、非アフリカ人と比較して多様性のあるアフリカの人口集団に固有のECHを特定するのに充分なアフリカ人男性を含んでないことです。本論文の観察が中立的に起きたかもしれない確率の評価にも限界があります。
第一に、X染色体が正の選択により強く影響を受けているならば、X染色体の多様性からX染色体の動態を有意義に推定できません。したがって、X染色体と常染色体の比率により常染色体の動態を拡大縮小することにより、X染色体の動態の再構築が行なわれました。第二に、一掃が5000~15000年の期間に起きた、という推定は単一の高網羅率の古代人ゲノムに基づいています。この期間のより高網羅率の古代人のゲノムの利用可能性が、さらにこの間隔を狭めることができるでしょう。最後に、多くの選択的一掃の原因についての推測を裏づける直接的証拠を、本論文は提供できません。本論文で暫定的に提案された仮説は、さらに多くの調査で科学的に調査される必要があるでしょう。
参考文献:
Skov L. et al.(2023): Extraordinary selection on the human X chromosome associated with archaic admixture. Cell Genomics, 3, 3, 100274.
https://doi.org/10.1016/j.xgen.2023.100274
この記事へのコメント