ヒガシゴリラにおける未知の系統との混合
ヒガシゴリラ(Gorilla beringe)における未知の系統との混合の可能性を示した研究(Pawar et al., 2023)が公表されました。現生人類(Homo sapiens)とネアンデルタール人(Homo neanderthalensis)と種区分未定のホモ属であるデニソワ人(Denisovan)など、後期ホモ属の各系統間で複雑な混合があったことは、2010年代以降の古代ゲノム研究の飛躍的な進展により明らかにされてきました(関連記事)。本論文は、ヒガシゴリラ系統が遺伝学的に未知の系統、つまり亡霊(ゴースト)系統と混合していたことを示しています。こうした混合は、類人猿に限らず大型類人猿(ヒト科)さらには哺乳類でも珍しくなかったと考えられ、今後の研究の進展が期待されます。
●要約
古代の混合は、ネアンデルタール人やデニソワ人など絶滅人類から現生人類への混合を含めて、さまざまなクレード(単系統群)にわたる複数の事象を伴い、ヒトの進化にかなりの影響を及ぼしてきました。大型類人猿では、古代の混合がチンパンジー(Pan troglodytes)とボノボ(Pan paniscus)で確認されてきましたが、そうした事象の可能性は、他種では調べられてきませんでした。本論文は、以前には標本抽出されていなかった地理的地域の新たに配列決定されたヒガシゴリラ6個体を含めて、現生ゴリラ4亜種全てから得られた高網羅率の全ゲノム配列を用いて、この問題に取り組みます。
神経回路網での近似ベイズ計算を用いてのゴリラの人口動態史のモデル化により、古代の「亡霊」系統からニシゴリラではなくヒガシゴリラの共通祖先への混合の痕跡が見つかりました。これらの個体のゲノムの最大3%が、全ての現生ゴリラの共通祖先から300万年以上前に分岐した古代系統から遺伝子移入されている、と推測されます。この遺伝子移入事象は、マウンテンゴリラ(Gorilla beringei beringei)とヒガシローランドゴリラ(Gorilla beringei graueri)の分岐前、おそらくは4万年以上前に起きており、ヒガシゴリラにおける苦みの知覚に影響を及ぼしたかもしれません。ゴリラとヒトとボノボの遺伝子移入景観を比較すると、これらの種でX染色体上の遺伝子移入された断片の一貫した枯渇が見つかりました。しかし、タンパク質をコードする内容の枯渇はヒガシゴリラでは検出されず、恐らくはヒガシゴリラにおけるより強い遺伝的浮動の結果です。
●研究史
ゴリラは大型類人猿の一員で、ホモ属(ヒト)およびチンパンジー属(チンパンジーとボノボ)と姉妹クレードを形成します。現生ゴリラは認識されている4亜種で構成されており、2種に分類されます。それは、ニシローランドゴリラ(Gorilla gorilla gorilla)およびクロスリバーゴリラ(Gorilla gorilla diehli)のニシゴリラ種(Gorilla gorilla)と、ヒガシローランドゴリラ(Gorilla beringei graueri)およびマウンテンゴリラ(Gorilla beringei beringei)のヒガシゴリラ種です。全てのゴリラ亜種は、国際自然保護連合(International Union for Conservation of Nature、略してIUCN)の基準では絶滅危機もしくは絶滅寸前です。
ゴリラ亜種は、非連続的にアフリカ西部と東部に分布しています(図1a)。異なる亜種の現在の地理的範囲は、規模と連続性と生態系により異なっており、接続性と個体群規模に影響を及ぼします。ニシローランドゴリラはかなりの規模のほぼ連続した範囲に固有ですが、他の亜種はずっと断片的に分布してきました。同様に、ニシローランドゴリラはゴリラ亜種のうち最高の遺伝的多様性を示しており、長期の大きな有効個体群規模が示唆されますが、ヒガシゴリラの有効個体群規模はそれより小さくなっています。マウンテンゴリラは現在2ヶ所の別々の地域に隔離されており、それはヴィルンガ火山中央山塊(Virunga Volcanoes Massif)とブウィンディ原生国立公園(Bwindi Impenetrable National Park)です。ブウィンディ原生国立公園はヴィルンガ火山中央山塊より低い標高に位置しているので、より温暖です。以下は本論文の図1です。
ゴリラの人口動態史に関する先行研究は全亜種からの情報を組み込んでおらず、とくに東西のクレード間の分岐年代について決定的ではありませんでした。これは、恐らく広範に分布しているものの、進化研究において充分には検討されていない、標本抽出されていない系統からの遺伝子流動に起因するかもしれません。ゴリラにおけるそうした隠れた遺伝子移入事象の解明は、化石以外の古代DNAからは不可能ですが、現在の個体群からのゲノムデータを用いてそうした問題に取り組むことは可能です(関連記事)。
この問題に対処するため、ニシゴリラ28個体とヒガシゴリラ21個体の高網羅率の全ゲノム配列が使用されます。以前に刊行されたゲノムに加えて、ブウィンディ原生国立公園のマウンテンゴリラ5個体とツヒアベリム山(Mount Tshiaberimu)孤立した個体群のヒガシローランドゴリラ1個体のゲノムが配列されました。これら新たなゲノムは、ヒガシゴリラのゲノム多様性のより完全な代表に寄与します。既知のゴリラ4亜種全てを表すこの拡張データセットを用いて、ゴリラの人口動態史、とくに、標本抽出されていない古代型系統からの遺伝子流動として定義される、亡霊系統からの遺伝子移入との仮説が調べられます。チンパンジー属およびホモ属の姉妹分類群や多くの他種におけるかなりの影響を考えると、そうした亡霊系統からの遺伝子移入事象は、ゴリラに関する以前の人口動態モデルの不確実性の一部を説明できるかもしれません。近似ベイズ計算(approximate Bayesian computation、略してABC)手法を用いて、絶滅系統からヒガシゴリラの共通祖先への遺伝子移入の証拠が見つかり、この移入された遺伝物質の機能的影響の一部が特徴づけられます。
●ヒガシゴリラは2つの個体群クラスタを形成します
高網羅率(平均28.6倍)で、新たにヒガシゴリラ6個体が配列決定されました。先行研究の配列決定データの再処理後、49個体のデータセットが得られ、その内訳は、ニシローランドゴリラが27個体、クロスリバーゴリラが1個体、マウンテンゴリラが12個体、ヒガシローランドゴリラが9個体です。新たに配列決定された個体が同じ亜種の個体とクラスタ化する(まとまる)のか確認するため、主成分分析(principal component analysis、略してPCA)が実行されました。
第1主成分は以前に観察されたようにニシゴリラとヒガシゴリラを分離し、第2主成分はマウンテンゴリラをヒガシローランドゴリラと分離します(図1b)。孤立したツヒアベリム山の個体群の新たに配列決定された1個体は、他のヒガシローランドゴリラの分布内でクラスタ化するので(図1b)、この個体は、予測されたように、ヒガシローランドゴリラ亜種を表している、と考えられます。第3主成分はニシローランドゴリラ内の個体群階層化を反映していますが、第4主成分はヒガシゴリラを分離し、ヴィルンガ火山中央山塊とブウィンディ原生国立公園のマウンテンゴリラ2個体群は両極に位置し(図1c)、3.2%の分散を説明します。これは、先行研究とよく一致します。
●ABCモデル化はヒガシゴリラにおける亡霊系統を支持します
現生ゴリラの4亜種についての人口動態モデルを推測するため、チンパンジー属クレードにおける以前の実装に基づいて、窓表示要約統計と広範な模擬実験を使って、神経回路網に基づくABCモデル化戦略が用いられました。おもな改善は、現代人および古代人のABC研究で一般的に行なわれているように、情報をもたらす倭宇約統計の広範な実装です。
まず、先行研究に基づいて、4個体群について人口統計学的帰無モデルが確立されました。とくに、これらの研究のどれも全亜種から得られた全ゲノムデータを組み込んでいませんでしたが、本論文で推測された媒介変数は、先行研究とほぼ一貫しています。それにも関わらず、古代の個体群構造もしくは亡霊系統との混合など説明されていない人口統計学的事象が、とくに他の大型類人猿における証拠を考えると、媒介変数推定値に影響を及ぼすかもしれません。f₄統計と混合図での探索的分析は、亡霊系統との混合が個々の亜種のどれかで起きていたならば発生するだろう、ゴリラの4末端個体群間の非対称性を示しませんでした。しかし、これは、これらの手法で評価できない、ヒガシゴリラもしくはニシゴリラの共通祖先への亡霊系統からの混合の可能性を除外しません。
これを説明し、亡霊系統との混合が推測された帰無人口統計学的モデル(モデルA)を改善できるのかどうか明示的に検証するため、2通りのより複雑な人口統計学的モデルが検討され、そこではヒガシゴリラ(モデルB)およびニシゴリラ(モデルC)の共通祖先への「亡霊」系統からの遺伝子移入の可能性が追加されました。より広範な媒介変数空間を用いて、この亡霊モデルBおよびCの堅牢性が評価され、モデルの複雑さ増加を考えると予測されるように、より広範な信頼区間(confidence interval、略してCI)にも関わらず、モデルBおよびCでの観察と一貫した確率が得られました。これらのモデルの形式的比較が実行され、どれが実証的データに最適なのか、判断されました。モデルA(0.0027)およびC(0)、またかなり高いベイズ係数(374対、モデルAで0.0027、モデルCで0)と比較して、ヒガシゴリラの共通祖先への古代の遺伝子流動を伴うモデルBが最高の事後モデル確率0.9973を示しました。交差検証分析では、ヒガシゴリラへの古代の遺伝子移入を伴うモデルが、それなしのモデルと明確に区別されました。ヒガシゴリラの共通祖先への古代の遺伝子移入を伴うモデルが、実証的データで観察された要約統計を最適に説明する、と結論づけられます。
ヒガシゴリラはボトルネック(瓶首効果)を経ており、一般的にニシゴリラよりも有効個体群模が少ないものの、マウンテンゴリラとヒガシローランドゴリラは、先行研究で説明されているように、とくに強い個体数減少を経た、と推測されます。ヒガシゴリラ亜種は15000年前頃、95%信用区間(credible interval、略してCrI)では16000~14000年前頃に分岐した、と推測されます。先行研究と一致して、ニシローランドゴリラにおける4万年前頃の個体群拡大が見られます。本論文の帰無個体群動態モデルは、他のゴリラ個体群と比較してのニシゴリラについて大きな祖先の個体群規模(有効個体群規模、つまりNe=98135)と、ニシゴリラ亜種間の45400年前頃(95% CrIで456000~448000年前)を推測します。全ての要約統計がクロスリバーゴリラ(標本1点のみが利用可能でした)で計算できず、ゴリラの亜種間の遺伝流動がモデル化されなかったことを考えると、この分岐年代の信頼性が低いかもしれない可能性に要注意です。最後に、ゴリラは965000年前頃(95% CrIで1104000~729000年前)に2種へと分岐した、と推測され、これは以前の推定値より高い範囲内に収まります。
簡単にするため、現存の混合が1世代にわたる単一の移住の波動としてモデル化され、ヒガシゴリラの共通祖先からニシローランドゴリラへの0.80%(95% CrIで0.06~2.14%)の寄与と、ニシローランドゴリラからヒガシゴリラの共通祖先への0.27%(95% CrIで0.22~0.43%)の遺伝子流動の小さな寄与が見つかりました。古代の供給源からヒガシゴリラの共通祖先への2.74%の遺伝子流動の寄与が推測され、これは2.38~2.49%と狭い95% CrIです。この亡霊系統からの遺伝子流動の年代は、38281年前頃に起きたと推定されましたが、この媒介変数のCrIは広く(95% CrIで108000~22000年前)なっています(図2a・c)。以下は本論文の図2です。
対照的に、古代の遺伝子移入割合および現生ゴリラと亡霊系統の分岐年代の事後分布は狭いCrIで、これらの媒介変数について明確な頂点のある強い裏づけを示唆します(図2c)。対照的に、モデルCの本論文のABC分析は、ニシゴリラの共通祖先への深く分岐した外部系統の寄与を確実に推測しません。代わりに、このモデルの最適は、全ての現生ゴリラの共通祖先への110万年前頃となる外部系統からの寄与(95% CrIで0.09~0.4%)を示唆します。このわずかな寄与は、現生ゴリラと190万年前頃(95% CrIで300万~150万年前)に分岐した外部系統に由来する、と推測されます。
●ヒガシゴリラにおける亡霊系統からの遺伝子移入の景観
ヒガシゴリラの共通祖先への亡霊系統からの遺伝子移入というモデルが実証的データに最適と確証されたので、ヒガシゴリラのゲノムにおける推定される遺伝子移入断片の特定が目的とされました。亡霊系統からの遺伝子移入の景観を調べるため、2つの独立した手法が実装され、それはS*統計(高度に分岐したハプロタイプを検索する手法)とSkovHMM手法もしくはhmmixです。S*統計は特定の個体群統計学的モデル下で、遺伝子移入された部位として、外群と比較して高度に分岐した窓を検出します。したがって、S*手法は個体群統計学的モデルの利用可能性に依存します。対照的に、hmmixは個体群統計学的モデルに依拠せずに推定される遺伝子移入領域を特定しますが、代わりに、内群における推定変異の密度を用いて、ゲノムを「内部」と「外部」の断片に分割し、ゲノムに沿って1000塩基対(base pairs、略してbp)の小さな窓に入ります。したがって、S*統計とhmmixは亡霊系統からの遺伝子移入の同じ痕跡を対象としますが、その演算法は異なります。
亡霊系統からの遺伝子移入のないモデルAからの事後媒介変数推定値で、ヒガシゴリラについてS*得点の帰無分布が模擬実験されました。これにより、各窓における変異密度(分離部位の数)を考え、予測されるS*得点について99% CIを用いて、本論文の実証的データにおいて、あらゆる外れ値の窓の存在への洞察が得られました。じっさい、この閾値では、S*外れ値窓の過剰が特定され、これはヒガシゴリラの共通祖先への外部供給源からの遺伝子移入を示唆します。帰無予測外となる窓は平均して、ヒガシローランドゴリラのゲノムの1.64%、マウンテンゴリラのゲノムの2.36%を構成します。
遺伝子移入された断片を追跡できる合着(合祖)模擬実験を用いて、S*統計の性能が評価されました。その制度と再現率は高く、現生人類とネアンデルタール人の遺伝子移入シナリオと比較して、99%分位におけるヒガシローランドゴリラの真の遺伝子移入された断片の検出率は90.96%(マウンテンゴリラでは91.06%)でした。帰無個体群統計学的モデルのCrIには、S*得点の予測分布に影響を及ぼすかもしれない不完全な系統分類の割合につながるだろう、より大きな有効個体群規模が含まれているので、これらの媒介変数が本論文の調査結果にどのように影響を及ぼすのかも、評価されました。95%CrI内の最大値を用いて、S*統計の再現率は高いままだったものの、制度はヒガシローランドゴリラでは55.82%(マウンテンゴリラでは53.33%)に低下すると分か、予測されたように、偽発見の増加を反映しています。S*統計は、帰無モデルの誤特定を仮定した場合でさえ、本論文の帰無モデル下において遺伝子移入された断片の研究には良好に機能する、と結論づけられます。
先行研究と同様に、hmmixも用いて、遺伝子移入された窓が検出され、これは特定の個体群統計学的モデルでよく機能し、精度と再現率は80%をはるかに上回りました。ヒガシゴリラへの亡霊系統からの混合への強い裏づけを考慮して再び、ニシローランドゴリラが外群として、ヒガシゴリラが内群として用いられました。その結果、個々のヒガシゴリラのゲノムは、41000~37000年前頃の推定遺伝子移入年代で、平均確率0.95の厳密な閾値で外部のものとして推定される、と分かりました。
ヒガシゴリラ種全体で推定される遺伝子移入領域の共有が観察されますが、共有は各亜種内でより高く、これもヒガシローランドゴリラにおいてよりもマウンテンゴリラの方でより顕著です(図3a)。これは、推定される遺伝子移入された領域のほとんどが、固定されているのではなく分離していることを示唆します。無作為領域と比較して、ヒガシゴリラの推定される遺伝子移入された領域におけるヒガシゴリラとニシゴリラとの間の、対でのヌクレオチドの違いが増加しています(図3b)。同様に、推定される遺伝子移入された領域におけるヒガシゴリラ亜種の個体間のヌクレオチドの違いの過剰があり、これらの領域の古代の遺伝子移入の起源を示唆してます(図3b)。以下は本論文の図3です。
各個体内の常染色体hmmix断片とS*外れ値の重複は平均して、ヒガシローランドゴリラでは42%、マウンテンゴリラでは51%です。基準を満たした無作為のゲノム領域については、観察された重複は平均して、ヒガシローランドゴリラでは6%、マウンテンゴリラでは8%となり、両手法(hmmixとS*統計)は大規模な程度で同じ領域を検出する、と示唆されます(図3c)。したがって、hmmixと外れ値とS*外れ値の交差の領域は、高い信頼性の推定遺伝子移入領域とみなされます。両手法(hmmixとS*統計)間の重複は両手法についてより多くの緩い切断、つまり少なくとも4万塩基対のhmmix断片と95%CIのS*外れ値を用いると、ヒガシローランドゴリラでは59%、マウンテンゴリラでは68%に増加します。ツリマソ(Turimaso)の個体を除いてマウンテンゴリラは一貫して、ヒガシローランドゴリラの場合よりも、両手法(hmmixとS*統計)の重複塩基対の高い割合を示します。
●選択と遺伝子移入の相互作用
ヒトやボノボで特定された古代の遺伝子移入領域とは対照的に、ヒガシゴリラの推定される遺伝子移入された領域は、無作為のゲノム領域と比較して、遺伝子含有量が大幅には減少していません(図3d)。しかし、遺伝子移入断片で枯渇している500万塩基対以上の常染色体断片の1億2700万塩基対見つかりました(図4)。さらに、現代人およびボノボ(関連記事)での観察に匹敵する規模で、X染色体での古代型断片における枯渇の兆候が観察されます(図3f)。
ヒガシローランドゴリラの推定される遺伝子移入領域は、GERP得点により推定されるように、マウンテンゴリラの場合よりも枯渇の可能性のある部位の割合がわずかに高くなっています(図3e)。しかし、変異保存の代替得点(SIFTとPolyPhen-2とLINSIGHT)下では、ヒガシゴリラ両亜種の推定される遺伝子移入領域は無作為な予測に従います。他の研究から得られた、ゴリラの定義された調節要素注釈付けの分布も調べられました。本論文では、分類と個体群全体で、無作為領域と比較して、マウンテンゴリラの遺伝子移入領域における強い転写促進因子(strong enhancer、略してsE)の過剰のみが観察されます。これらはおもに遺伝子内転写促進因子で、これは霊長類のsEで観察された調節構造のパターンと一致します。以下は本論文の図4です。
遺伝子移入された断片には有益なアレル(対立遺伝子)が含まれているかもしれず、ヒガシゴリラ内の適応的な遺伝子移入の痕跡を探すため、VolcanoFinder手法が適用されました。VolcanoFinderは、遺伝子移入されたアレルの周辺の選択的一掃と一致する、歪んだ局所的部位頻度範囲の兆候について、ゲノムを細かく調べます。上記の特定された推定遺伝子移入領域内でのVolcanoFinder手法の外れ値(95%複合尤度比)は、適応的遺伝子移入の推定対象とみなされました。適応的遺伝子移入について7ヶ所の候補領域が特定され、そのうち3ヶ所はヒガシローランドゴリラとマウンテンゴリラの間で共有されています。VolcanoFinderにおける最高の尤度比(likelihood ratio、略してLR)のある領域(12番染色体)には、苦み受容体TAS2R14遺伝子が含まれており、その内部では、いくつかのタンパク質コード化の変化が見つかりました。
●考察
本論文は、ゴリラのゲノムのこれまでで最も包括的なデータセットを活用して、全ての現生ゴリラ4亜種の代表から推測された個体群統計学的モデルと、拡張系図データ(関連記事)から得られたゴリラの変異率についての改善された推定値を提示します。ブウィンディ原生国立公園のマウンテンゴリラの新たに配列決定された全ゲノムは、ヴィルンガ火山中央山塊のマウンテンゴリラと遺伝的に近いものの、その亜種内では明確なクラスタを形成し(図1b・c)、マイクロサテライト(数塩基の単位配列の繰り返しから構成される反復配列)データから得られた以前の結果を確証します。
本論文のデータセットで表されているように、ヒガシローランドゴリラは遺伝的にさほど分化していない個体群を形成しているようで、これにはツヒアベリム山の個体も含まれます。それにも関わらず、倫理的および物流上の制約を考えると、高品質の侵襲的標本は絶滅危険種ではひじょうに制限されているので、標本規模は限定的なままです。ゴリラの進化史と個体群構造のより詳細な分析には、より考古都度の標本抽出が必要で、それは非侵襲的標本の使用における使用における発展を通じてのみ可能となるでしょう。たとえば、接続の最近のパターンの再構築は、チンパンジーの糞便標本の大規模なパネルから論証されてきました。さらに、過去数世紀にわたる大型類人猿個体数の急速な減少を考慮すると、歴史的標本からのより時間的な標本抽出が、経時的に失われた変異に関して多くの情報をもたらすかもしれません。
個体群統計学的媒介変数の以前の推定値は、モデル手法と入力データにより大きく異なりました。本論文で提示されたABC手法は、個体群ごとの要約統計を活用します。しかし、高網羅率で個体群水準のゲノムはクロスリバーゴリラでは現在利用できないので、クロスリバーゴリラについては統計の部分集合を、得られず、計算された統計は比較的情報量が少ないかもしれません(たとえば、分離部位の数)。他の全ての個体群については、複数個体が含まれており、要約統計においてその多様性のより適切な代表となります。そのため、クロスリバーゴリラを含む媒介変数では、ニシローランドゴリラとクロスリバーゴリラの分岐の推定年代の幅が比較的大きいなど、信頼性がより低くなります。この分岐時間は、より最近の種分岐の時間も推測した先行研究とで推定された26%と比較して、ヒガシゴリラとニシゴリラの分岐の47%を表しています。この違いが、高水準の個体群構造を有すると知られているニシローランドゴリラをより多く含めたことに起因するかもしれないことに、要注意です。本論文では、モデル化の媒介変数として、分岐推定値を減少させるだろう、ニシローランドゴリラとクロスリバーゴリラとの間の遺伝子流動も含めていません。
両種(ニシゴリラとヒガシゴリラ)間の推定された深い分岐は以前の推定値の上限にあり、帰無モデル下では推定される遺伝子移入された窓の検出に慎重で、それは、より大きなS*得点が分離部位の数の増加によりもたらされる、と予測されるからです。じっさい、大きな分岐時間のある近似個体群統計学的モデルでさえ、対象の個体群への外部からの遺伝子流動の検出が可能です。S*統計は、真の個体群動態が祖先の有効個体群規模の観点で逸脱していた場合でさえ、本論文で推測された帰無モデル(モデルA)下の遺伝子移入の検出において良好に機能した、と本論文は論証します。
本論文で提示された個体群統計学的モデル化は、ヒガシゴリラの共通祖先への標本抽出されていない「亡霊」系統からの古代の遺伝子移入を含む、ゴリラの個体群動態について最適なモデルを見出だします。これは、ヒト(関連記事)やボノボ(関連記事)や他種における絶滅系統からの遺伝子移入の蔓延に関する文献の増加や、恐らく例外的ではなく一般的である標本抽出されていない系統からの混合の影響を示す、理論的予測および模擬実験と一致します。
広範な模擬実験を用いて、そうした亡霊系統との混合無の帰無モデルもしくはニシゴリラにおけるそうした事象のモデルと比較して、ヒガシゴリラへの古代の混合を含むモデルへの強い裏づけが見つかりました。後者は、推定された外部からの遺伝子流動のより浅い時間と少ない量を考えると、ゴリラ内の深い下部構造のモデルと類似している、とむしろ考えられるかもしれません。しかし、さらなる亡霊系統からの遺伝子移入事象が、本論文の記載を超えて存在する可能性に要注意で、たとえば、ゴリラへの亡霊系統との混合のずっと少ない量に関してや、亡霊系統のより浅い分岐時間の場合や、ニシゴリラとヒガシゴリラにおけるより大きな有効個体群規模の状況においてです。
本論文の亡霊系統からの遺伝子移入の2.47%という推定は、事後分布が事前分布とよく区別されているので、高い信頼性と関連しています(図2c)。この推定値は、S*統計とhmmixを用いて推定された、個体ごとのゲノム規模の遺伝子移入の割合の推定値とよく一致します。本論文はおそらく、古代の遺伝子移入の時間を過小評価しており、それは、より短い遺伝子移入断片は見過ごされる可能性がより高く、別の潜在的な複雑さがヒガシゴリラでは、ハプロタイプの長さの増加につながる比較的高水準の同型接合性だからです。S*およびhmmix両手法で推測された外れ値の重複としての、推定遺伝子移入領域の特定は、比較的高い偽陽性率を考えると、控えめで、これらの手法で予測される程度です。それにも関わらず、これらの手法は現時点で、供給源のゲノムを利用できずに、非ヒト種の比較的小さなデータセットにおいて遺伝子移入された断片を検出するのに利用可能な唯一の手法です。
推定された遺伝子移入領域のより高い共有度は、ヒガシローランドゴリラよりもマウンテンゴリラで観察されます。これは、これらの個体群のより小さな有効個体群規模と一致し、遺伝子移入された遺伝的変異の浮動の影響を増加させます。高水準の遺伝的浮動と自然選択の有効性現象も、ヒトとボノボの遺伝子移入での観察とは対照的に、おそらくは遺伝子移入された領域における遺伝子量の検出可能な枯渇の欠如を説明します。同様に、おそらくは遺伝的浮動に起因する、さまざまな測定基準にわたるゴリラの遺伝子移入における変異耐性の一貫した痕跡は観察されません。
それにも関わらず、いくつかの「遺伝子移入砂漠」が見つかりました。この「遺伝子移入砂漠」は、おそらく遺伝子移入が起きた直後の浄化選択の結果として、個体群において遺伝子移入の枯渇した領域です(図4)。さらに、ヒト(関連記事)とボノボ(関連記事)でも見られたように、X染色体での遺伝子移入の減少が観察されました。これは恐らく、多分複数の要因との組み合わせの結果としてヒト(関連記事)や他種で見られたように、遺伝子移入された変異に対する強い所化選択の結果です。ゴリラの雄の偏った拡散パターンと高い繁殖の歪みが、遺伝子移入における雄の半数体X染色体のさらなる減少につながったのかもしれません。反証観察されたパターンは恐らくこれらの要因の組み合わせですが、現時点では各要因を識別できません。
推定される適応的な遺伝子移入対象としてのS*とhmmixとVolcanoFinderという異なる3手法の外れ値の交差として、本論文の適応的な遺伝子移入の対象の定義がひじょうに控えめであることに要注意です。しかし本論文では、控えめであることで、VolcanoFinder手法の騎士の注意点と知られている偽陽性の可能性の影響を最小限に抑えることが目的とされます。しかし現時点では、これは供給源のゲノムなしに適応的な遺伝子移入の痕跡の位置を特定するのに利用可能な唯一の手法です。興味深いことに、3個の候補遺伝子には、ヒガシゴリラでは分離され、ニシゴリラでは祖先で固定された推定される機能的多様体が含まれます。
これらの遺伝子のうち一つはTAS2R14で、これは苦みの知覚に関わる味覚受容体をコードしており、6ヶ所のミスセンス多様体(アミノ酸が変わるような変異)が含まれます。ヒガシゴリラは通常、果実を常食とするニシゴリラよりも草本食性で、そのためヒガシゴリラでは味覚受容体は適応的な遺伝子移入の可能性が高いのでしょう。味覚受容体は、TAS2R14を包含する領域を含めて、ニシローランドゴリラにおいて同様に最近の正の選択の対象として提案されてきました。同じ領域の異なる変異が、異なる種で選択下にあったのかもしれません。これは、毒性回避という味覚受容体の本質的な役割の観点で解釈できるかもしれません。
SEMA5A遺伝子にはミスセンス多様体とスプライス領域が含まれており、この遺伝子は神経発達と関連し、自閉スペクトラム症との関連が示唆されています。しかし、ゴリラにおけるこれらの多様体の機能的影響は、将来のさらなる研究が必要です。本論文では、ヒトと他種で観察された高地適応への適応的な遺伝子移入の寄与は見つかりませんでした。高地のマウンテンゴリラとヒガシローランドゴリラでは、この適応は口腔微生物叢など微生物恐らくさまざまな機序により引き起こされています。
結論として、本論文はヒガシゴリラの進化史の理解への解像度向上に寄与します。個体全体で、絶滅系統の常染色体ゲノムの推定16.4%が回収され、現在の個体群に存在する変異の分析を通じて標本抽出されていない今では絶滅した系統を解明する、文献の増加に追加されます。
参考文献:
Pawar H. et al.(2023): Ghost admixture in eastern gorillas. Nature Ecology & Evolution, 7, 9, 1503–1514.
https://doi.org/10.1038/s41559-023-02145-2
●要約
古代の混合は、ネアンデルタール人やデニソワ人など絶滅人類から現生人類への混合を含めて、さまざまなクレード(単系統群)にわたる複数の事象を伴い、ヒトの進化にかなりの影響を及ぼしてきました。大型類人猿では、古代の混合がチンパンジー(Pan troglodytes)とボノボ(Pan paniscus)で確認されてきましたが、そうした事象の可能性は、他種では調べられてきませんでした。本論文は、以前には標本抽出されていなかった地理的地域の新たに配列決定されたヒガシゴリラ6個体を含めて、現生ゴリラ4亜種全てから得られた高網羅率の全ゲノム配列を用いて、この問題に取り組みます。
神経回路網での近似ベイズ計算を用いてのゴリラの人口動態史のモデル化により、古代の「亡霊」系統からニシゴリラではなくヒガシゴリラの共通祖先への混合の痕跡が見つかりました。これらの個体のゲノムの最大3%が、全ての現生ゴリラの共通祖先から300万年以上前に分岐した古代系統から遺伝子移入されている、と推測されます。この遺伝子移入事象は、マウンテンゴリラ(Gorilla beringei beringei)とヒガシローランドゴリラ(Gorilla beringei graueri)の分岐前、おそらくは4万年以上前に起きており、ヒガシゴリラにおける苦みの知覚に影響を及ぼしたかもしれません。ゴリラとヒトとボノボの遺伝子移入景観を比較すると、これらの種でX染色体上の遺伝子移入された断片の一貫した枯渇が見つかりました。しかし、タンパク質をコードする内容の枯渇はヒガシゴリラでは検出されず、恐らくはヒガシゴリラにおけるより強い遺伝的浮動の結果です。
●研究史
ゴリラは大型類人猿の一員で、ホモ属(ヒト)およびチンパンジー属(チンパンジーとボノボ)と姉妹クレードを形成します。現生ゴリラは認識されている4亜種で構成されており、2種に分類されます。それは、ニシローランドゴリラ(Gorilla gorilla gorilla)およびクロスリバーゴリラ(Gorilla gorilla diehli)のニシゴリラ種(Gorilla gorilla)と、ヒガシローランドゴリラ(Gorilla beringei graueri)およびマウンテンゴリラ(Gorilla beringei beringei)のヒガシゴリラ種です。全てのゴリラ亜種は、国際自然保護連合(International Union for Conservation of Nature、略してIUCN)の基準では絶滅危機もしくは絶滅寸前です。
ゴリラ亜種は、非連続的にアフリカ西部と東部に分布しています(図1a)。異なる亜種の現在の地理的範囲は、規模と連続性と生態系により異なっており、接続性と個体群規模に影響を及ぼします。ニシローランドゴリラはかなりの規模のほぼ連続した範囲に固有ですが、他の亜種はずっと断片的に分布してきました。同様に、ニシローランドゴリラはゴリラ亜種のうち最高の遺伝的多様性を示しており、長期の大きな有効個体群規模が示唆されますが、ヒガシゴリラの有効個体群規模はそれより小さくなっています。マウンテンゴリラは現在2ヶ所の別々の地域に隔離されており、それはヴィルンガ火山中央山塊(Virunga Volcanoes Massif)とブウィンディ原生国立公園(Bwindi Impenetrable National Park)です。ブウィンディ原生国立公園はヴィルンガ火山中央山塊より低い標高に位置しているので、より温暖です。以下は本論文の図1です。
ゴリラの人口動態史に関する先行研究は全亜種からの情報を組み込んでおらず、とくに東西のクレード間の分岐年代について決定的ではありませんでした。これは、恐らく広範に分布しているものの、進化研究において充分には検討されていない、標本抽出されていない系統からの遺伝子流動に起因するかもしれません。ゴリラにおけるそうした隠れた遺伝子移入事象の解明は、化石以外の古代DNAからは不可能ですが、現在の個体群からのゲノムデータを用いてそうした問題に取り組むことは可能です(関連記事)。
この問題に対処するため、ニシゴリラ28個体とヒガシゴリラ21個体の高網羅率の全ゲノム配列が使用されます。以前に刊行されたゲノムに加えて、ブウィンディ原生国立公園のマウンテンゴリラ5個体とツヒアベリム山(Mount Tshiaberimu)孤立した個体群のヒガシローランドゴリラ1個体のゲノムが配列されました。これら新たなゲノムは、ヒガシゴリラのゲノム多様性のより完全な代表に寄与します。既知のゴリラ4亜種全てを表すこの拡張データセットを用いて、ゴリラの人口動態史、とくに、標本抽出されていない古代型系統からの遺伝子流動として定義される、亡霊系統からの遺伝子移入との仮説が調べられます。チンパンジー属およびホモ属の姉妹分類群や多くの他種におけるかなりの影響を考えると、そうした亡霊系統からの遺伝子移入事象は、ゴリラに関する以前の人口動態モデルの不確実性の一部を説明できるかもしれません。近似ベイズ計算(approximate Bayesian computation、略してABC)手法を用いて、絶滅系統からヒガシゴリラの共通祖先への遺伝子移入の証拠が見つかり、この移入された遺伝物質の機能的影響の一部が特徴づけられます。
●ヒガシゴリラは2つの個体群クラスタを形成します
高網羅率(平均28.6倍)で、新たにヒガシゴリラ6個体が配列決定されました。先行研究の配列決定データの再処理後、49個体のデータセットが得られ、その内訳は、ニシローランドゴリラが27個体、クロスリバーゴリラが1個体、マウンテンゴリラが12個体、ヒガシローランドゴリラが9個体です。新たに配列決定された個体が同じ亜種の個体とクラスタ化する(まとまる)のか確認するため、主成分分析(principal component analysis、略してPCA)が実行されました。
第1主成分は以前に観察されたようにニシゴリラとヒガシゴリラを分離し、第2主成分はマウンテンゴリラをヒガシローランドゴリラと分離します(図1b)。孤立したツヒアベリム山の個体群の新たに配列決定された1個体は、他のヒガシローランドゴリラの分布内でクラスタ化するので(図1b)、この個体は、予測されたように、ヒガシローランドゴリラ亜種を表している、と考えられます。第3主成分はニシローランドゴリラ内の個体群階層化を反映していますが、第4主成分はヒガシゴリラを分離し、ヴィルンガ火山中央山塊とブウィンディ原生国立公園のマウンテンゴリラ2個体群は両極に位置し(図1c)、3.2%の分散を説明します。これは、先行研究とよく一致します。
●ABCモデル化はヒガシゴリラにおける亡霊系統を支持します
現生ゴリラの4亜種についての人口動態モデルを推測するため、チンパンジー属クレードにおける以前の実装に基づいて、窓表示要約統計と広範な模擬実験を使って、神経回路網に基づくABCモデル化戦略が用いられました。おもな改善は、現代人および古代人のABC研究で一般的に行なわれているように、情報をもたらす倭宇約統計の広範な実装です。
まず、先行研究に基づいて、4個体群について人口統計学的帰無モデルが確立されました。とくに、これらの研究のどれも全亜種から得られた全ゲノムデータを組み込んでいませんでしたが、本論文で推測された媒介変数は、先行研究とほぼ一貫しています。それにも関わらず、古代の個体群構造もしくは亡霊系統との混合など説明されていない人口統計学的事象が、とくに他の大型類人猿における証拠を考えると、媒介変数推定値に影響を及ぼすかもしれません。f₄統計と混合図での探索的分析は、亡霊系統との混合が個々の亜種のどれかで起きていたならば発生するだろう、ゴリラの4末端個体群間の非対称性を示しませんでした。しかし、これは、これらの手法で評価できない、ヒガシゴリラもしくはニシゴリラの共通祖先への亡霊系統からの混合の可能性を除外しません。
これを説明し、亡霊系統との混合が推測された帰無人口統計学的モデル(モデルA)を改善できるのかどうか明示的に検証するため、2通りのより複雑な人口統計学的モデルが検討され、そこではヒガシゴリラ(モデルB)およびニシゴリラ(モデルC)の共通祖先への「亡霊」系統からの遺伝子移入の可能性が追加されました。より広範な媒介変数空間を用いて、この亡霊モデルBおよびCの堅牢性が評価され、モデルの複雑さ増加を考えると予測されるように、より広範な信頼区間(confidence interval、略してCI)にも関わらず、モデルBおよびCでの観察と一貫した確率が得られました。これらのモデルの形式的比較が実行され、どれが実証的データに最適なのか、判断されました。モデルA(0.0027)およびC(0)、またかなり高いベイズ係数(374対、モデルAで0.0027、モデルCで0)と比較して、ヒガシゴリラの共通祖先への古代の遺伝子流動を伴うモデルBが最高の事後モデル確率0.9973を示しました。交差検証分析では、ヒガシゴリラへの古代の遺伝子移入を伴うモデルが、それなしのモデルと明確に区別されました。ヒガシゴリラの共通祖先への古代の遺伝子移入を伴うモデルが、実証的データで観察された要約統計を最適に説明する、と結論づけられます。
ヒガシゴリラはボトルネック(瓶首効果)を経ており、一般的にニシゴリラよりも有効個体群模が少ないものの、マウンテンゴリラとヒガシローランドゴリラは、先行研究で説明されているように、とくに強い個体数減少を経た、と推測されます。ヒガシゴリラ亜種は15000年前頃、95%信用区間(credible interval、略してCrI)では16000~14000年前頃に分岐した、と推測されます。先行研究と一致して、ニシローランドゴリラにおける4万年前頃の個体群拡大が見られます。本論文の帰無個体群動態モデルは、他のゴリラ個体群と比較してのニシゴリラについて大きな祖先の個体群規模(有効個体群規模、つまりNe=98135)と、ニシゴリラ亜種間の45400年前頃(95% CrIで456000~448000年前)を推測します。全ての要約統計がクロスリバーゴリラ(標本1点のみが利用可能でした)で計算できず、ゴリラの亜種間の遺伝流動がモデル化されなかったことを考えると、この分岐年代の信頼性が低いかもしれない可能性に要注意です。最後に、ゴリラは965000年前頃(95% CrIで1104000~729000年前)に2種へと分岐した、と推測され、これは以前の推定値より高い範囲内に収まります。
簡単にするため、現存の混合が1世代にわたる単一の移住の波動としてモデル化され、ヒガシゴリラの共通祖先からニシローランドゴリラへの0.80%(95% CrIで0.06~2.14%)の寄与と、ニシローランドゴリラからヒガシゴリラの共通祖先への0.27%(95% CrIで0.22~0.43%)の遺伝子流動の小さな寄与が見つかりました。古代の供給源からヒガシゴリラの共通祖先への2.74%の遺伝子流動の寄与が推測され、これは2.38~2.49%と狭い95% CrIです。この亡霊系統からの遺伝子流動の年代は、38281年前頃に起きたと推定されましたが、この媒介変数のCrIは広く(95% CrIで108000~22000年前)なっています(図2a・c)。以下は本論文の図2です。
対照的に、古代の遺伝子移入割合および現生ゴリラと亡霊系統の分岐年代の事後分布は狭いCrIで、これらの媒介変数について明確な頂点のある強い裏づけを示唆します(図2c)。対照的に、モデルCの本論文のABC分析は、ニシゴリラの共通祖先への深く分岐した外部系統の寄与を確実に推測しません。代わりに、このモデルの最適は、全ての現生ゴリラの共通祖先への110万年前頃となる外部系統からの寄与(95% CrIで0.09~0.4%)を示唆します。このわずかな寄与は、現生ゴリラと190万年前頃(95% CrIで300万~150万年前)に分岐した外部系統に由来する、と推測されます。
●ヒガシゴリラにおける亡霊系統からの遺伝子移入の景観
ヒガシゴリラの共通祖先への亡霊系統からの遺伝子移入というモデルが実証的データに最適と確証されたので、ヒガシゴリラのゲノムにおける推定される遺伝子移入断片の特定が目的とされました。亡霊系統からの遺伝子移入の景観を調べるため、2つの独立した手法が実装され、それはS*統計(高度に分岐したハプロタイプを検索する手法)とSkovHMM手法もしくはhmmixです。S*統計は特定の個体群統計学的モデル下で、遺伝子移入された部位として、外群と比較して高度に分岐した窓を検出します。したがって、S*手法は個体群統計学的モデルの利用可能性に依存します。対照的に、hmmixは個体群統計学的モデルに依拠せずに推定される遺伝子移入領域を特定しますが、代わりに、内群における推定変異の密度を用いて、ゲノムを「内部」と「外部」の断片に分割し、ゲノムに沿って1000塩基対(base pairs、略してbp)の小さな窓に入ります。したがって、S*統計とhmmixは亡霊系統からの遺伝子移入の同じ痕跡を対象としますが、その演算法は異なります。
亡霊系統からの遺伝子移入のないモデルAからの事後媒介変数推定値で、ヒガシゴリラについてS*得点の帰無分布が模擬実験されました。これにより、各窓における変異密度(分離部位の数)を考え、予測されるS*得点について99% CIを用いて、本論文の実証的データにおいて、あらゆる外れ値の窓の存在への洞察が得られました。じっさい、この閾値では、S*外れ値窓の過剰が特定され、これはヒガシゴリラの共通祖先への外部供給源からの遺伝子移入を示唆します。帰無予測外となる窓は平均して、ヒガシローランドゴリラのゲノムの1.64%、マウンテンゴリラのゲノムの2.36%を構成します。
遺伝子移入された断片を追跡できる合着(合祖)模擬実験を用いて、S*統計の性能が評価されました。その制度と再現率は高く、現生人類とネアンデルタール人の遺伝子移入シナリオと比較して、99%分位におけるヒガシローランドゴリラの真の遺伝子移入された断片の検出率は90.96%(マウンテンゴリラでは91.06%)でした。帰無個体群統計学的モデルのCrIには、S*得点の予測分布に影響を及ぼすかもしれない不完全な系統分類の割合につながるだろう、より大きな有効個体群規模が含まれているので、これらの媒介変数が本論文の調査結果にどのように影響を及ぼすのかも、評価されました。95%CrI内の最大値を用いて、S*統計の再現率は高いままだったものの、制度はヒガシローランドゴリラでは55.82%(マウンテンゴリラでは53.33%)に低下すると分か、予測されたように、偽発見の増加を反映しています。S*統計は、帰無モデルの誤特定を仮定した場合でさえ、本論文の帰無モデル下において遺伝子移入された断片の研究には良好に機能する、と結論づけられます。
先行研究と同様に、hmmixも用いて、遺伝子移入された窓が検出され、これは特定の個体群統計学的モデルでよく機能し、精度と再現率は80%をはるかに上回りました。ヒガシゴリラへの亡霊系統からの混合への強い裏づけを考慮して再び、ニシローランドゴリラが外群として、ヒガシゴリラが内群として用いられました。その結果、個々のヒガシゴリラのゲノムは、41000~37000年前頃の推定遺伝子移入年代で、平均確率0.95の厳密な閾値で外部のものとして推定される、と分かりました。
ヒガシゴリラ種全体で推定される遺伝子移入領域の共有が観察されますが、共有は各亜種内でより高く、これもヒガシローランドゴリラにおいてよりもマウンテンゴリラの方でより顕著です(図3a)。これは、推定される遺伝子移入された領域のほとんどが、固定されているのではなく分離していることを示唆します。無作為領域と比較して、ヒガシゴリラの推定される遺伝子移入された領域におけるヒガシゴリラとニシゴリラとの間の、対でのヌクレオチドの違いが増加しています(図3b)。同様に、推定される遺伝子移入された領域におけるヒガシゴリラ亜種の個体間のヌクレオチドの違いの過剰があり、これらの領域の古代の遺伝子移入の起源を示唆してます(図3b)。以下は本論文の図3です。
各個体内の常染色体hmmix断片とS*外れ値の重複は平均して、ヒガシローランドゴリラでは42%、マウンテンゴリラでは51%です。基準を満たした無作為のゲノム領域については、観察された重複は平均して、ヒガシローランドゴリラでは6%、マウンテンゴリラでは8%となり、両手法(hmmixとS*統計)は大規模な程度で同じ領域を検出する、と示唆されます(図3c)。したがって、hmmixと外れ値とS*外れ値の交差の領域は、高い信頼性の推定遺伝子移入領域とみなされます。両手法(hmmixとS*統計)間の重複は両手法についてより多くの緩い切断、つまり少なくとも4万塩基対のhmmix断片と95%CIのS*外れ値を用いると、ヒガシローランドゴリラでは59%、マウンテンゴリラでは68%に増加します。ツリマソ(Turimaso)の個体を除いてマウンテンゴリラは一貫して、ヒガシローランドゴリラの場合よりも、両手法(hmmixとS*統計)の重複塩基対の高い割合を示します。
●選択と遺伝子移入の相互作用
ヒトやボノボで特定された古代の遺伝子移入領域とは対照的に、ヒガシゴリラの推定される遺伝子移入された領域は、無作為のゲノム領域と比較して、遺伝子含有量が大幅には減少していません(図3d)。しかし、遺伝子移入断片で枯渇している500万塩基対以上の常染色体断片の1億2700万塩基対見つかりました(図4)。さらに、現代人およびボノボ(関連記事)での観察に匹敵する規模で、X染色体での古代型断片における枯渇の兆候が観察されます(図3f)。
ヒガシローランドゴリラの推定される遺伝子移入領域は、GERP得点により推定されるように、マウンテンゴリラの場合よりも枯渇の可能性のある部位の割合がわずかに高くなっています(図3e)。しかし、変異保存の代替得点(SIFTとPolyPhen-2とLINSIGHT)下では、ヒガシゴリラ両亜種の推定される遺伝子移入領域は無作為な予測に従います。他の研究から得られた、ゴリラの定義された調節要素注釈付けの分布も調べられました。本論文では、分類と個体群全体で、無作為領域と比較して、マウンテンゴリラの遺伝子移入領域における強い転写促進因子(strong enhancer、略してsE)の過剰のみが観察されます。これらはおもに遺伝子内転写促進因子で、これは霊長類のsEで観察された調節構造のパターンと一致します。以下は本論文の図4です。
遺伝子移入された断片には有益なアレル(対立遺伝子)が含まれているかもしれず、ヒガシゴリラ内の適応的な遺伝子移入の痕跡を探すため、VolcanoFinder手法が適用されました。VolcanoFinderは、遺伝子移入されたアレルの周辺の選択的一掃と一致する、歪んだ局所的部位頻度範囲の兆候について、ゲノムを細かく調べます。上記の特定された推定遺伝子移入領域内でのVolcanoFinder手法の外れ値(95%複合尤度比)は、適応的遺伝子移入の推定対象とみなされました。適応的遺伝子移入について7ヶ所の候補領域が特定され、そのうち3ヶ所はヒガシローランドゴリラとマウンテンゴリラの間で共有されています。VolcanoFinderにおける最高の尤度比(likelihood ratio、略してLR)のある領域(12番染色体)には、苦み受容体TAS2R14遺伝子が含まれており、その内部では、いくつかのタンパク質コード化の変化が見つかりました。
●考察
本論文は、ゴリラのゲノムのこれまでで最も包括的なデータセットを活用して、全ての現生ゴリラ4亜種の代表から推測された個体群統計学的モデルと、拡張系図データ(関連記事)から得られたゴリラの変異率についての改善された推定値を提示します。ブウィンディ原生国立公園のマウンテンゴリラの新たに配列決定された全ゲノムは、ヴィルンガ火山中央山塊のマウンテンゴリラと遺伝的に近いものの、その亜種内では明確なクラスタを形成し(図1b・c)、マイクロサテライト(数塩基の単位配列の繰り返しから構成される反復配列)データから得られた以前の結果を確証します。
本論文のデータセットで表されているように、ヒガシローランドゴリラは遺伝的にさほど分化していない個体群を形成しているようで、これにはツヒアベリム山の個体も含まれます。それにも関わらず、倫理的および物流上の制約を考えると、高品質の侵襲的標本は絶滅危険種ではひじょうに制限されているので、標本規模は限定的なままです。ゴリラの進化史と個体群構造のより詳細な分析には、より考古都度の標本抽出が必要で、それは非侵襲的標本の使用における使用における発展を通じてのみ可能となるでしょう。たとえば、接続の最近のパターンの再構築は、チンパンジーの糞便標本の大規模なパネルから論証されてきました。さらに、過去数世紀にわたる大型類人猿個体数の急速な減少を考慮すると、歴史的標本からのより時間的な標本抽出が、経時的に失われた変異に関して多くの情報をもたらすかもしれません。
個体群統計学的媒介変数の以前の推定値は、モデル手法と入力データにより大きく異なりました。本論文で提示されたABC手法は、個体群ごとの要約統計を活用します。しかし、高網羅率で個体群水準のゲノムはクロスリバーゴリラでは現在利用できないので、クロスリバーゴリラについては統計の部分集合を、得られず、計算された統計は比較的情報量が少ないかもしれません(たとえば、分離部位の数)。他の全ての個体群については、複数個体が含まれており、要約統計においてその多様性のより適切な代表となります。そのため、クロスリバーゴリラを含む媒介変数では、ニシローランドゴリラとクロスリバーゴリラの分岐の推定年代の幅が比較的大きいなど、信頼性がより低くなります。この分岐時間は、より最近の種分岐の時間も推測した先行研究とで推定された26%と比較して、ヒガシゴリラとニシゴリラの分岐の47%を表しています。この違いが、高水準の個体群構造を有すると知られているニシローランドゴリラをより多く含めたことに起因するかもしれないことに、要注意です。本論文では、モデル化の媒介変数として、分岐推定値を減少させるだろう、ニシローランドゴリラとクロスリバーゴリラとの間の遺伝子流動も含めていません。
両種(ニシゴリラとヒガシゴリラ)間の推定された深い分岐は以前の推定値の上限にあり、帰無モデル下では推定される遺伝子移入された窓の検出に慎重で、それは、より大きなS*得点が分離部位の数の増加によりもたらされる、と予測されるからです。じっさい、大きな分岐時間のある近似個体群統計学的モデルでさえ、対象の個体群への外部からの遺伝子流動の検出が可能です。S*統計は、真の個体群動態が祖先の有効個体群規模の観点で逸脱していた場合でさえ、本論文で推測された帰無モデル(モデルA)下の遺伝子移入の検出において良好に機能した、と本論文は論証します。
本論文で提示された個体群統計学的モデル化は、ヒガシゴリラの共通祖先への標本抽出されていない「亡霊」系統からの古代の遺伝子移入を含む、ゴリラの個体群動態について最適なモデルを見出だします。これは、ヒト(関連記事)やボノボ(関連記事)や他種における絶滅系統からの遺伝子移入の蔓延に関する文献の増加や、恐らく例外的ではなく一般的である標本抽出されていない系統からの混合の影響を示す、理論的予測および模擬実験と一致します。
広範な模擬実験を用いて、そうした亡霊系統との混合無の帰無モデルもしくはニシゴリラにおけるそうした事象のモデルと比較して、ヒガシゴリラへの古代の混合を含むモデルへの強い裏づけが見つかりました。後者は、推定された外部からの遺伝子流動のより浅い時間と少ない量を考えると、ゴリラ内の深い下部構造のモデルと類似している、とむしろ考えられるかもしれません。しかし、さらなる亡霊系統からの遺伝子移入事象が、本論文の記載を超えて存在する可能性に要注意で、たとえば、ゴリラへの亡霊系統との混合のずっと少ない量に関してや、亡霊系統のより浅い分岐時間の場合や、ニシゴリラとヒガシゴリラにおけるより大きな有効個体群規模の状況においてです。
本論文の亡霊系統からの遺伝子移入の2.47%という推定は、事後分布が事前分布とよく区別されているので、高い信頼性と関連しています(図2c)。この推定値は、S*統計とhmmixを用いて推定された、個体ごとのゲノム規模の遺伝子移入の割合の推定値とよく一致します。本論文はおそらく、古代の遺伝子移入の時間を過小評価しており、それは、より短い遺伝子移入断片は見過ごされる可能性がより高く、別の潜在的な複雑さがヒガシゴリラでは、ハプロタイプの長さの増加につながる比較的高水準の同型接合性だからです。S*およびhmmix両手法で推測された外れ値の重複としての、推定遺伝子移入領域の特定は、比較的高い偽陽性率を考えると、控えめで、これらの手法で予測される程度です。それにも関わらず、これらの手法は現時点で、供給源のゲノムを利用できずに、非ヒト種の比較的小さなデータセットにおいて遺伝子移入された断片を検出するのに利用可能な唯一の手法です。
推定された遺伝子移入領域のより高い共有度は、ヒガシローランドゴリラよりもマウンテンゴリラで観察されます。これは、これらの個体群のより小さな有効個体群規模と一致し、遺伝子移入された遺伝的変異の浮動の影響を増加させます。高水準の遺伝的浮動と自然選択の有効性現象も、ヒトとボノボの遺伝子移入での観察とは対照的に、おそらくは遺伝子移入された領域における遺伝子量の検出可能な枯渇の欠如を説明します。同様に、おそらくは遺伝的浮動に起因する、さまざまな測定基準にわたるゴリラの遺伝子移入における変異耐性の一貫した痕跡は観察されません。
それにも関わらず、いくつかの「遺伝子移入砂漠」が見つかりました。この「遺伝子移入砂漠」は、おそらく遺伝子移入が起きた直後の浄化選択の結果として、個体群において遺伝子移入の枯渇した領域です(図4)。さらに、ヒト(関連記事)とボノボ(関連記事)でも見られたように、X染色体での遺伝子移入の減少が観察されました。これは恐らく、多分複数の要因との組み合わせの結果としてヒト(関連記事)や他種で見られたように、遺伝子移入された変異に対する強い所化選択の結果です。ゴリラの雄の偏った拡散パターンと高い繁殖の歪みが、遺伝子移入における雄の半数体X染色体のさらなる減少につながったのかもしれません。反証観察されたパターンは恐らくこれらの要因の組み合わせですが、現時点では各要因を識別できません。
推定される適応的な遺伝子移入対象としてのS*とhmmixとVolcanoFinderという異なる3手法の外れ値の交差として、本論文の適応的な遺伝子移入の対象の定義がひじょうに控えめであることに要注意です。しかし本論文では、控えめであることで、VolcanoFinder手法の騎士の注意点と知られている偽陽性の可能性の影響を最小限に抑えることが目的とされます。しかし現時点では、これは供給源のゲノムなしに適応的な遺伝子移入の痕跡の位置を特定するのに利用可能な唯一の手法です。興味深いことに、3個の候補遺伝子には、ヒガシゴリラでは分離され、ニシゴリラでは祖先で固定された推定される機能的多様体が含まれます。
これらの遺伝子のうち一つはTAS2R14で、これは苦みの知覚に関わる味覚受容体をコードしており、6ヶ所のミスセンス多様体(アミノ酸が変わるような変異)が含まれます。ヒガシゴリラは通常、果実を常食とするニシゴリラよりも草本食性で、そのためヒガシゴリラでは味覚受容体は適応的な遺伝子移入の可能性が高いのでしょう。味覚受容体は、TAS2R14を包含する領域を含めて、ニシローランドゴリラにおいて同様に最近の正の選択の対象として提案されてきました。同じ領域の異なる変異が、異なる種で選択下にあったのかもしれません。これは、毒性回避という味覚受容体の本質的な役割の観点で解釈できるかもしれません。
SEMA5A遺伝子にはミスセンス多様体とスプライス領域が含まれており、この遺伝子は神経発達と関連し、自閉スペクトラム症との関連が示唆されています。しかし、ゴリラにおけるこれらの多様体の機能的影響は、将来のさらなる研究が必要です。本論文では、ヒトと他種で観察された高地適応への適応的な遺伝子移入の寄与は見つかりませんでした。高地のマウンテンゴリラとヒガシローランドゴリラでは、この適応は口腔微生物叢など微生物恐らくさまざまな機序により引き起こされています。
結論として、本論文はヒガシゴリラの進化史の理解への解像度向上に寄与します。個体全体で、絶滅系統の常染色体ゲノムの推定16.4%が回収され、現在の個体群に存在する変異の分析を通じて標本抽出されていない今では絶滅した系統を解明する、文献の増加に追加されます。
参考文献:
Pawar H. et al.(2023): Ghost admixture in eastern gorillas. Nature Ecology & Evolution, 7, 9, 1503–1514.
https://doi.org/10.1038/s41559-023-02145-2
この記事へのコメント