古代DNAデータから推測される両親の親族関係

 取り上げるのがたいへん遅れてしまいましたが、古代DNAデータから両親の親族関係を推測した研究(Ringbauer et al., 2021)が公表されました。現代人の両親の親族関係は世界各地でかなり異なりますが、その過去についてはほとんど知られていません。本論文は、両親の親族関係が同型接合連続領域の形態でゲノムに痕跡を残すことを活用して、古代DNAを分析します。本論文は、現代の位相参照パネルからのハプロタイプ情報により得られた低網羅率の古代DNAデータにおける、そうした連続領域を特定する手法を提示します。模擬実験と実験から、この手法は少なくとも0.3倍以上の網羅率の古代の個体について、4cM(センチモルガン)以上の同型接合連続領域を堅牢に検証する、と示されます。過去45000年間の古代人1785個体のゲノムデータ分析により、ほとんどの古代の人口集団でイトコもしくはより近縁な結婚は低率である、と検出されました。さらに、定住農耕の開始もしくは直後に起きた、遠い両親の親族関係の顕著な低下が見つかりました。局所的な人口規模の増加と関連している可能性が高いこの兆候は、世界規模のいくつかの地理的横断区で観察されました。


●研究史

 個人の両親は、さまざまな程度で相互に親族関係の可能性があります。現代人では、両親の親族関係における多くの興味深い地理的差異が観察されてきました。この連続体の一端では、世界的に7億人以上の現代人がマタイトコもしくはそれ以上の近親者の子供です。一部地域では、そうした結婚の割合が20~60%に達します。両親は、小さな人口規模の一般的な結果、もしくは緊密な集団における創始者効果の結果として、多くの場合、家系における多くのより深いつながりを介して、相互にもっと遠い親族関係の可能性もあります。この連続体のもう一旦では、イトコ婚が一般的ではない大きな人口集団において、多くの両親はその家系において最近のつながりを全く有していません。過去にさかのぼると、近親者の散発的な配偶がヨーロッパや古代エジプトやインカや先コロンブス期ハワイの王族で記録されていますが、過去の両親の親族関係のより広範なパターンについてはほとんど知られておらず、それは、考古学的証拠だけでは、とくに先史時代の配偶選好について、通常は情報をもたらさないからです。

 同一のハプロタイプの共継承は遺伝的差異の欠けているDNAの範囲をもたらすので、個人の遺伝的配列は両親の親族関係についての情報を含んでいます(図1a)。これはよく、同型接合連続領域(runs of homozygosity、略してROH)と呼ばれ(関連記事)、子孫の同型接合性(HBD)のある区画など、他の用語でも知られています。両親の系図上の関係が最近のものであるほど、ROHはより高頻度で長くなる傾向にあります。ROHはゲノム規模データで特定でき、この兆候は医学と保護と集団遺伝学において幅広い目的で分析されてきました。以下は本論文の図1です。
画像

 最近、ROHは古代人遺骸から抽出された遺伝的物質である古代DNAで特定されてきました。古代DNAの大規模なデータセットが過去10年間で生成されたため(関連記事)、この進歩はとくに有望です。しかし、大きな課題が残っており、古代DNAの網羅率は多くの場合1倍前後かそれ未満で、汚染とDNA分解は遺伝子型決定の誤りをもたらします。結果として、ROH検出は現在、例外的な高網羅率の古代の個体でのみ可能です。最近の方法論的進歩により、少なくとも5倍の網羅率のデータでROHの特定が可能となりましたが、この閾値は現在利用可能な古代DNA記録のごく一部以外の全てを除外します。

 本論文は、低ければ0.3倍の網羅率の個体で4cM以上の長さのROHを特定できる、ROH検出の手法を提示します。これは、ヒトの古代DNAの一般的な種類で適切に実行するよう、設計されています。つまり、各二倍体部位について単一のアレル(対立遺伝子)呼び出しで構成される、疑似半数体の遺伝子型です(図1b)。そうしたデータは、同型接合体対異型接合体の遺伝子型の状態を直接的には伝えませんが、以下で示されるように、位相参照パネルからのハプロタイプ情報の活用により、そうしたデータからROHを抽出できます。

 本論文はこの手法を用いて、過去45000年間の古代人1785個体を分析し、これは刊行された世界の古代人のDNA記録のかなりの割合です。本論文は、両親の親族関係の2つの領域の定量化に焦点を当てます。それは、(1)密接な親族間の結婚で、全て20cM超の合計(sROH)により測定され、sROH >20として示され、(2)sROHが4~8cMで測定された遠い親族関係です。第一に、イトコもしくはそれ以上に近い親族間の配偶は、多くの社会で現在広く行なわれているものの、古代DNAデータでは一般的に稀にしか観察されない、と分かります。第二に、多くの地域にわたる短いROHの水準増加が観察され、これは採食から農耕生計戦略への局所的な新石器時代移行と同時かその直後と一致します。この減少した遠い親族関係のゲノム証拠は局所的な人口規模増加へと向かう大きな人口統計学的変化を含む新石器時代の移行という、長年の証拠を裏づけて洗練します。


●ハプロタイプ参照パネルを用いてのROHの検出

 ROHを検出する本論文の手法は、位相参照パネルを用いて、ハプロタイプのデータを活用します。要するに、本論文の手法は、ROHの領域の配列決定読み取りが、二倍体の個体の母親と父親のハプロタイプが同一であるという理由だけで単一のハプロタイプから有効的に標本抽出される、という事実を利用します。対照的に、ROH以外では、2つの異なるハプロタイプが対象の個体により有されているため、配列決定は両方に由来するよう読み取られます。結果として、単一の参照ハプロタイプからの長い範囲の斑状としての配列決定読み取りのモデル化は、ROH領域内ではかなり適切に機能します。

 この兆候を利用するため、参照ハプロタイプごとに隠れたコピー状態を有する隠れマルコフモデル(Hidden Markov Model、略してHMM)が開発され、パネルからの長い範囲と、追加の単一の非ROH状態のコピーがモデル化されました。ソフトウェアパッケージhapROHでこの演算法が実装されました。現在の実装の初期設定媒介変数は、現代人の遺伝的差異の5008ヶ所のハプロタイプの参照パネルを用いるさいの、124万ヶ所の一塩基多型(SNP)を対象とする、広く用いられている捕獲技術からの疑似半数体遺伝情報呼び出しで調整されました。


●ROH推測の検証

 この手法は、以下の4シナリオで検証されました。(1)さまざまな長さ(4~10cM)のROH断片をデータに入力し、(2)高網羅率の古代の個体をより低解像度で標本抽出し、(3)現在の個体をより低解像度で標本抽出し、(4)参照パネルと対象個体との間のさまざまな分岐時間を検証します。

 配列決定の較正に用いた既知の配列の短いRNA転写物(spike-in)の実験で、挿入されたROH区画の少なくとも80%を検出する能力は、全ての模擬試験シナリオで85%超だった、と観察されました(図1D)。最長の重複する推測されたROHの推定される長さの偏りは一貫して0.5cM未満で、4cM超のROHでは偽陽性は観察されませんでした。より低解像度の標本抽出実権では、4通りの長さの範囲(4~8cM、8~12cM、12~20cM、20cM超)に収まるROH断片の長さの合計を回収する能力が検証されました。

 シベリア西部のロシア連邦オムスク州(Omsk Oblast)のウスチイシム(Ust'-Ishim)近郊のイルティシ川(Irtysh River)の土手で発見された45000年前頃となる現生人類(Homo sapiens)の男性個体(関連記事)は、本論文では最古の標本となります。この高深度で配列決定された最古のヒトゲノムをより低解像度で標本抽出すると、この手法は、124万SNPの部位のうち40万ヶ所しか網羅されていない疑似半数体データからそれぞれのsROH統計を推定するさいに、ほとんど偏りを生じませんでした。

 世界規模の標本の現代人599個体をより低解像度で標本抽出した実験では、疑似半数体からのROH推定は一般的に良好に機能し、例外はサハラ砂漠以南のアフリカの採食民人口集団でした。検証対象の人口集団と模擬実験された網羅率1倍の個体におけるハプロタイプ参照パネルとの間のさまざまな分岐時間の影響を評価すると、ヨーロッパ人のみの参照パネルを用いた場合、この手法はアジア東部と南アメリカ大陸の低網羅率の検証個体でROHを検出できるものの、アフリカ西部の検証個体ではずっと低い検出能力を示す、と分かりました。

 まとめると、本論文の検証から、この手法は、誤差率が最大3%の配列決定を許容しながら、124万SNPの40万ヶ所以上の部位を有する個体で4cM以上のROH断片を推測できる、と示されます。さらに、本論文の実験から、この手法は最大で数万年前の参照パネルから分岐した人口集団の対象個体を分析できる、と論証されます。したがって、4万~2万年前頃(関連記事)の出アフリカボトルネック(瓶首効果)を共有する全ての現代人および古代人は、ハプロタイプ参照パネルとして124万SNP標識一式と完全な1000人ゲノムデータセットを用いると、本論文の手法の適用範囲に収まります。


●古代DNAデータへの適用

 次に、本論文の手法が、ハプロタイプ参照パネルとして1000人ゲノムデータセットを用いて、古代DNAデータの公開されている利用可能なデータセットに適用されました。このデータセットにおける3723個体のうち134個体のみが平均5倍超の網羅率を有しています。以前のROH手法では、網羅率5倍が典型的な最小の網羅率要件でした。124万SNPのうち少なくとも1回は網羅された40万ヶ所の部位を閾値として、本論文の手法を用いることで、このデータセットのずっと大きな割合(3723個体のうち1833個体)を分析できました。

 124万SNPの部分集合である、ヒト起源(HO)SNPで遺伝子型決定された現代の個体のデータセットも統合されました。品質管理と選別の後、特有の古代人1785個体と現代人1941個体のデータセットに達しました。このデータセット内で、全ての古代の個体における全ての利用可能な124万SNP疑似半数体データと、全ての現代の個体でヒト起源SNPの二倍体データを用いて、4cM以上のROHが推測されました。現代の個体の疑似半数体と二倍体のデータについてのROH呼び出しが密接に相関すると確証された後で、古代と現代の個体における推定されたROHがともに分析されました。


●古代人における長いROHの少なさ

 本論文はまず、50cM以上のROHが20以上ある個体を特定しました。この閾値は、大きな人口集団において、イトコの88%とマタイトコの20%が50cM以上のROHを20以上有しているものの、ミイトコもしくはそれ以上に遠い関係の子供の1%未満が50cM以上のROHを20以上有している、という計算と模擬実験に基づいています。sROHが20超の50cMの閾値は、ひじょうに小さな孤立した人口集団でも上回る可能性があり、具体的には、250人規模の人口集団の個体の34%と、500人規模の人口集団の個体の8%です。以下、これが「長いROH」の閾値、この閾値を超えた個体が「長いROH」を有していると呼ばれます。

 全体的に、古代人1785個体のうちわずか54個体(3.0%)が、50cM超の20超のsROHを有していると分かりました。一般的に、長いROHを有するこれらの個体は、特定の地域もしくは期間に集中していません(図2Bおよび図3)。2個体以上のいる唯一の考古学的クラスタ(情報源のデータセットの注釈で定義され、読みやすさのために修正されました)は「鉄器時代共和政ローマ」で、標本11点のうち3点が長いROH閾値を上回っています。ポントス・カスピ海草原(ユーラシア中央部西北からヨーロッパ東部南方までの草原地帯)地域では、2600~1500年前頃の54個体のうち3個体(5.6%)が閾値を超えましたが(図2f)、この兆候は完全なデータセットとは有意に異なっています。後期先コロンブス期アンデス地域では長いROHを有する3個体が見られますが(図2d)、追跡研究はより大きな標本規模でこの兆候を記載しています(関連記事)。以下は本論文の図2です。
画像

 とくに、長いROHを有する54個体のうち11個体は島嶼部にいます。年代順に並べ、刊行された利用可能なデータセットからのクラスタ(まとまり)注釈(読みやすさのため修正されました)を用いると、これらは、「サルデーニャ島前期銅器時代(1個体のうち1個体)」、「スウェーデン巨石文化(5個体のうち1個体、全員ゴットランド島)」、「チリ西方諸島(3個体のうち1個体)」、「イングランド銅器時代~前期青銅器時代(14個体のうち2個体、図2)」、「ロシアボリショイ(6個体のうち2個体)」、「バヌアツ1100年前(3個体のうち1個体)」、「アルゼンチンのティエラ・デル・フエゴ(1個体のうち1個体)」、「インド大アンダマン(1個体のうち1個体)」です。以下は本論文の図3です。
画像

 現代の個体を含む全データセットでsROHが20超の最高値は、6000年前頃となるレヴァントの銅器時代個体(I1178)で、545cMの20超のsROHがあります。同じイスラエルのペキイン洞窟(Peqi’in Cave)遺跡で検証された他の8個体では20超のsROHが0で、全体的にROHがひじょうに少なくなっています(30cM以上のsROHは4未満)。ROHの合計と長さの分布から、I1178個体の両親は1親等の親族だった、と示唆されます(図4)。つまり、両親が親子もしくは全キョウダイ(両親が同じキョウダイ)で、その子供はゲノムの1/4をROHに有することになるでしょう。要注意なのは、この男性個体の埋葬状況が例外的と報告されなかったことです。以下は本論文の図4です。
画像

 長いROHの割合は、現代のHOデータセットではかなり高く、現代人1941個体のうち176個体が長いROHを有しています(9.1%)。古代人のデータとは対照的に、長いROHのいくつかの地理的クラスタが見られ、おもに現在の近東とアフリカ北部とアジア南部および中央部と南アメリカ大陸です。この兆候は以前に記載されており、イトコ婚の推定される優勢を反映しています(関連記事)。

 長いROHが現代人のデータでは一般的な2地域では、本論文の古代人データは数人の古代人個体を含んでおり、時間横断区分析が可能です。レヴァントでは、本論文で注釈をつけられた全ての現代人5集団(ドゥルーズ派、パレスチナ人、シリア人、レバノン人、ヨルダン人)は、長いROH閾値を上回る個体の割合が高くなっています(102個体のうち30個体、図3c)。レヴァント地域の古代人標本では、銅器時代(9個体)と青銅器時代(8個体)とローマ期(3個体)から中世(8個体)の分析された28個体のうち2個体だけが、この閾値を上回っています。その2個体のうち一方は、本論文のデータセットのイスラエルの銅器時代個体で、20超のsROHが最高です(図4)。もう一方は、地中海の十字軍の戦いと関連するレバノン南部の集団埋葬で発掘された個体(SI-38)で(関連記事)、在来の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)を有している、と分かりました。

 時間横断区で分析できた第二の地域は、現在のパキスタンです。データセットで注釈づけされた現代人6集団のうち5集団、つまり、パシュトゥーン人(Pathan)とブラーフイー人(Brahui)とマクラーニー人(Makrani)とシンド人(Sindhi)では、多くの個体が長いROH(50cM超のROHが20超なのは98個体のうち33個体)を有していました。第6の孤立した渓谷集団であるカラシュ人(Kalash)では、遠いROHの水準上昇が観察されるにも関わらず、18個体のうち1個体だけがこの閾値を超えています(図3b)。対照的に、古代の個体(現在のパキスタン北西部)では、鉄器時代(3200~2700年前頃)の75個体のうち1個体だけにこの閾値を超える20超のsROHがあり、歴史時代(2600~1900年前頃)の20個体と中世(900~400年前頃)の4個体には長いROH閾値がない、と推測されます(図3b)。


●ヒトの遠い親族関係の経時的減少

 sROHで測定されたより短いROH断片は、平均して10~30世代で合着(合祖)する親系統から蓄積するので、その存在量はほぼ、以前の500年間(ヒト1世代につき30年と仮定されます)祖先の配偶プール(遠い親族関係)の規模を反映しています。祖先系統は地理的に過去にさかのぼって広がることが多いので、最近の合着とROHの確率は、増加する局所的な人口規模だけてばなく、増加する親子間の分散でも減少します。個体の移動性が集団間と同等と仮定すると、sROHは局所的な人口規模の代理となります。古代人1785個体のうち1763個体を網羅する24ヶ所の主要な地理的地域について時間横断区におけるsROHの値が記入されました。さらに、sROHが特定地域において生計戦略間で異なっているのかどうか(ほとんどの古代の個体で注釈付けされています)、検証されました。

 sROHはデータセットのほとんどの古代の個体で最高であり、その後は一般的に経時的に減少する、と分かりました。1万年以上前の世界規模の標本における古代人43個体はそれぞれsROHを有しており、その中央値は54.5でした(図2では39個体が示されます)。次に、定住と農耕の生活様式への新石器時代以降と一致するsROHにおけるかなりの減少が観察されます(図2)。ユーラシア西部では、採食文化の個体が初期農耕文化(つまり、地域ごとの最初の注釈付けされた「農耕個体」の直後の2000年以内の農耕文化)の個体と対比されました。sROHは、採食民および農耕民の両方で注釈付けされた8地域全ての横断区でかなり減少し、sROHの中央値は採食集団あたり13~66cMから農耕集団あたり0~9cMへと減少した、と分かりました。農耕が数千年続く不均一な過程において5000年前頃以降にしだいに強化してきたアンデス地域では、sROHの中央値は採食民の55.4から農耕民の17.9へと減少します。

 採食から農耕への移行の詳細な調査は、興味深いより精細な規模の動態を明らかにします。第一に、土器を用いない、ヨーロッパへの新石器時代拡大に先行する1万年前頃の最初のユーラシア西部農耕民については、依然として短いsROHの割合増加が観察され、無土器農耕民の中央値は、エーゲ海では36.7、レヴァントでは16.4、アジア中央部では15.2となり、ユーラシア西部採食民で観察された値(sROHの範囲は13~66cM)に匹敵します。この3地域全てで、土器時代初期農耕民にかけてその後の顕著な低下があり、sROHの中央値は、エーゲ海で0、レヴァントで0、アジア中央部で4.8です。

 さらに、本論文の標本の土器時代初期農耕の1集団は際立っています。元々のデータセットでイベリア半島前期新石器時代(7400~7000年前頃)と注釈付けされたその個体群は32.8cMのsROHの中央値を有しており、他のユーラシアの初期農耕民(sROHの中央値は0~8.7cM)よりかなり高くなっています。しかし、イベリア半島の中期新石器時代(6800~4600年前頃)農耕民のROHは減少し(sROHの中央値は0)、他の初期ヨーロッパ農耕民の典型的な値になります。初期イベリア半島農耕民個体群は例外的に高い初期農耕民祖先系統(90%超)を有しているので、この兆候は採食民(狩猟採集民)祖先系統により説明できません。しかし、7500年前頃の数百年間の急速な海上拡大、つまりカルディウム土器(Cardial Ware)拡大の考古学的証拠は、前期新石器時代における短いROHのこの増加について一つの妥当な説明を提供します。それは、急速な拡大が最初のボトルネック(瓶首効果)を引き起こした可能性があるからです。さらに、初期農耕民の最初の小さな人口集団は、採食民の混合が中期新石器時代イベリア半島人で増加し、ヨーロッパの新石器時代人口集団で最高の一つ(25%)であり続けた理由を説明するでしょう。

 アメリカ大陸古代人では、sROH値の増加は遠い親族関係の高水準の維持を証明します。この兆候はアメリカ大陸の全地域で見られます。sROHの中央値は、アメリカ大陸北西部では長いROHの個体を除いて67.1cM、アメリカ大陸南東部では31.5cM、アンデス地域では31.5cM、南アメリカ大陸南部では112.5cMです。このROHの数の多さ(全体的なsROHの中央値は56.3)は、同じ広範な期間(13000年前頃以降)の世界規模の標本の残り(中央値は4.2cM)よりも高くなっています。sROHは過去数十世代内の共祖先系統により駆動されるので、この増加したsROHのcMは、アメリカ大陸への初期移住期におけるボトルネックにより説明できませんが、より最近の、持続的な小さな有効人口規模を呼び出す必要があります。全体的に、時間的差異はほとんど観察されず(図2)、例外は農耕への移行期の頃のアメリカ大陸人口集団のデータセットです。ただ、アメリカ大陸における農耕の他の初期中心地、たとえばメキシコ中央部や北アメリカ大陸東部の個体がデータセットに含まれないことに要注意です。

 大きな地理的規模でのROH増加の別の観察はユーラシア草原地帯で見られ、ここでは、初期牧畜民集団が全て、かなりの量のsROHを有しており(5200~3000年前頃の草原地帯牧畜農耕民の中央値は17.5cM)、その内訳は、ヤムナヤ文化(中央値は17.5cM、17個体)、アファナシェヴォ(Afanasievo)文化(中央値は18.1cM、22個体)、シンタシュタ(Sintashta)文化(中央値は5.7cM、21個体)、オクネヴォ(Okunevo)文化(24.5cM、12個体)、スルブナヤ(Srubnaya)文化(中央値は4.8cM、19個体)です。これらのsROHの水準は5000年前頃以前のユーラシア西部農耕民人口集団、とくに、アジア中央部の同時代の南方の近隣の定住農耕民(中央値は0)よりも顕著に高くなっています(中央値は4.2cM)。ポントス・カスピ海草原西部(現在のウクライナとモルドヴァ)の標本では、採食民から牧畜民への移行において、sROHの中央値は14.2から0へとかなりの減少が観察されます。同様に、ユーラシア草原地帯東部(バイカル湖と現在のモンゴル周辺)では、採食民から牧畜民への移行は、sROHの顕著な減少(中央値は32.5から4.7)と一致します。ユーラシア草原地帯の東西両方では、本論文の標本における牧畜民の多くの年代が3000~2000年前頃(それぞれスキタイと匈奴)で、上述の初期牧畜民よりもかなり遅いことに要注意です。


●考察

 この研究は、低網羅率の古代DNAでROHを測定する手法を開発しました。この演算法は、HMMを利用して以前の一連の長い作業にしたがって、そうした断片を推測します。ここでの主要な方法論的利点は、ROH断片内で、ハプロタイプの参照パネルからコピーしてハプロタイプの情報を利用する、隠れた状態の使用です。この手法により、ROHについて1785個体の古代DNAデータを検査することが可能になり、それは、これまでそうした分析で適用できたものよりも1桁多い古代の個体です。ヒトの過去の二つの主要な側面について、証拠が生成されました。長いROH(20cM超)の特定は、イトコ婚のような近い親族間の結婚の過去の優勢への洞察を提供しましたが、短いROH(4~8cM)は局所的な人口規模を反映する過去の遠い親族関係の変化するパターンを明らかにしました。

 古代人1785個体のうち1個体だけが、1親等の親族間(キョウダイもしくは親子)の子供に典型的な長いROHを有している、と分かりました。歴史的に、1親等の親族の配偶は古代エジプトやインカや先コロンブス期の王族でのみ記録されていますが、それは孤立した事例でした。これまでに古代DNAを用いて見つかった1親等の親族間の子供の他の事例は、新石器時代アイルランドのエリートのり墓の最近報告された事例です(関連記事)。本論文の調査結果は、ヒトの過去において1親等の結婚が一般的には稀だった、との見解と一致します。

 さらに、古代人1785個体のうち54個体(3.0%)のみが、イトコ(88%)と、あまり一般的には観察されないマタイトコ(20%)に典型的な長いROHで観察された、と分かりました。そうした長いROHは、小さな配偶プールの結果としても生じる可能性があります。たとえば、500人規模の任意交配人口集団において、特定の島嶼部人口集団で観察された長いROHを説明できるかもしれません。したがって、長いROHの割合は、イトコ婚の割合の上限です。一方、不完全な検出力のため、一部の長いROHは実証分析では見落とされる可能性がありますが、この手法が、本論文の模擬実験で観察された検出力をはるかに下回る、全ての20cM超の半分の検出に失敗したとしても、イトコの60%をまだ検出するでしょう。本論文の古代人標本では、全ての親の結婚の実質的に10%未満がイトコ同士の水準で起きた、と結論づけられます。

 現在、高水準の長いROHのある2つの特定の地域では、データセットは時間横断区の分析を可能とするのに充分な数の古代の個体を含んでいました。両横断区(レヴァントと現在のパキスタン北西部)では、長いROHの水準におけるかなりの変化が観察されます。現在の個体群における近い親族結婚に典型的な長いROHの多さとは対照的に、長いROHは中世までを含む古代の個体群では一般的ではありませんでした。これらの地域と、アフリカ北部やアジア中央部・南部・西部など現在高水準の長いROHを有している他の地域の追加データは、これらよく研究された親族に基づく配偶体系の起源と拡大をより正確に解決するのに役立つでしょう。全体的に本論文の結果は、ROHに基づく手法が、文化的結婚/配偶慣行における変化の理解に情報をもたらすために用いることができる方法を示します。

 第二の主要な発見として、短いROH(4~8cM)として測定されるヒトの遠い親族関係が、多くの地理的横断区で経時的に顕著に減少し、狩猟採集の生活様式から農耕定住の生活様式への移行である、局所的な「新石器時代移行」の期間もしくは直後に顕著に低下した、と観察されました。現在の採食民人口集団での観察と一致して、初期農耕民が採食民と比較して個体の遊動性が増加していないと仮定すると、短いROHのかなりの減少は、顕著に増加した局所的な人口規模を証明します。この調査結果は、新石器時代への移行に続く局所的な人口規模の増加という長年の仮説への裏づけを追加します。採食民と初期農耕民の古代ゲノムの以前の分析はすでに、ゲノム規模多様性の減少、高網羅率ゲノムから推定されたROHの割合減少や合着率の減少など、初期農耕民がそれ以前の狩猟採集民よりも大きな人口規模を有しているという、いくつかの一連の証拠を確認しました。本論文の分析は、1桁多い個体の分析、およびそうした個体をさまざまな地理的地域のいくつかの密に標本抽出された時間横断区に編成することにより、地理的および時間的解像度の洗練された水準を追加します。

 初期ユーラシア草原地帯牧畜民集団の個体については、中間的な水準の短いROHが観察されました。ヤムナヤ文化などこれら初期牧畜文化は、これまで考古学および古代DNA研究で多くの注目を集めてきました。それは、考古学と言語学と遺伝学の証拠から、初期牧畜民がインド・ヨーロッパ語族およびいくつかの人口集団拡大の起源に重要な役割を果たした、と示唆されているからです。観察された短いROHの割合増加は、多くの配偶が小さく関連した集団内および集団間で起きた、という証拠を提供します。短いROHの代替的な解釈は、墳墓(Kurgan)形式の埋葬遺跡が一般大衆よりも短いROHを有する社会階級の偏った標本を表している、というものかもしれません。しかし、短いROHは最大過去数十世代まで親の祖先系統をたどるので、この兆候は多くの世代にわたって維持されてきた社会階層間の繁殖孤立を必要とするでしょう。したがって、この兆候の少なくとも一部は、比較的低い人口密度か、最近のボトルネックを経た草原地帯人口集団に起因する可能性が高そうです。

 本論文の分析は、いくつかの警告により制約されます。重要なことに、考古学的手段により利用可能な骨格遺骸は、過去の人口集団の無作為な断面を構成しないことがよくあります。遠い親族関係の水準が混合人口集団内で類似していると予測される一方で、近い親族間の結婚の割合は社会構造のためかなり異なる可能性があります。たとえば、エリートの王朝は一般人では珍しいにも関わらず近い親族間の結婚を行なっているかもしれません。別の制約は、現在の古代DNA記録および世界の大半の不完全な標本抽出で、少数で疎らな標本抽出から推測しなければなりません。急速に成長している古代DNA記録の将来の研究は、より細かい規模で機能する社会的および文化的要因の追加の詳細の解決に役立つでしょう。たとえば、ROHパターンにおける変化のより正確な時期とより微妙な変化の活用です。とくに、特定の局所的問題に焦点を当てた将来の研究は、本論文で提示された手法により提供された過去についての遺伝的証拠の使用を強化する方法で、考古学と遺伝学の証拠をますます結びつけるでしょう。

 より高密度の標本抽出に加えて、本論文の分析が将来の研究によって改善できるいくつかの方法があります。本論文は長いROH(20cM超)と短いROH(4~8cM)の分析に焦点を当てました。この二分法により明確に最近で遠い親族関係の両親間の子供の解明に役立つ一方で、ROHの下流分析を洗練した将来の研究は、全てのROH規模にわたっての調査でより微妙な痕跡を抽出できるようになるだろう、と予測されます。さらに要注意なのは、本論文のアプリケーションがヒトの古代DNAで広く用いられてきたSNP一式(124万SNP)に焦点を当てたことです。全ゲノム配列決定データ(本論文で分析されたデータの部分集合で利用可能です)について、全てのゲノム規模多様体を用いることで、少なくとも1回は網羅された124万SNPのうち40万ヶ所という現在の制約を下回る網羅率への要件を、低下させる可能性が高そうです。別の改善は、古代のハプロタイプを含む参照パネルの使用です。現在、長い範囲の位相化された古代のハプロタイプは利用可能ではありませんが、将来の研究はそうしたデータを生成する可能性が高そうです。

 低い網羅率の古代ゲノムでROHを特定する一つの代替的手法は、標準的なROH検出手法を用いての同型接合性標識の範囲の検査に続く補完の使用かもしれません。これは最近、10倍以上の網羅率の古代の個体で行われました(関連記事)。ゲノムの補完は本論文で用いられた低い網羅率の限界と類似した網羅率でよく機能すると報告されており、ほとんどの補完手法は本論文で用いられた手法と関連するハプロタイプコピー手法に基づいているので、あらゆるそうした手法は、本論文の手法で実行されたように、適切な検証と較正の後で、本論文と同様に実行できる、と予測されます。本論文は、疑似半数体データのいくつかの重要な利点を活用する手法の開発を選択し、これはより広く利用可能で、遺伝子型の品質についての仮定が少なくすみ、その後の分析は、さまざまな分離や配列決定や遺伝子型決定手順によりもたらされるバッチ効果(実験間誤差)の影響を受けにくくなります。

 ROHの特定は、他の強力なアプリケーションの開始点にもなる可能性があります。ROHは単一のハプロタイプ(本論文の手法の主要な兆候)だけで構成され、したがってそれは完全に位相化されており、ハプロタイプコピーもしくは系統樹再構築に依存する強力な手法の前提条件です。さらに、長いROHは汚染と誤差率の推定に用いることができ、これは古代DNA研究において重要な作業です。ROHは異型接合性を欠いており、男性における半接合性のX染色体から汚染を推定するのと同様に、汚染もしくは遺伝子型決定の誤りに由来するに違いないROH内の異型接合性読み取りの特定が可能です。別の有望な将来の方向性は、ROH内だけではなく、同祖対立遺伝子(identity-by-descent、略してIBD)と呼ばれる、個体間でも見られる古代DNAにおける長い共有された配列区画を特定する手法の開発です。個体間のIBDの呼び出しは、個体のあらゆる組み合わせからの兆候を用いることができるので、遠い親族関係の測定の検出力をかなり増加させるでしょう。さらに、地理的なIBDの兆候は、最近の移住パターンについて多くの情報をもたらします。本論文の手法を、IBD検出のさいに位相化された参照パネルからのハプロタイプ情報を同様に用いることに拡張すれば、低網羅率の古代の個体でそうした分析を可能とするでしょう。

 最後に、ROHの分析は、ヒトの人口統計および親族関係に基づく配偶体系を超えて、追加の意味を有しています。多くの動植物種では、ROHはより一般的で(さまざまな配偶体系か、小さな集団規模か、家畜化・栽培化のため)、ROHの研究は、家畜化・栽培化種での積極的に管理された配偶がROHを変えるだろうと予測されるように、初期の動植物の繁殖の理解ではとくに興味深いものになるかもしれません。絶滅種か絶滅危惧種の古代DNAでは、高網羅率のネアンデルタール人(Homo neanderthalensis)個体の古代DNA(関連記事)、もしくはアイル・ロイヤル(Isle Royal)島オオカミの現代のDNAにおける事例で観察されているように、ROHは絶滅と交雑の過程に光を当てることができます。最後に、ROHは稀な有害な潜性(劣性)アレルに曝させるので、ROHの時間的動態は有害な多様体の進化動態および健康の結果の理解と関連しています。本論文の手法の中核となる着想が、広範な自然集団からの低網羅率データの分析を刺激するよう、期待されます。


参考文献:
Ringbauer H, Novembre J, and Steinrücken M.(2021): Parental relatedness through time revealed by runs of homozygosity in ancient DNA. Nature Communications, 12, 5425.
https://doi.org/10.1038/s41467-021-25289-w

この記事へのコメント