Y染色体の詳細な分析に基づく新石器時代のヨーロッパ西部への農耕民の拡大経路
Y染色体の詳細な分析に基づく新石器時代のヨーロッパ西部への拡大経路に関する研究(Rohrlach et al., 2021)が公表されました。ミトコンドリアDNA(mtDNA)やY染色体の非組換え領域(NRY)のような片親性遺伝標識は、その歴史を単純な進化系統樹により表せるという事実のため、集団の人口史についての魅力的な情報源です。1980年代の先駆的研究以来、ゲノム研究以前には、人類の遺伝的歴史と世界への移住のほとんどは、片親性遺伝標識のmtDNAとNRYから推測されていました。細胞内のコピー数が多く、ゲノムが短くて(17000塩基対未満)、比較的高い置換率のため、mtDNAはとくによく研究されてきており、人口集団の遺伝的変異性についての安価ではあるものの信頼できる情報源を産出してきました。
逆に、NRYのマッピング可能な部分(古代DNA研究などで短い読み取りが確実にマッピングされている領域)はmtDNAよりもずっと長く(10445000塩基対)、男性個体の細胞で単一コピーとしてのみ表れます。進化的置換率(年間の部位あたりの置換数)は、NRYではmtDNAよりも最大で2桁低い、と推定されました。たとえば、7.77×10⁻¹⁰~8.93×10⁻¹⁰で、ミトコンドリアゲノムでは1.36×10⁻⁸~1.95×10⁻⁸となりますが、置換率の推定に関しては多くの議論があります。しかし、mtDNAと比較してNRYのゲノムがより長いことは、これらの置換率から、および単一系統の場合に、ミトコンドリアゲノムでは約3094~4440年に起きる点変異と比較して、NRYでは約108~123年ごとに点変異が起きることを意味します。その結果、NRYは集団の父方の人口史についてより多くの情報を含み、男性主導の移住もしくは父方居住など、男性に偏った集団の人口統計学的変化について多くの情報を提供できるので、人口集団の父方の歴史を調べることは、ひじょうに重要かもしれません。
人口史の研究では、古代DNAはかけがえのない情報源として示されてきました。古代DNA研究は、ユーラシア西部における大規模な人口集団の移動と遺伝的交替事象を明らかにしてきており(関連記事1および関連記事2および関連記事3)、これらの事象は現代の人口集団の遺伝的データからの復元は不可能でした。古代人の片親性遺伝標識の研究も、現代人のみの研究では検出できない結果をもたらしてきました。たとえば、最終氷期極大期(Last Glacial Maximum、略してLGM)後のヨーロッパの再移住に続くmtDNAの多様性喪失、もしくは新石器時代拡大に続くヨーロッパ東部および中央部における狩猟採集民Y染色体系統多様性の減少と部分的な置換(関連記事)や、紀元前三千年紀初めにおける草原地帯的祖先系統(祖先系譜、ancestry)の到来に伴う、その後の新石器時代Y染色体系統の多様性喪失です(関連記事1および関連記事2)。
古代DNAデータを用いる研究者たちは、通常、標本の品質に関連する問題、とくに死後のDNA崩壊と環境汚染による内在性DNAの減少に直面します。Y染色体は男性細胞の全DNAの2%未満程度を占めており、これが意味するのは、研究者たちが単一コピーのNRYで充分な情報価値のある部位を適切に網羅するためにショットガン(SG)配列の使用を望むならば、良好なDNA保存状態の標本でさえ、かなりの配列作業が必要になる、ということです。
標的捕捉分析評価の開発により、古代DNA研究者たちは配列においてゲノムの特定の部位と領域を濃縮できるようになり、古代標本からのヒト内在性DNAの収量は大きく改善しました。そうした一般的な分析評価の一つが1240kアッセイ(分析評価)で、ヒトゲノムにおける124万ヶ所の祖先系統の情報価値のある部位を標的とし、そのうち32000ヶ所はY染色体上の既知の多様体の選択を表します。これは、情報価値のあるY染色体の一塩基多型の遺伝子系譜学国際協会(ISOGG)の一覧に基づきます。注目すべきことに、市販の利用可能版(myBaits Expert Human AffinitiesやDaicel Arbor Biosciences)では、ISOGGにより特定された追加の46000ヶ所のY染色体一塩基多型が含まれており、現代人男性で変異が見られます。
現在知られている情報価値のあるY染色体の一塩基多型の数(ISOGGでは73163ヶ所、Yfullでは173801ヶ所)と比較して、標的Y染色体一塩基多型の数は比較的少なく、基本的なY染色体ハプログループ(YHg)の分類は可能ですが、現代の多様性と特定地域に大きく偏っています。結果として、1240kアッセイにおける特定のY染色体一塩基多型の表示に応じて、得られるYHgの分類は低く不均一な解像度になる可能性がありますが、標的を絞る手法は、ヒトの過去における隠れたおよび/もしくは消滅した可能性のある系統の検出ができません。
人口集団の男性の歴史をよりよく研究して理解するために、すでによく知られている一塩基多型だけを標的にするのではなく、NRYの部位の配列データをとくに濃縮する標的分析評価の必要性が認識されました。そのため、YMCA(Y染色体マッピング可能捕獲分析評価)が設計され、実装されました。これは造語で、古代DNAに典型的な短いリードをヒトゲノムに確実にマッピングできるNRYの領域を標的とします。類似の手法はすでに以前の研究で調べられました(関連記事)。しかし本論文では、その研究で提示された精査セットとの詳細な比較は避けられます。その研究では、種区分未定のホモ属であるデニソワ人(Denisovan)やネアンデルタール人(Homo neanderthalensis)といったずっと古い標本のために設計され、690万塩基対を標的としているので、「マッピング可能」の定義が本論文よりもずっと控えめで制約されています。一方、別の研究では890万塩基対領域が報告され、本論文の標的領域をほぼ完全に(99.97%)含んでいます。本論文は、標的領域の残りの150万塩基対で確実にマッピングされた部位を得られる、と示します。
本論文は、YMCA がショットガン配列と比較してNRY部位の相対的な網羅率を大きく改善し、同じ配列作業でNRY部位を濃縮できる、と示します。また本論文は、YMCAが2つの点で1240k一塩基多型アッセイ配列よりもずっと性能が優れていることを示します。本論文は実験的に、YMCAが網羅されているNRY部位の数を改善する、と示します。また本論文は、関連するbedファイル(標的領域を記述したタブ区切りのテキストファイル)により定義された標的NRY部位の考慮により、および抽出への高い複雑性を有する標本を配列する場合、YMCAが1240kアッセイ配列と比較して、YHg分類と新たな診断に役立つ一塩基多型の発見に対して、解像度改善の可能性を有することも示します。
本論文は、YHg-H2(P96)の分析によりYMCA経由で得られた性能改善を強調します。YHg-H2は、ユーラシア西部の新石器時代移行期の初期農耕民と関連した低頻度のハプログループです。本論文は、既知の46個体(古代人45個体と現代人1個体)と、新たにYMCAで配列された49個体(全員古代人)のデータセットを精選しました。おもに現代人20個体の標本に基づくYHg-H2の現在の理解は、本論文のYHg-H2の個体群の古代の多様性と一致しない、と本論文は示します。この古代のYHgの解決において、アナトリア半島からヨーロッパ西部への新石器時代集団にとっての、地中海とドナウ川に沿った異なる2経路を示せます。地中海由来の集団は、最終的にブリテン島とアイルランド島にも到達しました。
●YMCAの性能の検証
YMCAの性能を評価するため、さまざまな保存状態水準の標本について、内在性ヒトDNAの実験上の倍増が計算されました。ショットガンと1240kとYMCAの配列データについての、多すぎる環境変数の影響を避けるため、同じ遺跡から標本が選択されました。それはドイツのレウビンゲン(Leubingen)遺跡です。次に、網羅されたNRY部位の数と、少なくとも一度各ライブラリタイプで網羅されたISOGGの数を調べることにより、同じライブラリでの標準的なショットガン配列と1240kキャプチャに対するYMCAの実験上の性能が比較されました。ヒト内在性リードのみを選別し、次に500万の内在性リードごとに網羅された部位・一塩基多型の数を正規化することにより、同じ品質と入力配列労力が説明されます。ショットガン配列をYMCAと比較すると、内在性ヒトDNAの量で顕著な増加が観察され、以下ではこれが「濃縮」と呼ばれます。標本の保存状態が増加するにつれて濃縮が減少する、と明らかになりました。つまり、より高い開始内在性DNAの割合が高い標本では、濃縮効果が減少するものの、それでも有意でした。
ショットガン配列と比較すると、YMCA捕捉ライブラリにより網羅されたNRY部位の数では、15.2倍の顕著な平均増加が観察され、1240k配列と比較した場合は1.84倍となり、YMCAは平均してショットガン配列および1240k配列の両方よりも多くのNRY部位を網羅する、と示されます(図1)。またこれは、ショットガン配列の500万リードあたり平均15.2倍のISOGG一塩基多型を網羅しているので、YMCAのわずか500万リードと比較して、ショットガン配列では同じ数のNRY部位を網羅するのに7600万のリードを配列する必要がある、と示唆します。以下は本論文の図1です。
興味深いことに、1240k配列と比較すると、YMCA捕捉ライブラリで少なくとも1回網羅されたISOGG一塩基多型の数では、平均4.36倍増加していることも明らかになりました。これは、同じ配列作業でYMCAがより多くの情報価値のある一塩基多型を網羅していることも示唆します。網羅されたNRY部位の数と、ショットガン配列および1240k配列の内在性DNAの割合は相関していないことと、網羅されたISOGG一塩基多型の数と1240k配列の内在性DNAの割合は相関していないことが明らかになり、これらの結果が標本における回収可能なヒトDNAの相対的量に依存しないことを示唆します。したがって、Y染色体で網羅される一塩基多型は1240kアッセイを用いると追加のボーナスですが、それはおもに男性と女性の常染色体ゲノムの分析で使用されるので、研究者が効率的かつ徹底的にY染色体の非組換え部分を調べたいならば、YMCAは明らか顕著な改善である、と明らかになります。
次に、各bedファイルにしたがって、1240kアッセイとYMCAにも含まれる、ISOGG一塩基多型一覧14.8版におけるハプログループの情報をもたらす一塩基多型の割合が比較されました。YMCAと1240kアッセイは同じ技術に基づき、同じ実験室の手順で捕捉されているので、この比較はとくに強力です。1240kアッセイは現在掲載されているISOGG一塩基多型の24.44%を標的としますが、YMCAは90.01%を標的とします(図2)。注意すべきは、ISOGG一塩基多型の残り9.99%はNRY領域に存在し、古代DNAで一般的な短いリードでは「マッピングできない」と考えられることです。
1240kアッセイの各部位は2つの精査(アレルと代替アレル)および多様体のそれぞれの側の5200塩基対により標的とされるので、追加の隣接する「標的」部位もマッピングされたリードから回収可能です。したがって、1240kアッセイの各一塩基多型の120塩基対(それぞれの側で60塩基対)の解析単位(window)も許可され、これは古代DNAの妥当な平均リード長です。この1240k+120塩基対の部位の一覧では、標的とされるISOGG一塩基多型の割合が45.34%にまで増加しますが、これは、1240k一塩基多型アッセイが、情報価値のあるY染色体一塩基多型が含まれる総数により基本的に制約されることも示します。ISOGG標的一塩基多型におけるこの顕著な増加は、同じ配列作業でYMCAがより多くISOGG一塩基多型を網羅する理由も説明します。以下は本論文の図2です。
さらに、NRYをできるだけ多く回収することは、とくに研究者がY染色体の新たな多様体を探すか、もはや存在しないかもしれない過去の多様性の解明に関心を持っている場合に、たいへん重要です。1240kアッセイにより標的とされた部位の数をYMCAと比較すると、1240k捕捉アッセイは合計で32670ヶ所の部位を標的とする可能性があり、これはYMCAにより標的とされた部位の数の約0.31%になる、と観察されます。しかし、各一塩基多型の周囲の120塩基対の解析単位を含めると、1240kアッセイは3953000ヶ所の部位、もしくはYMCAを用いての分析できる可能性のある部位の数の37.82%を、標的とする可能性があります。したがって、YMCAは新たな祖先系統の情報をもたらす一塩基多型のNRYを探すための手法としてより優れている、と予測されます。
この研究では、YMCAと1240kにより標的とされた利用可能なISOGG一塩基多型を考えて、YHg分類の可能な潜在的解像度の比較にも関心がもたれました。各bedファイルのISOGG一塩基多型によると、32000ヶ所のY染色体の周囲の120塩基対を含めた時でさえ、一塩基多型YHgの解像度は改善できないことも明らかになりました。これは、現在優勢なYHgと、とくに、既知の過去の人口集団と関連するものの、現代の人口集団では顕著に頻度が低下しており、1240kアッセイの診断一塩基多型では充分に網羅されないYHgの両方で当てはまります。
初期狩猟採集民のYHg-C1a2(V20)や、新石器時代の拡大と関連するYHg-G(Z38202)やYHg-H2(P96)などのハプログループでは低解像度がよく観察されます。これらのYHgに関して、1240kアッセイのY染色体一塩基多型は、それぞれ関連するISOGG一塩基多型の0.8%と0%と13%を標的とします。120塩基対の解析単位を含めると、これらの割合はそれぞれ32.5%と31.2%と36.2%に増加しますが、依然としてYMCAにより標的とされた一塩基多型の場合の、89.6%と90.6%と95.2%よりもずっと低くなります(図2)。さらに、初期ヒト集団の移動において存在すると考えられているものの、現代人集団では比較的多く見られるYHgの理論的網羅率が低いことも、1240kアッセイの部位に関して問題となる可能性があります。たとえば、アメリカ大陸への人類最初の移住と関連する、YHg-Q1b1a1a(M3)は、1240kアッセイでは関連する診断上の一塩基多型の11.9%(120塩基対の解析単位を含めると33.5%)しか網羅されていないのに対して、YMCAでは92%となります。
まとめると、ショットガン配列および1240kアッセイと比較して、YMCAはNRYへのマッピングリードの相対的割合を高めます。またYMCAは、1240kアッセイよりもNRYの部位を2.5倍以上標的としており、新たな診断一塩基多型の検出を可能とします。しかし重要なことは、YMCAが、すでに情報価値があると知られているものの、1240kアッセイでは標的とできない一塩基多型を標的とすることです。
●事例研究としてのYHg-H2へのYMCAの適用
標本選別のショットガン配列の手順適用と、実験室での適切な標本へのその後の1240kキャプチャを通じて、古代の男性個体におけるさまざまなYHgについて新たなYMCAの性能を調べられました。本論文は、YHg-H2(P96)の事例を紹介します。データ不足と現代の人口集団では低頻度であるため、YHg-H2では進化系統樹の解像度が依然として不明です。現在の古代DNA記録から判断すると、YHg-Hは過去には、とくに新石器時代化の時期のユーラシア西部全域で農耕拡大と関連する男性の間でもっと一般的だったようです。本論文は結果として、古代DNA研究、とくにYHgの高解像度型は、過去と現在のY染色体の進化関係の解明に役立つ、と示せます。
YHg-H(L901)はアジア南部で48000年前頃に形成された、と考えられています。その下位区分のYHg-H1a(M69)とH2(P96)とH3(Z5857)は、その後4000年で急速に形成されたようです。YHg-H1およびH3は44300年前頃に形成されたと推定されていますが、YHg-H2はわずかに早く45600年前頃に形成された、と推定されています(yfull)。
YHg-H1およびH3はアジア南部ではまだ20%の頻度で見られますが、ヨーロッパではひじょうに頻度が低く、YHg-H1はロマ人の900年前頃の拡大との関連のみで見られます。逆に、YHg-H2は少なくとも1万年前以来ユーラシア西部に存在してきており、農耕拡大と強く関連していますが、現代のヨーロッパ西部人口集団では0.2%以下の頻度です。対照的に、YHg-H2は新石器時代集団ではより一般的で(関連記事1および関連記事2)、観察されたYHgの1.5~9%を構成しますが、中には例外的に30%に達する個体群も存在します。
5000年前頃となる草原地帯関連祖先系統の到来とともに、YHg-R1aやR1bなど侵入してくるYHgが、YHg-G2やT1aやH2などより古い「新石器時代」YHgの多くをほぼ置換し、YHg-H2はとくに、新石器時代個体群において高頻度で見られませんでしたが、その多様性も大きく減少し、多くの下位系統が完全に失われたかもしれない、と予測されます。
本論文のYMCAがハプロタイプ決定品質を向上させて系統地理学的推論も導き出せるのかどうか検証するため、先史時代古代人のDNAデータと、暫定的にYHg-H2に分類された選択された個体群の新たな収集が用いられました。49個体の新たなデータが生成され、既知の46個体のY染色体ゲノムデータと統合されました。
YHg-H2は、新石器時代のより優勢なYHg-G2a2b2a1a2a(Z38302)とともに一般的に見られますが、本論文ではYHg-H2の低頻度が注目されます。とくに、YHg-G2a個体群の相対的な高頻度と比較してのYHg-H2個体群の相対的な少なさから、系統選別のより強い影響と、したがって観察される地理的パターンのより高い変化を予測するように、「系統の歴史」、したがって潜在的には拡散経路をよりよく追跡できます。この特定の事例では、YHg-H2個体群と関連する固有の遺伝標識を用いて、アナトリア半島からヨーロッパ西部への拡大する新石器時代農耕民を追跡でき、新石器時代拡大の提案されたいわゆる「ドナウ川もしくは内陸部」経路と「地中海」経路を遺伝的に識別可能なのかどうか、検証できます。これらの新石器時代拡大経路は、最近核ゲノム分析でも裏づけられました(関連記事)。
残念ながら、Y染色体の進化系統樹のYHg-H2の下位区分は、YHg-H2個体の現代人標本の不足とYHg-H2の古代人の相対的な少なさのため現在よく理解されておらず、多くの場合、既知および未報告の古代人標本のほぼ全ての系統樹的歴史と一致しません。本論文では、1例を除く全事例で、YHg-H2個体群は、YHg-H2 a1やH2b1など、現在のISSOG分類における2つの分岐クレード(単系統群)から派生した一塩基多型の混合を有している、と明らかになりました。したがって、上述のYMCAの性能から、さらにYHg-H2個体群が分析され、この系統の分岐パターンの解明が試みられました。
Y染色体DNAの非組換え部分では、進化史は系統樹構造に従うと予測されるので、たとえばISOGGでのYHg-H2aとH2b1とH2c1aなどの混合ハプログループはあり得ません。これらの個体群のよりよく理解された進化史を見つけるため、IQ-TREEを用いて最尤(ML)系統発生樹が構築されました。ML系統樹(図3A)から2つの主要なクレードが識別され、暫定的にH2m(青色)およびH2d(緑色)と表示されます。現在のISOGGの命名法に関して、YHg-H2mはYHg-H2とH2aとH2a1とH2c1aの一塩基多型の混合により定義づけられることに要注意です。YHg-H2dは、2ヶ所のYHg-H2b1の一塩基多型と、以前には検出されなかった追加の4ヶ所の一塩基多型により定義されるようです。したがって、YHg-H2dは、トルコとドイツの個体群から成る下位クレードを含んでおり、それらは、YHg-H2b1と関連する追加の10ヶ所の一塩基多型により独自に定義され、さらなる下位区分の可能性が示唆されることに要注意です。
診断一塩基多型の拡張セットに基づいて、ML系統樹に含まれるための最小限の網羅率要件を満たしていない個体も含めてさえ、58個体をYHg-H2mとH2dのどちらか、あるいは(基底部)H2*(低網羅率のため)に分類できました。最終的に、これら追加の一塩基多型のどれにも由来せず、YHg-H2の一塩基多型の多くにとって祖先型である3個体も確認され、基底部の3個体と表示されます。
本論文の全標本をヨーロッパの地図に投影すると、系統地理的パターンがはっきりと現れました(図3B)。YHg-H2d個体は全員、ヨーロッパ中央部へのいわゆる内陸部・ドナウ川経路沿いで見つかり、YHg-H2mは1個体を除いて全て、ヨーロッパ西部とイベリア半島と最終的にはアイルランド島へのいわゆる地中海経路で見つかりました。ドイツ中央部で見つかった孤立したYHg-H2mの個体(LEU019)は、年代が後期新石器時代・前期青銅器時代で、新石器時代拡大の2000~3000年後となります。ミシェスベルク(Michelsberg)文化のような中期・後期新石器時代集団の東方への拡大の考古学およびmtDNAの証拠は、この単一の地理的に離れた観察結果を説明できるかもしれません。以下は本論文の図3です。
本論文で用いられた古代人標本の不完全でさまざまな網羅率のため、古代人標本の放射性炭素年代測定を用いての、分岐年代推定のための信頼できる較正を作成できませんでした。本論文は代わりに、個体の各組み合わせの最新の共通祖先(TMRCA)以来の年代を推定し、新たに識別されたYHg-H2クレードの分岐年代を調べました。まず、相対的な置換率が構成され、YHg-A0と他の全てのYHgの平均TMRCAが161300年前と推定されました。この較正された置換率を用いてのTMRCAは、YHg-A1が133200年前、YHg-HIJKが48000年前と推定され、これは現在のそれぞれの推定年代(yfull)である133400年前および48500年前とひじょうに近くなっています。本論文はYHg-H2のTMRCAを24100年前と推定し、これは現在の推定年代(17100年前)よりもわずかに古く、高網羅率のYHg-H2の現代人標本を1個体しか利用できず、古代人標本が増加したことで説明できます。
YHg-H2dとH2mの推定TMRCA年代は15400年前で、それぞれの推定TMRCA年代は11800年前と11900年前です(図4)。しかし、重複する一塩基多型が少ないために関連するエラーバーがより広くなっている場合でも、平均推定年代は依然として比較的一貫していることに要注意です。これらの推定値に加えて、YHg-H2dとH2mの個体がアナトリア半島とレヴァントでも見つかった事実から、YHg-H2の多様性は農耕および家畜の確立以前に近東狩猟採集民に存在していた可能性が最も高く、初期農耕民にも存在し、その後で新石器時代拡大を経てヨーロッパ中央部および西部に広がった可能性が高い、と示されます。以下は本論文の図4です。
●YHg-H2の解像度向上のための診断用一塩基多型の特定
YMCAを用いてYHg-H2の新たな下位クレードを特定した後、参照ヒトゲノム配列(hs37d5)と比較して、どの一塩基多型がこれらの下位クレードの診断用なのか、識別することも目的とされました。そのために、次の特性を有する分離部位が探されました。(1)集団内のどの個体もその部位では祖先的ではない場合。(2)その部位では集団内の複数個体が網羅されている場合。(3)その部位では集団外のどの個体も派生的ではない場合。(4)その部位では集団外の複数の個体が網羅されている場合。そのうえで、「新たな」一塩基多型の調査は、CからTもしくはGからAではなく、したがって古代DNA損傷の結果である可能性が低い置換に限定されましたが、本論文の結果でCからTもしくはGからAである多様体も、それらがISOGG もしくはYFullで以前に発見されているならば、含まれました。
YHg-H2(全て)とH2d(緑色)とH2m(青色)として定義される図3の下位ハプログループ・分枝の、312ヶ所の診断用の可能性のある一塩基多型が特定されました。心強いことに、本論文で特定された312ヶ所の診断用一塩基多型のうち258ヶ所(80.1%)はすでに、ISOGGもしくはYFullの一覧においてYHg-H2(P96)もしくはより派生的な下位区分と関連している、と明らかになっています。本論文では、YHg-H2と関連づけられていなかった、以前に発見された一塩基多型を2ヶ所(0.31%)のみ見つけました。それは、YHg-R1a1およびR1a1aと関連づけられたCからTの置換です。これはYHg-H2標本31点のうち17点で見つかったので、CからTの置換が損傷に起因する可能性は低そうです。さらに、本論文のYHg-H2の古代人(フランスのYHg-H2の1個体を除いて)では、134ヶ所の既知の基底部YHg-H2一塩基多型のうち110ヶ所を見つけられました。
上述のさまざまなYHgで新たに発見された残りの62ヶ所の一塩基多型は、未発見の診断用一塩基多型か、失われたYHg-H2の多様性を表します。しかし、部位8611196におけるAからGの置換のような、新たに発見された一塩基多型のいくつか(本論文のYHg-H2の31個体のうち20個体)では、新たな真の診断用一塩基多型の圧倒的な証拠が見つかりました。これら明確なYHg-H2の下位ハプログループを検出する本論文の手法の能力、したがって新石器時代拡大における情報価値のあるYHgの分岐年代をさらに解明して推定する能力は、網羅率の増加と、YMCAで標的をとできる部位の数の増加によってのみ可能となります(ショットガン配列もしくは1240k配列と比較した場合)。
●考察
人口集団のY染色体の歴史の分析は、人口史を理解するうえでひじょうに重要かもしれません。この目的のため、本論文は古代のY染色体配列データの標的配列戦略の採用を提唱します。本論文で提示された焦点を絞った研究では、ショットガン配列もしくは1240k配列と比較した場合、内在性ヒトDNA含有量を考慮したうえで、同じ配列作業量YMCAを用いたさいに達成可能な一塩基多型の網羅率と数の改善が浮き彫りになります。
標的となる内在性ヒトDNAの濃縮は、古代DNA研究における不充分な標本の保存状態を克服するためにひじょうに重要です。現代人男性から確認された1240kアッセイのY染色体一塩基多型は単に、信頼できるYHg分類のためのNRY上の診断用一塩基多型を、とくに現代の多様性に先行するYHgの事例では充分に網羅できない、と示され、最新の「Y染色体一塩基多型パネル」のために連続する領域を標的とする必要性が浮き彫りになります。YMCAは、他のキャプチャに使用され、追加の抽出もしくはライブラリの準備を必要としない、同じライブラリに適用できます。YMCAを本論文では試みられていない他のキャプチャアッセイと組み合わせることは確かに可能ですが、管理された研究における選択された男性標本の特注YMCAは、追加の配列作業を伴う(男性および女性標本への)手順複合適用よりも優れているかもしれない、と本論文は主張します。
YHg-H2(P96)のより詳細な分析を通じて、古代のYHg-H2の多様性に関する現在の理解は、系統樹的な歴史(NRYの歴史にも当てはまるはずです)と矛盾し、この多様性の解決は近東からヨーロッパへの新石器時代拡大の2経路へのさらなる裏づけにつながる、と示せます。それは、YMCAによりもたらされた改善された解像度なしには可能ではなかっただろう観察結果です。ユーラシア西部狩猟採集民のY染色体(YHg-I2aやI2bやC1a)の下位構造の研究や、青銅器時代ユーラシア西部やアジア中央部および南部YHg-R1aおよびR1bの多様化をよりよく特徴づけるために、こうした手法が将来適用されるよう期待されます。
参考文献:
Rohrlach AB. et al.(2021): Using Y-chromosome capture enrichment to resolve haplogroup H2 shows new evidence for a two-path Neolithic expansion to Western Europe. Scientific Reports, 11, 15005.
https://doi.org/10.1038/s41598-021-94491-z
逆に、NRYのマッピング可能な部分(古代DNA研究などで短い読み取りが確実にマッピングされている領域)はmtDNAよりもずっと長く(10445000塩基対)、男性個体の細胞で単一コピーとしてのみ表れます。進化的置換率(年間の部位あたりの置換数)は、NRYではmtDNAよりも最大で2桁低い、と推定されました。たとえば、7.77×10⁻¹⁰~8.93×10⁻¹⁰で、ミトコンドリアゲノムでは1.36×10⁻⁸~1.95×10⁻⁸となりますが、置換率の推定に関しては多くの議論があります。しかし、mtDNAと比較してNRYのゲノムがより長いことは、これらの置換率から、および単一系統の場合に、ミトコンドリアゲノムでは約3094~4440年に起きる点変異と比較して、NRYでは約108~123年ごとに点変異が起きることを意味します。その結果、NRYは集団の父方の人口史についてより多くの情報を含み、男性主導の移住もしくは父方居住など、男性に偏った集団の人口統計学的変化について多くの情報を提供できるので、人口集団の父方の歴史を調べることは、ひじょうに重要かもしれません。
人口史の研究では、古代DNAはかけがえのない情報源として示されてきました。古代DNA研究は、ユーラシア西部における大規模な人口集団の移動と遺伝的交替事象を明らかにしてきており(関連記事1および関連記事2および関連記事3)、これらの事象は現代の人口集団の遺伝的データからの復元は不可能でした。古代人の片親性遺伝標識の研究も、現代人のみの研究では検出できない結果をもたらしてきました。たとえば、最終氷期極大期(Last Glacial Maximum、略してLGM)後のヨーロッパの再移住に続くmtDNAの多様性喪失、もしくは新石器時代拡大に続くヨーロッパ東部および中央部における狩猟採集民Y染色体系統多様性の減少と部分的な置換(関連記事)や、紀元前三千年紀初めにおける草原地帯的祖先系統(祖先系譜、ancestry)の到来に伴う、その後の新石器時代Y染色体系統の多様性喪失です(関連記事1および関連記事2)。
古代DNAデータを用いる研究者たちは、通常、標本の品質に関連する問題、とくに死後のDNA崩壊と環境汚染による内在性DNAの減少に直面します。Y染色体は男性細胞の全DNAの2%未満程度を占めており、これが意味するのは、研究者たちが単一コピーのNRYで充分な情報価値のある部位を適切に網羅するためにショットガン(SG)配列の使用を望むならば、良好なDNA保存状態の標本でさえ、かなりの配列作業が必要になる、ということです。
標的捕捉分析評価の開発により、古代DNA研究者たちは配列においてゲノムの特定の部位と領域を濃縮できるようになり、古代標本からのヒト内在性DNAの収量は大きく改善しました。そうした一般的な分析評価の一つが1240kアッセイ(分析評価)で、ヒトゲノムにおける124万ヶ所の祖先系統の情報価値のある部位を標的とし、そのうち32000ヶ所はY染色体上の既知の多様体の選択を表します。これは、情報価値のあるY染色体の一塩基多型の遺伝子系譜学国際協会(ISOGG)の一覧に基づきます。注目すべきことに、市販の利用可能版(myBaits Expert Human AffinitiesやDaicel Arbor Biosciences)では、ISOGGにより特定された追加の46000ヶ所のY染色体一塩基多型が含まれており、現代人男性で変異が見られます。
現在知られている情報価値のあるY染色体の一塩基多型の数(ISOGGでは73163ヶ所、Yfullでは173801ヶ所)と比較して、標的Y染色体一塩基多型の数は比較的少なく、基本的なY染色体ハプログループ(YHg)の分類は可能ですが、現代の多様性と特定地域に大きく偏っています。結果として、1240kアッセイにおける特定のY染色体一塩基多型の表示に応じて、得られるYHgの分類は低く不均一な解像度になる可能性がありますが、標的を絞る手法は、ヒトの過去における隠れたおよび/もしくは消滅した可能性のある系統の検出ができません。
人口集団の男性の歴史をよりよく研究して理解するために、すでによく知られている一塩基多型だけを標的にするのではなく、NRYの部位の配列データをとくに濃縮する標的分析評価の必要性が認識されました。そのため、YMCA(Y染色体マッピング可能捕獲分析評価)が設計され、実装されました。これは造語で、古代DNAに典型的な短いリードをヒトゲノムに確実にマッピングできるNRYの領域を標的とします。類似の手法はすでに以前の研究で調べられました(関連記事)。しかし本論文では、その研究で提示された精査セットとの詳細な比較は避けられます。その研究では、種区分未定のホモ属であるデニソワ人(Denisovan)やネアンデルタール人(Homo neanderthalensis)といったずっと古い標本のために設計され、690万塩基対を標的としているので、「マッピング可能」の定義が本論文よりもずっと控えめで制約されています。一方、別の研究では890万塩基対領域が報告され、本論文の標的領域をほぼ完全に(99.97%)含んでいます。本論文は、標的領域の残りの150万塩基対で確実にマッピングされた部位を得られる、と示します。
本論文は、YMCA がショットガン配列と比較してNRY部位の相対的な網羅率を大きく改善し、同じ配列作業でNRY部位を濃縮できる、と示します。また本論文は、YMCAが2つの点で1240k一塩基多型アッセイ配列よりもずっと性能が優れていることを示します。本論文は実験的に、YMCAが網羅されているNRY部位の数を改善する、と示します。また本論文は、関連するbedファイル(標的領域を記述したタブ区切りのテキストファイル)により定義された標的NRY部位の考慮により、および抽出への高い複雑性を有する標本を配列する場合、YMCAが1240kアッセイ配列と比較して、YHg分類と新たな診断に役立つ一塩基多型の発見に対して、解像度改善の可能性を有することも示します。
本論文は、YHg-H2(P96)の分析によりYMCA経由で得られた性能改善を強調します。YHg-H2は、ユーラシア西部の新石器時代移行期の初期農耕民と関連した低頻度のハプログループです。本論文は、既知の46個体(古代人45個体と現代人1個体)と、新たにYMCAで配列された49個体(全員古代人)のデータセットを精選しました。おもに現代人20個体の標本に基づくYHg-H2の現在の理解は、本論文のYHg-H2の個体群の古代の多様性と一致しない、と本論文は示します。この古代のYHgの解決において、アナトリア半島からヨーロッパ西部への新石器時代集団にとっての、地中海とドナウ川に沿った異なる2経路を示せます。地中海由来の集団は、最終的にブリテン島とアイルランド島にも到達しました。
●YMCAの性能の検証
YMCAの性能を評価するため、さまざまな保存状態水準の標本について、内在性ヒトDNAの実験上の倍増が計算されました。ショットガンと1240kとYMCAの配列データについての、多すぎる環境変数の影響を避けるため、同じ遺跡から標本が選択されました。それはドイツのレウビンゲン(Leubingen)遺跡です。次に、網羅されたNRY部位の数と、少なくとも一度各ライブラリタイプで網羅されたISOGGの数を調べることにより、同じライブラリでの標準的なショットガン配列と1240kキャプチャに対するYMCAの実験上の性能が比較されました。ヒト内在性リードのみを選別し、次に500万の内在性リードごとに網羅された部位・一塩基多型の数を正規化することにより、同じ品質と入力配列労力が説明されます。ショットガン配列をYMCAと比較すると、内在性ヒトDNAの量で顕著な増加が観察され、以下ではこれが「濃縮」と呼ばれます。標本の保存状態が増加するにつれて濃縮が減少する、と明らかになりました。つまり、より高い開始内在性DNAの割合が高い標本では、濃縮効果が減少するものの、それでも有意でした。
ショットガン配列と比較すると、YMCA捕捉ライブラリにより網羅されたNRY部位の数では、15.2倍の顕著な平均増加が観察され、1240k配列と比較した場合は1.84倍となり、YMCAは平均してショットガン配列および1240k配列の両方よりも多くのNRY部位を網羅する、と示されます(図1)。またこれは、ショットガン配列の500万リードあたり平均15.2倍のISOGG一塩基多型を網羅しているので、YMCAのわずか500万リードと比較して、ショットガン配列では同じ数のNRY部位を網羅するのに7600万のリードを配列する必要がある、と示唆します。以下は本論文の図1です。
興味深いことに、1240k配列と比較すると、YMCA捕捉ライブラリで少なくとも1回網羅されたISOGG一塩基多型の数では、平均4.36倍増加していることも明らかになりました。これは、同じ配列作業でYMCAがより多くの情報価値のある一塩基多型を網羅していることも示唆します。網羅されたNRY部位の数と、ショットガン配列および1240k配列の内在性DNAの割合は相関していないことと、網羅されたISOGG一塩基多型の数と1240k配列の内在性DNAの割合は相関していないことが明らかになり、これらの結果が標本における回収可能なヒトDNAの相対的量に依存しないことを示唆します。したがって、Y染色体で網羅される一塩基多型は1240kアッセイを用いると追加のボーナスですが、それはおもに男性と女性の常染色体ゲノムの分析で使用されるので、研究者が効率的かつ徹底的にY染色体の非組換え部分を調べたいならば、YMCAは明らか顕著な改善である、と明らかになります。
次に、各bedファイルにしたがって、1240kアッセイとYMCAにも含まれる、ISOGG一塩基多型一覧14.8版におけるハプログループの情報をもたらす一塩基多型の割合が比較されました。YMCAと1240kアッセイは同じ技術に基づき、同じ実験室の手順で捕捉されているので、この比較はとくに強力です。1240kアッセイは現在掲載されているISOGG一塩基多型の24.44%を標的としますが、YMCAは90.01%を標的とします(図2)。注意すべきは、ISOGG一塩基多型の残り9.99%はNRY領域に存在し、古代DNAで一般的な短いリードでは「マッピングできない」と考えられることです。
1240kアッセイの各部位は2つの精査(アレルと代替アレル)および多様体のそれぞれの側の5200塩基対により標的とされるので、追加の隣接する「標的」部位もマッピングされたリードから回収可能です。したがって、1240kアッセイの各一塩基多型の120塩基対(それぞれの側で60塩基対)の解析単位(window)も許可され、これは古代DNAの妥当な平均リード長です。この1240k+120塩基対の部位の一覧では、標的とされるISOGG一塩基多型の割合が45.34%にまで増加しますが、これは、1240k一塩基多型アッセイが、情報価値のあるY染色体一塩基多型が含まれる総数により基本的に制約されることも示します。ISOGG標的一塩基多型におけるこの顕著な増加は、同じ配列作業でYMCAがより多くISOGG一塩基多型を網羅する理由も説明します。以下は本論文の図2です。
さらに、NRYをできるだけ多く回収することは、とくに研究者がY染色体の新たな多様体を探すか、もはや存在しないかもしれない過去の多様性の解明に関心を持っている場合に、たいへん重要です。1240kアッセイにより標的とされた部位の数をYMCAと比較すると、1240k捕捉アッセイは合計で32670ヶ所の部位を標的とする可能性があり、これはYMCAにより標的とされた部位の数の約0.31%になる、と観察されます。しかし、各一塩基多型の周囲の120塩基対の解析単位を含めると、1240kアッセイは3953000ヶ所の部位、もしくはYMCAを用いての分析できる可能性のある部位の数の37.82%を、標的とする可能性があります。したがって、YMCAは新たな祖先系統の情報をもたらす一塩基多型のNRYを探すための手法としてより優れている、と予測されます。
この研究では、YMCAと1240kにより標的とされた利用可能なISOGG一塩基多型を考えて、YHg分類の可能な潜在的解像度の比較にも関心がもたれました。各bedファイルのISOGG一塩基多型によると、32000ヶ所のY染色体の周囲の120塩基対を含めた時でさえ、一塩基多型YHgの解像度は改善できないことも明らかになりました。これは、現在優勢なYHgと、とくに、既知の過去の人口集団と関連するものの、現代の人口集団では顕著に頻度が低下しており、1240kアッセイの診断一塩基多型では充分に網羅されないYHgの両方で当てはまります。
初期狩猟採集民のYHg-C1a2(V20)や、新石器時代の拡大と関連するYHg-G(Z38202)やYHg-H2(P96)などのハプログループでは低解像度がよく観察されます。これらのYHgに関して、1240kアッセイのY染色体一塩基多型は、それぞれ関連するISOGG一塩基多型の0.8%と0%と13%を標的とします。120塩基対の解析単位を含めると、これらの割合はそれぞれ32.5%と31.2%と36.2%に増加しますが、依然としてYMCAにより標的とされた一塩基多型の場合の、89.6%と90.6%と95.2%よりもずっと低くなります(図2)。さらに、初期ヒト集団の移動において存在すると考えられているものの、現代人集団では比較的多く見られるYHgの理論的網羅率が低いことも、1240kアッセイの部位に関して問題となる可能性があります。たとえば、アメリカ大陸への人類最初の移住と関連する、YHg-Q1b1a1a(M3)は、1240kアッセイでは関連する診断上の一塩基多型の11.9%(120塩基対の解析単位を含めると33.5%)しか網羅されていないのに対して、YMCAでは92%となります。
まとめると、ショットガン配列および1240kアッセイと比較して、YMCAはNRYへのマッピングリードの相対的割合を高めます。またYMCAは、1240kアッセイよりもNRYの部位を2.5倍以上標的としており、新たな診断一塩基多型の検出を可能とします。しかし重要なことは、YMCAが、すでに情報価値があると知られているものの、1240kアッセイでは標的とできない一塩基多型を標的とすることです。
●事例研究としてのYHg-H2へのYMCAの適用
標本選別のショットガン配列の手順適用と、実験室での適切な標本へのその後の1240kキャプチャを通じて、古代の男性個体におけるさまざまなYHgについて新たなYMCAの性能を調べられました。本論文は、YHg-H2(P96)の事例を紹介します。データ不足と現代の人口集団では低頻度であるため、YHg-H2では進化系統樹の解像度が依然として不明です。現在の古代DNA記録から判断すると、YHg-Hは過去には、とくに新石器時代化の時期のユーラシア西部全域で農耕拡大と関連する男性の間でもっと一般的だったようです。本論文は結果として、古代DNA研究、とくにYHgの高解像度型は、過去と現在のY染色体の進化関係の解明に役立つ、と示せます。
YHg-H(L901)はアジア南部で48000年前頃に形成された、と考えられています。その下位区分のYHg-H1a(M69)とH2(P96)とH3(Z5857)は、その後4000年で急速に形成されたようです。YHg-H1およびH3は44300年前頃に形成されたと推定されていますが、YHg-H2はわずかに早く45600年前頃に形成された、と推定されています(yfull)。
YHg-H1およびH3はアジア南部ではまだ20%の頻度で見られますが、ヨーロッパではひじょうに頻度が低く、YHg-H1はロマ人の900年前頃の拡大との関連のみで見られます。逆に、YHg-H2は少なくとも1万年前以来ユーラシア西部に存在してきており、農耕拡大と強く関連していますが、現代のヨーロッパ西部人口集団では0.2%以下の頻度です。対照的に、YHg-H2は新石器時代集団ではより一般的で(関連記事1および関連記事2)、観察されたYHgの1.5~9%を構成しますが、中には例外的に30%に達する個体群も存在します。
5000年前頃となる草原地帯関連祖先系統の到来とともに、YHg-R1aやR1bなど侵入してくるYHgが、YHg-G2やT1aやH2などより古い「新石器時代」YHgの多くをほぼ置換し、YHg-H2はとくに、新石器時代個体群において高頻度で見られませんでしたが、その多様性も大きく減少し、多くの下位系統が完全に失われたかもしれない、と予測されます。
本論文のYMCAがハプロタイプ決定品質を向上させて系統地理学的推論も導き出せるのかどうか検証するため、先史時代古代人のDNAデータと、暫定的にYHg-H2に分類された選択された個体群の新たな収集が用いられました。49個体の新たなデータが生成され、既知の46個体のY染色体ゲノムデータと統合されました。
YHg-H2は、新石器時代のより優勢なYHg-G2a2b2a1a2a(Z38302)とともに一般的に見られますが、本論文ではYHg-H2の低頻度が注目されます。とくに、YHg-G2a個体群の相対的な高頻度と比較してのYHg-H2個体群の相対的な少なさから、系統選別のより強い影響と、したがって観察される地理的パターンのより高い変化を予測するように、「系統の歴史」、したがって潜在的には拡散経路をよりよく追跡できます。この特定の事例では、YHg-H2個体群と関連する固有の遺伝標識を用いて、アナトリア半島からヨーロッパ西部への拡大する新石器時代農耕民を追跡でき、新石器時代拡大の提案されたいわゆる「ドナウ川もしくは内陸部」経路と「地中海」経路を遺伝的に識別可能なのかどうか、検証できます。これらの新石器時代拡大経路は、最近核ゲノム分析でも裏づけられました(関連記事)。
残念ながら、Y染色体の進化系統樹のYHg-H2の下位区分は、YHg-H2個体の現代人標本の不足とYHg-H2の古代人の相対的な少なさのため現在よく理解されておらず、多くの場合、既知および未報告の古代人標本のほぼ全ての系統樹的歴史と一致しません。本論文では、1例を除く全事例で、YHg-H2個体群は、YHg-H2 a1やH2b1など、現在のISSOG分類における2つの分岐クレード(単系統群)から派生した一塩基多型の混合を有している、と明らかになりました。したがって、上述のYMCAの性能から、さらにYHg-H2個体群が分析され、この系統の分岐パターンの解明が試みられました。
Y染色体DNAの非組換え部分では、進化史は系統樹構造に従うと予測されるので、たとえばISOGGでのYHg-H2aとH2b1とH2c1aなどの混合ハプログループはあり得ません。これらの個体群のよりよく理解された進化史を見つけるため、IQ-TREEを用いて最尤(ML)系統発生樹が構築されました。ML系統樹(図3A)から2つの主要なクレードが識別され、暫定的にH2m(青色)およびH2d(緑色)と表示されます。現在のISOGGの命名法に関して、YHg-H2mはYHg-H2とH2aとH2a1とH2c1aの一塩基多型の混合により定義づけられることに要注意です。YHg-H2dは、2ヶ所のYHg-H2b1の一塩基多型と、以前には検出されなかった追加の4ヶ所の一塩基多型により定義されるようです。したがって、YHg-H2dは、トルコとドイツの個体群から成る下位クレードを含んでおり、それらは、YHg-H2b1と関連する追加の10ヶ所の一塩基多型により独自に定義され、さらなる下位区分の可能性が示唆されることに要注意です。
診断一塩基多型の拡張セットに基づいて、ML系統樹に含まれるための最小限の網羅率要件を満たしていない個体も含めてさえ、58個体をYHg-H2mとH2dのどちらか、あるいは(基底部)H2*(低網羅率のため)に分類できました。最終的に、これら追加の一塩基多型のどれにも由来せず、YHg-H2の一塩基多型の多くにとって祖先型である3個体も確認され、基底部の3個体と表示されます。
本論文の全標本をヨーロッパの地図に投影すると、系統地理的パターンがはっきりと現れました(図3B)。YHg-H2d個体は全員、ヨーロッパ中央部へのいわゆる内陸部・ドナウ川経路沿いで見つかり、YHg-H2mは1個体を除いて全て、ヨーロッパ西部とイベリア半島と最終的にはアイルランド島へのいわゆる地中海経路で見つかりました。ドイツ中央部で見つかった孤立したYHg-H2mの個体(LEU019)は、年代が後期新石器時代・前期青銅器時代で、新石器時代拡大の2000~3000年後となります。ミシェスベルク(Michelsberg)文化のような中期・後期新石器時代集団の東方への拡大の考古学およびmtDNAの証拠は、この単一の地理的に離れた観察結果を説明できるかもしれません。以下は本論文の図3です。
本論文で用いられた古代人標本の不完全でさまざまな網羅率のため、古代人標本の放射性炭素年代測定を用いての、分岐年代推定のための信頼できる較正を作成できませんでした。本論文は代わりに、個体の各組み合わせの最新の共通祖先(TMRCA)以来の年代を推定し、新たに識別されたYHg-H2クレードの分岐年代を調べました。まず、相対的な置換率が構成され、YHg-A0と他の全てのYHgの平均TMRCAが161300年前と推定されました。この較正された置換率を用いてのTMRCAは、YHg-A1が133200年前、YHg-HIJKが48000年前と推定され、これは現在のそれぞれの推定年代(yfull)である133400年前および48500年前とひじょうに近くなっています。本論文はYHg-H2のTMRCAを24100年前と推定し、これは現在の推定年代(17100年前)よりもわずかに古く、高網羅率のYHg-H2の現代人標本を1個体しか利用できず、古代人標本が増加したことで説明できます。
YHg-H2dとH2mの推定TMRCA年代は15400年前で、それぞれの推定TMRCA年代は11800年前と11900年前です(図4)。しかし、重複する一塩基多型が少ないために関連するエラーバーがより広くなっている場合でも、平均推定年代は依然として比較的一貫していることに要注意です。これらの推定値に加えて、YHg-H2dとH2mの個体がアナトリア半島とレヴァントでも見つかった事実から、YHg-H2の多様性は農耕および家畜の確立以前に近東狩猟採集民に存在していた可能性が最も高く、初期農耕民にも存在し、その後で新石器時代拡大を経てヨーロッパ中央部および西部に広がった可能性が高い、と示されます。以下は本論文の図4です。
●YHg-H2の解像度向上のための診断用一塩基多型の特定
YMCAを用いてYHg-H2の新たな下位クレードを特定した後、参照ヒトゲノム配列(hs37d5)と比較して、どの一塩基多型がこれらの下位クレードの診断用なのか、識別することも目的とされました。そのために、次の特性を有する分離部位が探されました。(1)集団内のどの個体もその部位では祖先的ではない場合。(2)その部位では集団内の複数個体が網羅されている場合。(3)その部位では集団外のどの個体も派生的ではない場合。(4)その部位では集団外の複数の個体が網羅されている場合。そのうえで、「新たな」一塩基多型の調査は、CからTもしくはGからAではなく、したがって古代DNA損傷の結果である可能性が低い置換に限定されましたが、本論文の結果でCからTもしくはGからAである多様体も、それらがISOGG もしくはYFullで以前に発見されているならば、含まれました。
YHg-H2(全て)とH2d(緑色)とH2m(青色)として定義される図3の下位ハプログループ・分枝の、312ヶ所の診断用の可能性のある一塩基多型が特定されました。心強いことに、本論文で特定された312ヶ所の診断用一塩基多型のうち258ヶ所(80.1%)はすでに、ISOGGもしくはYFullの一覧においてYHg-H2(P96)もしくはより派生的な下位区分と関連している、と明らかになっています。本論文では、YHg-H2と関連づけられていなかった、以前に発見された一塩基多型を2ヶ所(0.31%)のみ見つけました。それは、YHg-R1a1およびR1a1aと関連づけられたCからTの置換です。これはYHg-H2標本31点のうち17点で見つかったので、CからTの置換が損傷に起因する可能性は低そうです。さらに、本論文のYHg-H2の古代人(フランスのYHg-H2の1個体を除いて)では、134ヶ所の既知の基底部YHg-H2一塩基多型のうち110ヶ所を見つけられました。
上述のさまざまなYHgで新たに発見された残りの62ヶ所の一塩基多型は、未発見の診断用一塩基多型か、失われたYHg-H2の多様性を表します。しかし、部位8611196におけるAからGの置換のような、新たに発見された一塩基多型のいくつか(本論文のYHg-H2の31個体のうち20個体)では、新たな真の診断用一塩基多型の圧倒的な証拠が見つかりました。これら明確なYHg-H2の下位ハプログループを検出する本論文の手法の能力、したがって新石器時代拡大における情報価値のあるYHgの分岐年代をさらに解明して推定する能力は、網羅率の増加と、YMCAで標的をとできる部位の数の増加によってのみ可能となります(ショットガン配列もしくは1240k配列と比較した場合)。
●考察
人口集団のY染色体の歴史の分析は、人口史を理解するうえでひじょうに重要かもしれません。この目的のため、本論文は古代のY染色体配列データの標的配列戦略の採用を提唱します。本論文で提示された焦点を絞った研究では、ショットガン配列もしくは1240k配列と比較した場合、内在性ヒトDNA含有量を考慮したうえで、同じ配列作業量YMCAを用いたさいに達成可能な一塩基多型の網羅率と数の改善が浮き彫りになります。
標的となる内在性ヒトDNAの濃縮は、古代DNA研究における不充分な標本の保存状態を克服するためにひじょうに重要です。現代人男性から確認された1240kアッセイのY染色体一塩基多型は単に、信頼できるYHg分類のためのNRY上の診断用一塩基多型を、とくに現代の多様性に先行するYHgの事例では充分に網羅できない、と示され、最新の「Y染色体一塩基多型パネル」のために連続する領域を標的とする必要性が浮き彫りになります。YMCAは、他のキャプチャに使用され、追加の抽出もしくはライブラリの準備を必要としない、同じライブラリに適用できます。YMCAを本論文では試みられていない他のキャプチャアッセイと組み合わせることは確かに可能ですが、管理された研究における選択された男性標本の特注YMCAは、追加の配列作業を伴う(男性および女性標本への)手順複合適用よりも優れているかもしれない、と本論文は主張します。
YHg-H2(P96)のより詳細な分析を通じて、古代のYHg-H2の多様性に関する現在の理解は、系統樹的な歴史(NRYの歴史にも当てはまるはずです)と矛盾し、この多様性の解決は近東からヨーロッパへの新石器時代拡大の2経路へのさらなる裏づけにつながる、と示せます。それは、YMCAによりもたらされた改善された解像度なしには可能ではなかっただろう観察結果です。ユーラシア西部狩猟採集民のY染色体(YHg-I2aやI2bやC1a)の下位構造の研究や、青銅器時代ユーラシア西部やアジア中央部および南部YHg-R1aおよびR1bの多様化をよりよく特徴づけるために、こうした手法が将来適用されるよう期待されます。
参考文献:
Rohrlach AB. et al.(2021): Using Y-chromosome capture enrichment to resolve haplogroup H2 shows new evidence for a two-path Neolithic expansion to Western Europe. Scientific Reports, 11, 15005.
https://doi.org/10.1038/s41598-021-94491-z
この記事へのコメント