ユーラシア西部古代人における選択と現代人への遺伝的影響
ユーラシア西部古代人における選択と現代人への遺伝的影響に関する研究(Irving-Pease et al., 2024)が公表されました。本論文は、ユーラシア西部古代人の大規模なゲノムデータを用いて、ユーラシア西部の古代人集団における選択と、現代人への遺伝的影響を検証しています。たとえば、糖尿病とアルツハイマー病の危険性に関連する遺伝的多様体はヨーロッパ西部狩猟採集民と関連しており、南北のヨーロッパ人の間の身長差は、異なる草原地帯牧畜民の祖先集団に関連している、と明らかになりました。やはり、ユーラシア西部、とくにヨーロッパは古代ゲノム研究が最も進んでおり、ユーラシア東部においても同規模の研究が行なわれるよう、期待しています。
●要約
12000年前頃に始まった完新世には、ヒトの進化における最も重要な変化のいくつかが含まれ、現在の人口集団の食性や体や精神衛生に広範な影響がありました。1600個体以上の補完された古代人ゲノムのデータセット(関連記事)を用いて、ユーラシア西部全域の狩猟と採集から農耕と牧畜への移行期の選択の景観がモデル化されました。代謝と関連する重要な選択の兆候が特定され、その中には、脂肪酸不飽和化酵素(fatty acid desaturase、略してFADS)クラスタ(まとまり)における選択が以前に報告されたよりも早く始まったことと、ラクターゼ(Lactase、略してLCT)遺伝子座近くの選択がラクターゼ(乳糖分解酵素)活性持続(lactase persistence、略してLP)アレル(対立遺伝子)の出現に数千年先行することが含まれていました。HLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域における強い選択も見つかり、これは恐らく、青銅器時代における病原体への曝露増加に起因します。
古代の個体群のデータを用いてイギリス生物銀行の40万点以上の局所的な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)区域を推測するため、ユーラシア全域の中石器時代と新石器時代と青銅器時代の祖先系統の分布における広範な違いが特定されました。祖先系統特定的な多遺伝子危険性得点の計算により、ヨーロッパの南北間の伸長差が選択ではなく草原地帯祖先系統の差異と関連しており、気分に関連する表現型の危険性アレルが新石器時代農耕民祖先系統で豊富な一方で、糖尿病とアルツハイマー病の危険性アレルはヨーロッパ西部狩猟採集民祖先系統で豊富である、と示されます。本論文の結果から、古代の選択と移動がヨーロッパ現代人の表現型の多様性の分布に大きく寄与した、と示唆されます。
●研究史
ヒト進化遺伝学の中心的目標の一つは、自然選択が文化と環境の変化に応じて現代人のゲノムをどのように形成してきたのか、理解することです。ユーラシアの完新世における狩猟採集民から農耕民およびその後の牧畜民への移行には、最近のヒト進化において経てきた食性と健康と社会組織における最も劇的な変化の一部が含まれていました。これらの変化は環境への曝露における大きな移行を表しており、ヒトの遺伝子プールに作用する進化的力に影響を及ぼし、一連の不均一な選択圧を課しています。ヒトの生活様式が変化するにつれて、家畜動物との近い接触およびより高い人口密度は感染症への曝露を増加させ、現代人の免疫系への新たな変化をもたらしています(関連記事)。
ヒトにおける複雑な形質の遺伝的構造に関する理解はゲノム規模関連研究(genome-wide association studies、略してGWAS)により大きく発展しており、対象の表現型と関連する多くの遺伝的多様体が特定されてきました(関連記事)。しかし、これらの多様体が最近のヒト進化においてどの程度方向性選択下にあったのか、不明なままです。選択の痕跡は現存人口集団における遺伝的多様性のパターンから特定できますが、これはヒトでは困難かもしれず、それはヒトが時空間的にひじょうに多様で動的な局所的環境に曝されてきたからです。現代人のゲノムを構成する遺伝的類似性の複雑な斑状では、選択の推定される痕跡は選択過程の年代と規模を間違っているかもしれません。たとえば、祖先人口集団間の混合事象は、さらにさかのぼって起きた選択過程の証拠を含まない、現在のハプロタイプをもたらすかもしれません。古代DNAは、経時的な形質関連アレル(対立遺伝子)頻度における変化を直接的に観察することにより、これらの問題の解決可能性を提供します。
多くの先行研究(関連記事)が古代DNAを用いて完新世における選択のパターンを推測してきましたが、多くの重要な問題が未解決です。現在の 遺伝的差異はどの程度、自然選択もしくは混合のパターンの差異に起因するのでしょうか?現在の複雑な形質において、中石器時代と新石器時代と青銅器時代の人口集団の遺伝的遺産は何でしょうか?完新世ユーラシアの複雑な混合史は遺伝的データにおける自然選択の検出能力にどのように影響を及ぼしてきたでしょうか?これらの問題を調べるため、3通りの広範な手法を用いて、健康および生活様式と関連する多様体における多様な選択の痕跡が検証されました。
第一に、古代の人口集団間のアレル頻度における強い分化の特定により、証拠が探されました。第二に、経時的な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)固有のアレル頻度の軌跡をモデル化するための新たな染色体彩色を用いて、数万の形質関連多様体のアレル頻度の軌跡と選択係数が再構築されました。これにより、方向性選択の新たな証拠を伴う多くの形質と関連する多様体の特定と、重要な健康および食性および色素沈着と関連する遺伝子座の選択時期に関する長年の疑問への回答が可能になりました。第三に、古代ゲノムを用いて、イギリス生物銀行(United Kingdom Biobank、略してUKB)から得られた現代人の40万点以上の標本(関連記事)における局所的な祖先系統区域が推測され、35点の複雑な形質について祖先系統固有多遺伝子危険性得点が計算されました。これにより、現代人の表現型における中石器時代と新石器時代と青銅器時代の人口集団の遺伝的遺産の特徴づけが可能となりました。
●標本とデータ
本論文の分析は、関連研究(関連記事)で提示されたショットガン配列決定された古代人のゲノムの大規模な収集で行なわれました。このデータセットは、1664個体の補完された二倍体の古代人のゲノムと850万以上の一塩基多型(Single Nucleotide Polymorphism、略してSNP)で構成されており、1点のゲノムについて、推定補完誤差率は1.9%で、推定位相転換誤差率は2.0%です。このデータセットの補完と位相化の検証と評価は、先行研究で提供されています。これらの標本はユーラシアのかなりの横断区を表しており、経度では大西洋沿岸からバイカル湖地域まで、緯度ではスカンジナビア半島から中東までとなります(図1)。含まれるゲノムは、11000~1000年前頃の完全な時系列を形成します。このデータセットにより、ヒトの分化と環境における主要な移行によりもたらされる選択圧における変化の詳細な特徴づけが可能となります。以下は本論文の図1です。
●ユーラシア古代人の遺伝的遺産
区域供給源としての中石器時代と新石器時代と青銅器時代の個体群とともにUKBの染色体「彩色」を使用することによる、現在の人口集団における局所的な祖先系統区域の推測によって、分析が始められました。GLOBETROTTERから改修されたパイプラインを用いて、負ではない最小二乗法により混合割合が推定されました。合計で、433395点の現代人の標本が彩色され、それには126ヶ国のイギリス以外で生まれた個体から24511点の標本が含まれています。
本論文の結果から、中石器時代か新石器時代か青銅器時代の祖先系統のどれも現在のユーラシア人口集団において均一に分布していない、と示されます(図2)。ヨーロッパ西部狩猟採集民(Western hunter-gatherer、略してWHG)関連祖先系統はバルト諸国とベラルーシとポーランドとロシアの現在の個体群で最高の割合です。ヨーロッパ東部狩猟採集民(Eastern hunter-gatherer、略してEHG)関連祖先系統は、モンゴルとフィンランドとエストニアとアジア中央部において最高の割合です。コーカサス狩猟採集民(Caucasus hunter-gatherer、略してCHG)関連祖先系統は、コーカサスの東側の諸国、つまりパキスタンやインドやアフガニスタンやイランにおいて最高の割合で、以前の結果と一致します。CHG関連祖先系統はおそらく、CHGとイラン新石器時代個体群両方との類似性を反映しており、アジア南部におけるその相対的高水準を説明します(関連記事)。
予測と一致して、新石器時代アナトリア半島関連農耕民祖先系統は地中海盆地周辺に集中しており、ヨーロッパ南部と近東とアフリカ北部において高水準で、これには「アフリカの角」が含まれますが、ヨーロッパ北部ではそれよりも低い頻度です。これは草原地帯関連祖先系統とはひじょうに対照的で、この祖先系統はヨーロッパ北部において高水準で見られ、その最高頻度はアイルランドとアイスランドとノルウェーとスウェーデンで、南下するにつれて減少します。アジア南部への草原地帯関連祖先系統の拡大についての証拠もあります。全体的に、これらの結果は現在の個体群における古代の祖先系統の空間的分布の地球規模のパターンを洗練します。しかし要注意なのは、絶対的な混合割合が本論文における古代の供給源人口集団が、アフリカやアジア東部など現在の個体群とさほど直接的に関連していない地域では、慎重に解釈されるべきということです。これらの値は用いられた参照標本や混合前後の浮動の扱いに依存しますが、相対的な地理的差異と関連は一貫したままのはずです。以下は本論文の図2です。
主成分分析(principal component analysis、略してPCA)で類似の位置を共有している自己認識が「白人のイギリス人」である個体群から、多くの現代人標本(408884点)が利用可能となったことで、イギリスの現代人において高解像度で、古代の祖先系統の分布のさらなる調査が可能となります。地域的な祖先系統の分布はわずか数%異なるだけですが、イギリス全体にわたる地理的不均一性の明確な証拠が見つかりました。これは、出生地に基づく国ごとの祖先系統の割合の平均化により視覚化できます(図2)。
新石器時代農耕民祖先系統の割合は現在のイングランド南部および東部と、スコットランドとウェールズとコーンウォールの低地において最高です。草原地帯関連祖先系統は逆に分布しており、その最高頻度はアウター・ヘブリディーズとアイルランドで見られ、スコットランドのみで以前に報告されたパターンです。この地域的パターンは、ローマ期の前となる鉄器時代においてすでに明らかで、移住してきたアングロ・サクソン人がブリテン島南西部の鉄器時代個体群よりも新石器時代農耕民との類似性が相対的に少なかったにも関わらず、現在まで持続しています。この新石器時代農耕民と草原地帯関連の二分は、現代の「アングロ・サクソン」/「ケルト」の民族区分を反映していますが、その起源はより古く、相対的に新石器時代農耕民祖先系統が豊富な大陸の人口集団からの連続的移住から生じており、早くも後期青銅器時代に始まっています(関連記事)。
現在の個体群におけるこれらの祖先系統からのハプロタイプの測定により、これらのパターンは、イングランドとスコットランドの場合と同様にウェールズとコーンウォールを区別する、と示されます。イングランド中央部および北部における、より高水準のWHG関連祖先系統も見つかりました。これらの結果は、「民族集団」(白人のイギリス人)内の明確な祖先系統の違いを論証し、UKBなどの情報源を用いるさいの、微妙な人口構造の考慮の必要性を浮き彫りにします。
●祖先系統で階層化された選択的一掃
祖先系統の有意な違いが一見すると均質な現在の人口集団に存続していることを特定し、古代の個体群との遺伝的類似性に基づいてハプロタイプを分類表示できる染色体彩色技術の開発により、これらの影響の解明が試み狩られました。これを達成するため、過去5万年間にヨーロッパ現代人のゲノムに寄与した主要な4祖先系統の流動を表す、定量的混合図モデル(図3)が構築されました。このモデルを用いて、本論文の実証的データセットに相当する期間と標本規模でゲノムが模擬実験され、Relate(関連記事)を用いて系統樹系列が推測されました。中立網状分類指標が訓練され、ゲノムの各部位で、模擬実験された各個体によりたどられる人口構造を通じて時間的にさかのぼる経路が推定されました。訓練された分類指標は次に、品質選別に合格したユーラシア西部の1015点の補完された古代人のゲノムを用いて、各部位でたどられた祖先の経路の推測に用いられました。模擬実験を用いて、本論文の染色体彩色手法は、ヨーロッパ現代人につながる4通りの祖先経路について平均94.6%の正確さがあり、間違った列挙のモデル化に対して堅牢である、と示されます。以下は本論文の図3です。
次に、CLUESを用いて古代DNAの時系列データがモデル化され、それを用いて、GWAS一覧表 から得られた33341点の品質管理された形質関連多様体アレル頻度の軌跡と選択係数が推測されました。推定される中立的で頻度で組み合わされた同数の多様体が、制御設定としても散られました。あり得る交絡因子を制御するため、因果モデルが構築され、アレル頻度についての年代の直接的な影響が読み取り深度と読み取り長および/もしくは誤差率により媒介される間接的な影響から区別され、古代と現在の人口集団のデータ間の体系的な違いを評価するため使用される、マッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)偏りの検証が開発されました。異なるアレル頻度を有する集団間の混合は経時的なアレル頻度変化の解釈を混乱させるかもしれないので、染色体彩色モデルから局所的な祖先系統経路が用いられ、本論文の選択検証においてハプロタイプが階層化されました。これらの経路分類表示での条件付けにより、経時的な混合割合の変化を制御しながら、選択の軌跡を推測することが可能となります。
本論文の分析は、現在の個体群(1000人ゲノム計画のイギリスとフィンランドとイタリア中央部のトスカーナ人の集団)だけから得られたゲノムを用いると、ゲノム規模の有意な選択的一掃を特定しませんが、形質関連多様体は対照群と比較すると選択の証拠が豊富でした。対照的に、補完された古代DNAの遺伝子型確率を用いると、GWAS 群において11ヶ所のゲノム規模の有意な選択的一掃が特定され、一部のSNPが選択の証拠を示すにも関わらず、対照群では一掃は特定されませんでした。これらの結果は、形質関連多様体に対して選好的に作用した選択と一致します。次に、本論文の4通りの局所的な祖先系統経路のそれぞれに、つまり、WHGかEHGかCHGかアナトリア半島農耕民(Anatolian farmers、略してANA)を通じての局所的な祖先系統区域で選択分析が条件付けされ、21ヶ所のゲノム規模の有意な選択の最高点が特定されました。これは、祖先人口集団間の混合がユーラシア人口集団における多くの形質関連遺伝子座での選択の証拠を覆い隠してきた、と示唆しています。
●食性関連遺伝子座での選択
ヨーロッパへの、農耕民導入後ではあるものの、5000年前頃となる草原地帯牧畜民拡大の前となる、ラクターゼ(乳糖分解酵素)消化と関連する強い変化が見つかり、この時期は長年の論争となっています。祖先系統全体の分析における選択の最も強い全体的な兆候は、MCM6(minichromosome maintenance complex component 6、ミニ染色体維持タンパク質6)/ LCT遺伝子座(rs4988235:A)で観察され、派生的アレルがラクターゼ(乳糖分解酵素)活性持続(lactase persistence、略してLP)をもたらしました。
祖先系統全体の分析から推測される軌跡では、LPアレルは6000年前頃に頻度が増加し始め、現在まで増加し続けた、と示唆されます(図4)。祖先系統階層化分析では、この兆候はおもにEHGおよびCHGと関連する二つの祖先背景における一掃により駆動されます。この遺伝子座内の多くの選択されたSNPがrs4988235においてよりも早い選択の証拠を示したことも観察され、MCM6/LCT遺伝子座における洗濯機は以前に考えられていたよりも複雑である、と示唆されます。
これをさらに調べるため、選択検査が拡張され、260万塩基対(megabase、略してMb)規模の一掃の遺伝子座(5608ヶ所)すべてのSNPが含まれ、選択の最初の証拠が確認されました。この遺伝子座におけるほとんどのゲノム規模の有意なSNPはrs4988235より前に頻度が上昇し始めた、と観察され、この遺伝子座における強い正の選択はLPアレルの出現に数千年先行する、と示唆されます。ずっと早い頻度上昇を示すアレルには、12000年前頃に頻度上昇が始まったrs1438307:Tがあります(図4)。このアレルはエネルギー消費を調節し、代謝性疾患に寄与すると、と示されておれ、飢餓への古代の適応と示唆されてきました。
現在の個体群におけるrs1438307とrs4988235との間の高い連鎖不平衡は、LPアレルと飢餓および増加する病原体曝露への考古学的代理との間の最近観察された相関を説明できるかもしれません(関連記事)。補完によりもたらされる偏りの可能性を制御するため、古代DNA配列決定読み取りからの直接的呼び出された遺伝子型尤度を用いて、アレン(Allen)古代DNA情報源第52.2版から得られた刊行されている利用可能な124万配列データで、これらの結果が再現されました。以下は本論文の図4です。
脂肪酸不飽和化酵素(fatty acid desaturase、略してFADS)クラスタ(まとまり)における強い選択も、FADS1(rs174546:C)とFADS2(rs174581:G)で見つかり、これらは脂肪酸代謝と関連しており、より多くの/少ない菜食からより多くの/少ない肉食への食性の変化に対応すると知られています。以前の結果とは対照的に、より菜食的な食性と関連する選択のほとんどは新石器時代の人口集団においてヨーロッパへの到来前に起きており、新石器時代に継続した、と分かりました(図4)。祖先系統全体の分析におけるこの領域での選択の強い兆候はおもに、EHGとWHGとANAのハプロタイプ背景全体で起きた一掃に駆動されています(図4)。
興味深いことに、CHGは異形におけるこの遺伝子座での選択の統計的に有意な証拠は見つかりませんが、EHG背景におけるアレル頻度上昇のほとんどはCHGとの混合(8000年前頃)後に起き、CHG内では選択的アレルはすでに現在の頻度に近いものでした。これは、選択されたアレルがすでに中東の初期農耕民とコーカサスの狩猟採集民(それぞれANAおよびCHG背景と関連しています)においてかなりの頻度で存在し、東方集団が後期新石器時代と青銅器時代に北方と西方へ移動するにつれて、選択の継続を受けやすかったことを示唆します。
古代の狩猟採集民人口集団と農耕民人口集団を区別する選択兆候を具体的に比較すると、脂質や糖の代謝およびさまざまな代謝疾患と関連する多くの領域も観察されます。これらには、たとえばPATZ1のある22番染色体の領域も含まれ、PATZ1は、細胞脂質代謝において重要な役割を果たすFADS1やMORC2(Microrchidia 2、精巣萎縮)の発現を制御しています。3番染色体の別の領域は、免疫耐性および腸の恒常性の両方と関連するGPR15(G Protein-Coupled Receptor 15、Gタンパク質結合受容体15)と重複しています。最後に18番染色体では、クローン病など炎症性腸疾患と関連している、SMAD7にまたがる選択候補領域が回収されました。これらの結果をまとめると、農耕への移行がヒトに新たな食性と生活様式へと適応するかなりの量の選択を課しており、現在観察されるいくつかの疾患の蔓延がこれらの選択的過程の結果かもしれない、と示唆されます。
●免疫関連遺伝子座での選択
免疫および自己免疫疾患と関連するいくつかの遺伝子座における、強い選択の証拠も観察されます。これらの推定される選択事象の一部は以前に主張されていたよりも早く起きており、恐らくは農耕への移行と関連していて、それは現在の自己免疫疾患の高い罹患率を説明できるかもしれません。最も注目すべきことに、6番染色体において8Mb規模の選択的一掃(25.4~33.5Mb)の兆候が検出され、HLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域の全長にまたがっています。この遺伝子座内の多様体の選択の軌跡はいくつかの独立した一掃を裏づけ、それは異なる年代に異なる強度で発生しました。祖先系統全体の分析におけるこの遺伝子座での最も強い選択はHLA-AとHLA-Wの間の遺伝子間の多様体で(rs7747253:A)、これは水痘に対する防御や腸感染症の危険性増加や踵の骨度現象と関連しています。このアレルの頻度の急速な減少は8000年前頃以降始まり、水痘の危険性増加を代償に、腸感染症の危険性が減少しました。
対照的に、この一掃内でも見られるC2(complement C2)遺伝子における選択の兆候(rs9267677:C)は、1000年前頃の急速な上昇の前に、4000年前頃に始まる漸進的な頻度増加を示します。この事例では、好ましいアレルは、おもにヒトパピローマウイルスにより引き起こされるいくつかの性感染症(sexually transmitted diseases、略してSTD)に対する防御や、乾癬の危険性増加と関連しています。この遺伝子座は、現在の人口集団における自己免疫疾患の高い罹患率が部分的には、遺伝的相殺(トレードオフ)に起因するかもしれない、という可能性の好例を提供します。つまり、選択が、自己免疫疾患の感受性増加の多面発現性効果とともに病原体に対する防御を増加させる、というわけです。
これらの結果は、HLA遺伝子座における選択の複雑な時間的動態も浮き彫りにします。HLA遺伝子は免疫系の制御に役割を果たすだけではなく、多くの非免疫関連表現型とも関連しています。この領域における高度な多面発現のため、どの選択圧がさまざまな期間における頻度の増加を駆動したのか、判断が困難となっています。しかし、完新世におけるユーラシア人口集団の生活様式の顕著な変化が、免疫応答に関わる遺伝子座での強い選択の駆動体だった、と示唆されてきました。これらには、より高い移動性や人口密度増加と組み合わされた、食性の変化や家畜とのより密な接触が含まれます。関連論文では、HLA遺伝子座における祖先系統固有の選択の複雑なパターンがさらに調べられています。
蚊に刺されたことから生じる痒みの強さや子供期や成人期の喘息および喘息関連感染症と関連するSLC22A4(solute carrier family 22 member 4A、溶質保因者族22構成員4A)遺伝子座での選択の兆候(rs35260072:C)も特定され、その派生的多様体は9000年前頃以降着実に頻度が増加してきた、と分かりました。しかし、rs35260072と同じSLC22A4候補領域では、以前に報告された、喘息に対する防御となり感染症と関連しているアレル(rs1050152:T)の頻度が、最近の頻度上昇を示唆する以前の報告と歯対照的に、1500年前頃に案低水準になった、と分かりました。同様に、HECTD4(rs11066188:A)およびATXN2(rs653178:C)遺伝子座における選択が検出され、両方とも9000年前頃に頻度が上昇し、これもより最近の頻度上昇を指摘した以前の報告と対照的です。
これらのSNPは尿道炎および尿道症候群 と関連しており、こうした疾患はSTDもしくは5回以上の出産による蓄積された尿道損傷により引き起こされることが多くなっています。両SNP(rs11066188:Aとrs653178:C)は、腸感染症、いくつかの非特定的寄生虫性疾患、住血吸虫症、蠕虫症、スピロヘータ、肺炎、ウイルス性肝炎の危険性増加とも関連しています。これらのSNPは、セリアック病や関節リウマチの危険性も増加させます。したがって、以前には最近の適応の結果と考えられていた、いくつかの高度に多面発言的な疾患関連の遺伝子座は、ずっと長い期間にわたって選択の対象だったかもしれません。
●17q21.31遺伝子座での選択
17番染色体の2Mbの一掃(44.0~46.0Mb)において強い選択の痕跡がさらに検出され、これは神経変性および発達障害と関わっている、17q21.3上の遺伝子座にまたがっています。この遺伝子座には、一部のヒト集団における最近の正の選択の指標を有する逆位および他の構造的多型が含まれます。具体的には、KANSL1遺伝子の部分的重複が反転(H2)および非反転(H1)ハプロタイプで恐らく起きており、両者は現在のヨーロッパ中央部および中東人口集団において高頻度(15~25%)で見られるものの、サハラ砂漠以南のアフリカやアジア東部の人口集団ではずっと稀です。両方のSNP遺伝子型と全ゲノム配列決定(whole-genome sequencing、略してWGS)読み取り深度情報を用いて、本論文で調べられた古代の個体群における反転(H1およびH2)とKANSL1の(複数の)重複状態が判断されました。
H2ハプロタイプは、1万年前頃となるアナトリア半島無土器関連新石器時代個体群の以前に刊行された3点のゲノムのうち2点(Bon001とBon004)で観察されましたが、データはKANSL1の特定には不充分でした。KANSL1重複の最古の証拠は現在のイランで発見された初期新石器時代個体(9900年前頃のAH1)で課金殺され、それに続くのが、現在のジョージア(グルジア)で発見された中石器時代の2個体(9724年前頃のNEO281と9720年前頃のKK1)となり、この3個体は全て反転の異型接合で、反転した重複を有しています。
KANSL1の重複は、現在のロシアの新石器時代の2個体(H1dとなる7919年前頃のNEO560と、H2dとなる7390年前頃のNEO212)でも検出されています。H1dとH2dはともにアナトリア半島農耕民祖先系統とともにヨーロッパの大半に拡大してきており、その頻度は草原地帯関連祖先系統がヨーロッパ亜大陸の大半で優勢になったので、ヨーロッパの大半で変化しなかったようです。H1dとH2dがアナトリア半島農耕民と最初の草原地帯関連祖先系統の両方において明らかに高頻度で見られる、という事実から、H1dおよびH2d多様体に作用した選択的一掃はおそらく両者の祖先人口集団で起きた、と示唆されます。
この遺伝子座における祖先系統全体の分析で観察された選択の最も強い兆候がMAPT(microtubule-associated protein tau、微小管関連タンパク質タウ)遺伝子にあり(rs4792897:G)、この遺伝子がタウタンパク質をコードし、おたふく風邪に対する防御や鼾の危険性増加と関連していることに要注意です。より一般的には、MAPTにおける多型はいくつかの神経変性疾患の危険性増加と関連しており、それにはアルツハイマー病とパーキンソン病が含まれます。しかし、この領域は、複雑な構造多型に起因して、本論文のデータセット、とくにKANSL1遺伝子周辺における参照の偏りの証拠でも豊富であることに要注意です。
●色素沈着遺伝子座での選択
本論文の結果は、北方と西方へ移動した集団におけるより明るい肌の色素沈着の強い選択を特定し、これは選択が減少した紫外線曝露とその結果としてのビタミンD不足により引き起こされた、という見解と一致します。最も強く選択されたアレルは数千年前にほぼ固定に達した、と分かり、この過程は以前に提案されたように最近の性選択と関連していなかった、と示唆されます。祖先系統全体の分析では、SLC45A2遺伝子座における強い選択(rs35395:C)が検出され、13000年前頃以降に選択されたアレル(より明るい色の肌と関連しています)の頻度が、2000年前頃に安定水準に達するまで増加しました(図4)。有力な仮説は、肌における高いメラニン水準は赤道付近のちいきでは紫外線照射への保護のため重要であるのに対して、より明るい色の肌はより高緯度(紫外線照射が弱くなります)で選択され、それはいくらかの紫外線姦通がビタミンDの皮膚の合成に必要だから、というものです。本論文の調査結果は、大きな効果規模の遺伝子座の小さな割合でとくに、完新世における選択の重要な標的としての色素沈着アレルを確証します。
本論文の結果は、これらの過程の期間と地理的拡大に関する詳細な情報も提供し(図4)、より明るい色の肌と関連するアレルは、恐らくさまざまな地域で様々な地時期に起きた類似の環境圧力の結果として繰り返し選択された、と示唆されます。祖先系統階層化分析では、全ての周辺的な祖先系統はSLC45A2遺伝子座における広範な一致を示しますが(図4)、その頻度変化の時期では異なっています。ANA関連祖先系統背景はrs35395での選択の最初の証拠を示し、それに続くのが1万年前頃となるEHGおよびWHGと、2000年前頃のCHGです。全ての祖先系統背景では、ANAを除いて、選択されたハプロタイプは2000年前頃までに安定水準に達に達しましたが、ANAハプロタイプ背景はその1000年以上前にほぼ固定に達しました。SLC24A5遺伝子座における強い選択も検出され(rs1426654:A)、これは肌の色素沈着とも関連しています。この遺伝子座では、選択されたアレルの頻度はSLC45A2よりもさらに早く増加し、3500年前頃にはほぼ固定に徹しました。したがって、この遺伝子座での選択は、北方と西方へ移動した集団では早期に起き、WHG背景では、これらの集団が侵入してきた人口集団と遭遇し混合した後になってやっと起きたようです。
●差異の主軸での選択
中石器時代~新石器時代の移行における遺伝的変化のパターンを超えて、現在観察される多くの遺伝的変異性は、最終的に現在のヨーロッパ人の遺伝的多様性に寄与した狩猟採集民集団における高度な遺伝的分化を反映しています。じっさい、循環器系疾患や代謝疾患や生活病と関連する多くの遺伝子座は、新石器時代への移行の前の遺伝的変異性が、ユーラシア大陸のさまざまな地域に居住する祖先系統群における古代の差異的な選択にたどれます。これらの遺伝子座は、後期更新世と初期完新世における古代の狩猟採集民集団間の分化につながった、上述の混合事象に先行する選択事象を表しているかもしれません。これらのうち一つは、肥満の個体で有意に発現している塩分感受性遺伝子であるSLC24A3遺伝子と重複しています。
別の遺伝子座は、血管疾患と関連するROPN1およびKALRNという2個の遺伝子にまたがっています。さらなる領域には、チアミン輸送をコードし、漢人コホート(特定の性質が一致する個体で構成される集団)において高血圧と関連づけられてきた、SLC35F3遺伝子が含まれています。最後に、肥満および脂質代謝と関連するいくつかの遺伝子(CH25HとFAS)を含む候補領域と、ブドウ糖恒常性および脂肪酸代謝と関わるいくつかの遺伝子(ASXL2、RAB10、HADHA、GPR113)を伴う別の最高点があります。これらの遺伝子座はおもに、ユーラシアの東西のゲノム間の極端な文化の古代のパターンを反映しており、ユーラシア大陸全域のさまざまな環境に居住した更新世人口集団の45000年前頃(関連記事)となる分離後の選択の候補かもしれません。
●病原性構造多様体
稀で繰り返しのコピー数多様体(copy-number variants、略してCNV)が、神経発達障害を引き起こすと知られており、さまざまな発現度と不完全な浸透度を伴う広範囲の精神的および身体的形質と関連しています。経時的な病原性構造多様体の疾患率を理解するため、ヒトの発達障害の最も一般的な要因と知られている、繰り返しのCNVの影響を受けやすい50ヶ所のゲノム領域が調べられました。この分析には、CNV分析品質管理に合格した1442個体の古代人のショットガンゲノムと、比較のため1093個体の現代人のゲノム(関連記事)が含まれました。
読み取り深度に基づく手法とデジタル比較ゲノム混成を用いて、10ヶ所の遺伝子座における古代の個体群のCNVが特定されました。観察されたCNVのほとんど(15q11.2とCHRNA7遺伝子での重複と、TAR 遺伝子座と22q11.2遠位の部分にまたがるCNV)は大規模研究で明確に疾患と関連づけられてきたわけではありませんが、特定されたCNVには欠失と重複が含まれ、それらは発達遅延や異形症の特徴や自閉症などの精神神経的異常と関連づけられてきました(最も顕著なのは1q21.1と3q29と16p12.1とDiGeorge/VCFS遺伝子座ですが、15q11.2の欠失と16p13.11の重複もあります)。全体的に、古代の個体群における保因者頻度はUKBゲノムでの報告と類似しておいます(15q11.2とCHRNA7遺伝子の組み合わせでは1.25%対1.6%、組み合わされた残りの遺伝子座全体では0.8%対1.1%)。これらの結果から、いくつかの症状につながるかもしれない大規模で繰り返しのCNVは、本論文で含まれる古代と現在の人口集団において類似の頻度で存在した、と示唆されます。
●ユーラシア古代人の表現型の遺産
形質関連多様体の選択の証拠を特定することに加えて、現在の個体群における複雑な形質の差異への、(EHGやCHGやWHGや草原地帯牧畜民や新石器時代農耕民と関連する)さまざまな遺伝的祖先系統からの寄与も推定されました。ChromoPainterを用いて、40万点以上のUKB標本染色体彩色に基づいて、祖先系統固有多遺伝危険性得点(ancestry-specific polygenic risk score、略してARS)が計算されました(図5)。これは、どの古代の祖先系統構成要素が特定の形質と有意に関連している遺伝子座において現在のイギリス人口集団で過剰に発現しているのか、特定を可能とし、現在の1個体が、その祖先系統構成要素が本論文で定義された祖先系統分類の一つから完全に構成されているのならば、保有している遺伝的危険性と類似しています。以下は本論文の図5です。
この分析は人口集団間の多遺伝子危険性得点の可能性と関連する問題を避けており、それは、ARSが有効規模推定に用いられた同じ個体から計算されているからです。多くの補完された古代人ゲノムで研究することにより、祖先供給源として古代の人口集団を使用するための高い統計的検出力が提供されます。本論文は、多遺伝子得点が古代の人口集団で有意に過剰拡散していた35点の表現型と、アルツハイマー病の発症の危険性を有意に媒介すると知られている、APOE遺伝子における3点の大きな影響のあるアレル(ApoE2、ApoE3、ApoE4)に焦点を当てました。本論文では、この手法が古代の表現型に直接的な参照をしないものの、代わりにこれらの遺伝的祖先系統構成要素が現在の表現型の景観にどのように寄与したのか説明する、と強調されます。
体感予測質量やFEV1(forced expiratory volume in 1-second、1秒間の努力呼気量)や基礎代謝率など多くの人体計測的形質について、草原地帯関連祖先系統でのARSが最高で、EHGとCHGおよびWHGがそれに続きましたが、新石器時代農耕民祖先系統は一反して、これらの測定では最低点でした。先行研究と一致して、髪と皮膚の色素沈着も有意な違いを示し、WHGとEHGとCHGの祖先系統の肌の色の得点は新石器時代農耕民および草原地帯関連祖先系統より高く(つまり、より濃いことになります)、皮膚の悪性腫瘍と関連する形質の得点は新石器時代農耕民関連祖先系統において上昇しました。新石器時代農耕民関連および草原地帯関連祖先系統は両方とも金髪と明るい茶髪の得点がより高かったのに対して、狩猟採集民関連祖先系統は濃い茶色の髪の得点がより高く、CHG関連祖先系統は黒髪で最高得点でした。
疾患の危険性への遺伝的寄与の観点では、WHGの祖先的構成要素が、コレステロールおよび血圧および糖尿病と関連する形質で驚くほど高得点でした。新石器時代農耕民構成要素は、不安と罪悪感と短気で最高得点となり、CHGおよびWHG祖先系統構成要素は一貫して、これらの形質では最低得点でした。ApoE4アレル(アルツハイマー病の危険性を増加させる、rs429358:Cとrs7412:C)がWHG/EHGハプロタイプ背景で優先的に示されることが分かり、それは恐らく初期狩猟採集民によりユーラシア西部にもたらされた、と示唆されます。この結果は、そのアレルのヨーロッパ現代人の分布と一致し、ヨーロッパ北東部において最高で、これらの祖先系統の割合はヨーロッパ北東部においてヨーロッパ大陸の他地域より高くなっています。
対照的に、草原地帯牧畜民との類似性を有するハプロタイプ背景で、ApoE2アレル(アルツハイマー病の危険性を減少させる、rs429358:Tとrs7412:T)が見つかりました。本論文の祖先系統全体の分析では、7000年前頃に始まり2500年前頃に案低水準に達した、ApoE2を選好する正の選択が特定されました。しかし、より小さな標本規模と位相化されていない遺伝子型での最近の研究とは対照的に、ApoE3(rs429358:Tおよびrs7412:C)もしくはApoE4のどちらかで選択の証拠は特定されませんでした。草原地帯牧畜民における恐らくはApoE2を選好する選択圧は、マラリアもしくは未知のウイルス性感染に対する防御など、感染症の攻撃に対する防御的な免疫応答と関連しているかもしれません。
イギリス内およびユーラシア全域における祖先系統勾配の観点では(図2)、これらの結果は、表現型と疾患危険性における移動に媒介された地理的差異はありふれており、現在の人口集団間の異なる混合過程を通じて地理的に構造化された疾患蔓延の拡大への方向性を示している、との示唆を裏づけます。これらの結果は、身長に関連するヨーロッパにおける選択の有名な議論の解明にも役立ちます。草原地帯およびEHG関連の祖先的構成要素がUKBにおいて身長の遺伝的値を高めている、との本論文の調査結果から、ヨーロッパの南北間の身長差は、多くの先行研究で主張されたように、選択ではなく、祖先系統の違いの結果かもしれない、と論証されます。しかし、本論文の結果は、身長が特定の人口集団において選択されてきた可能性を排除しません。
●考察
狩猟および採集から農耕民とその後の牧畜への移行から生じた食性における根本的変化は、現在のユーラシア人口集団の身体的および精神的健康に広範囲の結果をもたらしました。これらの劇的な文化的変化は、新たな感染症の困難への耐性の選択を含めて、おそらく食性の変化および人口密度の増加と関連する、選択圧の不均一な混合を生み出しました。各一掃領域の高度に多面発現的な性質のため、要因を本論文の選択兆候のいずれかに帰するのは困難で、本論文は全ての形質と関連していない多様体を網羅的に検証したわけではありません。しかし、本論文の結果から、完新世における選択は現在の遺伝的疾患危険性や、代謝および人体計測的形質に影響する遺伝的要因分布にかなりの影響を及ぼしてきた、と示されます。
本論文の分析から、現代人のゲノムにおける自然選択の痕跡の検出能力が、その兆候を覆い隠す、さまざまな祖先人口集団における相反する選択圧により大きく制約されていることも示されます。混合の差異を考慮しながら、選択をたどる手法の開発は、ゲノム規模の有意な選択の頂点を効率的倍増させることができ、食性および生活様式と関連するいくつかの多様体の軌跡の解明に役立ちました。本論文ではさらに、局所的な選択下にあったと考えられている多くの複雑な形質が、現在の差異への古代の個体群の異なる遺伝的寄与によってより適切に説明される、と示されました。本論文の結果は全体的に、古代の選択と中石器時代および新石器時代および青銅器時代に起きた主要な混合事象との間の相互作用が、ユーラシア全域の現代人で観察される遺伝的差異のパターンをどのように深く形成してきたのか、強調します。以下は『ネイチャー』の日本語サイトからの引用(引用1および引用2)です。
ゲノミクス:古代ヨーロッパ人のゲノムは現代人集団のゲノムをどのように形作ったのか
古代ユーラシア人集団のゲノム史を洞察するための手掛かりが、古代DNAの解析によって得られた。この知見を報告する4編の論文が、今週、Natureに掲載される。これらの論文に示された研究では、合わせて1600人以上の古代人の遺伝的データが解析され、過去約1万5000年にわたるヨーロッパの人類集団史に関する知見がもたらされた。
現代の西ユーラシア人集団の遺伝的多様性は、3つの主要な移住現象によって形作られたと考えられている。すなわち、約4万5000年前以降の狩猟採集民の到来、約1万1000年前以降の中東からの新石器時代の農耕民の拡大、そして約5000年前のポントスステップからのステップ牧畜民の到来である。狩猟採集から農耕への転換は、人類の歴史における重要な移行であるが、この移行期におけるヨーロッパとアジアの集団の構造と人口動態の変化に関する詳細な情報は少ない。
Morten Allentoft、Martin Sikora、Eske Willerslevらは1つ目の論文で、こうした過程を大陸横断的な規模で調べるため、ユーラシア大陸の北部と西部で見つかった、主に中石器時代と新石器時代の古代人317人のゲノムデータについて塩基配列を決定したことを報告している(中石器時代には、狩猟採集民と新石器時代の農耕民との間の空白を埋めるという意義がある)。また、今回の研究では、既存の1300人以上の古代人の遺伝子データも解析された。その結果、狩猟採集民から農耕民への移行の遺伝的影響に関して、黒海からバルト海まで伸びる非常に明確な「ゲノムの境界線」が存在することが明らかになった。この境界線の西側では、農耕の導入によって血統の変化を示す大規模な遺伝的変化が起こったが、これと同じ時期に、境界線の東側では、大きな変化は起こらなかった。著者らは、こうした違いが生じたのは境界線の東側の地域の気候条件が中東の農耕技術にあまり適していなかったためで、そのため狩猟採集社会が境界線の西側より約3000年長く続いた可能性があると指摘している。ステップ牧畜民の到来と拡大は、このゲノムの境界線の消失と関連している。
この他に、今週のNatureには、こうした遺伝的変化が現代のヨーロッパ人にどのような形で残っているかを調べた複数の論文(1つ目の論文と著者が重複している)が同時掲載される。2つ目の論文では、神経系の自己免疫疾患である多発性硬化症(MS)に対するヨーロッパ人の遺伝的リスクが高い原因が特定されたことが報告されている。この研究では、古代ゲノムのデータセットの一部と現代の英国在住のヨーロッパ系白人(自己申告による)約41万人のゲノムが比較され、現代のヨーロッパ人において、異なる古代ヨーロッパ人集団由来の遺伝物質が占める割合が定量化された。その結果、MSの遺伝的リスクはポントスステップの牧畜民の間で生じ、約5000年前にヨーロッパに持ち込まれ、これが記録のある移住現象と同時期であったことが明らかになった。また、この論文では、MSに関連した遺伝的バリアントが、感染症の有病率が増加していた時期に、ステップ牧畜民の生活習慣と環境に関連する免疫的優位性をもたらした可能性が示唆されている。
3つ目の論文では、古代の祖先集団の形質と現代人の形質の関連性がさらに指摘されている。例えば、糖尿病とアルツハイマー病のリスクに関連する遺伝的バリアントは、西欧の狩猟採集民の祖先集団に関連しており、北ヨーロッパ人と南ヨーロッパ人の身長差は、異なるステップ牧畜民の祖先集団に関連していることが明らかになった。また、4つ目の論文では、古代デンマークの集団を対象とした研究で、デンマークで発見された100体のヒトの骨格(中石器時代、新石器時代、青銅器時代前期の7300年間にわたる)のゲノム解析の結果が報告されている。この研究では、人口動態、文化、土地利用、食生活の変化のパターンが解明された。
以上の知見は、古代人集団における遺伝的選択と移住現象が、現代のヨーロッパ人に見られる多様な形質にどのように顕著な寄与をしたかを示している。
古代DNA:古代ユーラシア人の選択の全体像と遺伝的遺産
Cover Story:ステップ起源の変化:先史時代のユーラシアにおける移動と生活様式の変化が多発性硬化症の遺伝的リスクの上昇に関連している
今週号の4報の論文でE Willerslevたちは、古代ユーラシアから得られた遺伝学的データを用いて、先史時代の集団に対する大陸横断的な移動の影響を調べている。その結果、古代のステップ集団、農耕民集団、狩猟採集民集団の間の混合に由来すると思われる遺伝的な変化の一部が解き明かされた。特に、ステップ集団の移動が、おそらく狩猟採集から農耕と牧畜に集団が切り替わった際の病原体からの保護に伴う進化的圧力の結果として、ヨーロッパに多発性硬化症への遺伝的リスクの増大をもたらしたことが見いだされている。表紙は、ユーラシアステップの古代墓地で発見された典型的なクルガンの石碑のイラストを用いて、多発性硬化症のリスクとの遺伝的関連性に関わるイメージを表現している。
参考文献:
Irving-Pease EK. et al.(2024): The selection landscape and genetic legacy of ancient Eurasians. Nature, 625, 7994, 312–320.
https://doi.org/10.1038/s41586-023-06705-1
●要約
12000年前頃に始まった完新世には、ヒトの進化における最も重要な変化のいくつかが含まれ、現在の人口集団の食性や体や精神衛生に広範な影響がありました。1600個体以上の補完された古代人ゲノムのデータセット(関連記事)を用いて、ユーラシア西部全域の狩猟と採集から農耕と牧畜への移行期の選択の景観がモデル化されました。代謝と関連する重要な選択の兆候が特定され、その中には、脂肪酸不飽和化酵素(fatty acid desaturase、略してFADS)クラスタ(まとまり)における選択が以前に報告されたよりも早く始まったことと、ラクターゼ(Lactase、略してLCT)遺伝子座近くの選択がラクターゼ(乳糖分解酵素)活性持続(lactase persistence、略してLP)アレル(対立遺伝子)の出現に数千年先行することが含まれていました。HLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域における強い選択も見つかり、これは恐らく、青銅器時代における病原体への曝露増加に起因します。
古代の個体群のデータを用いてイギリス生物銀行の40万点以上の局所的な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)区域を推測するため、ユーラシア全域の中石器時代と新石器時代と青銅器時代の祖先系統の分布における広範な違いが特定されました。祖先系統特定的な多遺伝子危険性得点の計算により、ヨーロッパの南北間の伸長差が選択ではなく草原地帯祖先系統の差異と関連しており、気分に関連する表現型の危険性アレルが新石器時代農耕民祖先系統で豊富な一方で、糖尿病とアルツハイマー病の危険性アレルはヨーロッパ西部狩猟採集民祖先系統で豊富である、と示されます。本論文の結果から、古代の選択と移動がヨーロッパ現代人の表現型の多様性の分布に大きく寄与した、と示唆されます。
●研究史
ヒト進化遺伝学の中心的目標の一つは、自然選択が文化と環境の変化に応じて現代人のゲノムをどのように形成してきたのか、理解することです。ユーラシアの完新世における狩猟採集民から農耕民およびその後の牧畜民への移行には、最近のヒト進化において経てきた食性と健康と社会組織における最も劇的な変化の一部が含まれていました。これらの変化は環境への曝露における大きな移行を表しており、ヒトの遺伝子プールに作用する進化的力に影響を及ぼし、一連の不均一な選択圧を課しています。ヒトの生活様式が変化するにつれて、家畜動物との近い接触およびより高い人口密度は感染症への曝露を増加させ、現代人の免疫系への新たな変化をもたらしています(関連記事)。
ヒトにおける複雑な形質の遺伝的構造に関する理解はゲノム規模関連研究(genome-wide association studies、略してGWAS)により大きく発展しており、対象の表現型と関連する多くの遺伝的多様体が特定されてきました(関連記事)。しかし、これらの多様体が最近のヒト進化においてどの程度方向性選択下にあったのか、不明なままです。選択の痕跡は現存人口集団における遺伝的多様性のパターンから特定できますが、これはヒトでは困難かもしれず、それはヒトが時空間的にひじょうに多様で動的な局所的環境に曝されてきたからです。現代人のゲノムを構成する遺伝的類似性の複雑な斑状では、選択の推定される痕跡は選択過程の年代と規模を間違っているかもしれません。たとえば、祖先人口集団間の混合事象は、さらにさかのぼって起きた選択過程の証拠を含まない、現在のハプロタイプをもたらすかもしれません。古代DNAは、経時的な形質関連アレル(対立遺伝子)頻度における変化を直接的に観察することにより、これらの問題の解決可能性を提供します。
多くの先行研究(関連記事)が古代DNAを用いて完新世における選択のパターンを推測してきましたが、多くの重要な問題が未解決です。現在の 遺伝的差異はどの程度、自然選択もしくは混合のパターンの差異に起因するのでしょうか?現在の複雑な形質において、中石器時代と新石器時代と青銅器時代の人口集団の遺伝的遺産は何でしょうか?完新世ユーラシアの複雑な混合史は遺伝的データにおける自然選択の検出能力にどのように影響を及ぼしてきたでしょうか?これらの問題を調べるため、3通りの広範な手法を用いて、健康および生活様式と関連する多様体における多様な選択の痕跡が検証されました。
第一に、古代の人口集団間のアレル頻度における強い分化の特定により、証拠が探されました。第二に、経時的な祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)固有のアレル頻度の軌跡をモデル化するための新たな染色体彩色を用いて、数万の形質関連多様体のアレル頻度の軌跡と選択係数が再構築されました。これにより、方向性選択の新たな証拠を伴う多くの形質と関連する多様体の特定と、重要な健康および食性および色素沈着と関連する遺伝子座の選択時期に関する長年の疑問への回答が可能になりました。第三に、古代ゲノムを用いて、イギリス生物銀行(United Kingdom Biobank、略してUKB)から得られた現代人の40万点以上の標本(関連記事)における局所的な祖先系統区域が推測され、35点の複雑な形質について祖先系統固有多遺伝子危険性得点が計算されました。これにより、現代人の表現型における中石器時代と新石器時代と青銅器時代の人口集団の遺伝的遺産の特徴づけが可能となりました。
●標本とデータ
本論文の分析は、関連研究(関連記事)で提示されたショットガン配列決定された古代人のゲノムの大規模な収集で行なわれました。このデータセットは、1664個体の補完された二倍体の古代人のゲノムと850万以上の一塩基多型(Single Nucleotide Polymorphism、略してSNP)で構成されており、1点のゲノムについて、推定補完誤差率は1.9%で、推定位相転換誤差率は2.0%です。このデータセットの補完と位相化の検証と評価は、先行研究で提供されています。これらの標本はユーラシアのかなりの横断区を表しており、経度では大西洋沿岸からバイカル湖地域まで、緯度ではスカンジナビア半島から中東までとなります(図1)。含まれるゲノムは、11000~1000年前頃の完全な時系列を形成します。このデータセットにより、ヒトの分化と環境における主要な移行によりもたらされる選択圧における変化の詳細な特徴づけが可能となります。以下は本論文の図1です。
●ユーラシア古代人の遺伝的遺産
区域供給源としての中石器時代と新石器時代と青銅器時代の個体群とともにUKBの染色体「彩色」を使用することによる、現在の人口集団における局所的な祖先系統区域の推測によって、分析が始められました。GLOBETROTTERから改修されたパイプラインを用いて、負ではない最小二乗法により混合割合が推定されました。合計で、433395点の現代人の標本が彩色され、それには126ヶ国のイギリス以外で生まれた個体から24511点の標本が含まれています。
本論文の結果から、中石器時代か新石器時代か青銅器時代の祖先系統のどれも現在のユーラシア人口集団において均一に分布していない、と示されます(図2)。ヨーロッパ西部狩猟採集民(Western hunter-gatherer、略してWHG)関連祖先系統はバルト諸国とベラルーシとポーランドとロシアの現在の個体群で最高の割合です。ヨーロッパ東部狩猟採集民(Eastern hunter-gatherer、略してEHG)関連祖先系統は、モンゴルとフィンランドとエストニアとアジア中央部において最高の割合です。コーカサス狩猟採集民(Caucasus hunter-gatherer、略してCHG)関連祖先系統は、コーカサスの東側の諸国、つまりパキスタンやインドやアフガニスタンやイランにおいて最高の割合で、以前の結果と一致します。CHG関連祖先系統はおそらく、CHGとイラン新石器時代個体群両方との類似性を反映しており、アジア南部におけるその相対的高水準を説明します(関連記事)。
予測と一致して、新石器時代アナトリア半島関連農耕民祖先系統は地中海盆地周辺に集中しており、ヨーロッパ南部と近東とアフリカ北部において高水準で、これには「アフリカの角」が含まれますが、ヨーロッパ北部ではそれよりも低い頻度です。これは草原地帯関連祖先系統とはひじょうに対照的で、この祖先系統はヨーロッパ北部において高水準で見られ、その最高頻度はアイルランドとアイスランドとノルウェーとスウェーデンで、南下するにつれて減少します。アジア南部への草原地帯関連祖先系統の拡大についての証拠もあります。全体的に、これらの結果は現在の個体群における古代の祖先系統の空間的分布の地球規模のパターンを洗練します。しかし要注意なのは、絶対的な混合割合が本論文における古代の供給源人口集団が、アフリカやアジア東部など現在の個体群とさほど直接的に関連していない地域では、慎重に解釈されるべきということです。これらの値は用いられた参照標本や混合前後の浮動の扱いに依存しますが、相対的な地理的差異と関連は一貫したままのはずです。以下は本論文の図2です。
主成分分析(principal component analysis、略してPCA)で類似の位置を共有している自己認識が「白人のイギリス人」である個体群から、多くの現代人標本(408884点)が利用可能となったことで、イギリスの現代人において高解像度で、古代の祖先系統の分布のさらなる調査が可能となります。地域的な祖先系統の分布はわずか数%異なるだけですが、イギリス全体にわたる地理的不均一性の明確な証拠が見つかりました。これは、出生地に基づく国ごとの祖先系統の割合の平均化により視覚化できます(図2)。
新石器時代農耕民祖先系統の割合は現在のイングランド南部および東部と、スコットランドとウェールズとコーンウォールの低地において最高です。草原地帯関連祖先系統は逆に分布しており、その最高頻度はアウター・ヘブリディーズとアイルランドで見られ、スコットランドのみで以前に報告されたパターンです。この地域的パターンは、ローマ期の前となる鉄器時代においてすでに明らかで、移住してきたアングロ・サクソン人がブリテン島南西部の鉄器時代個体群よりも新石器時代農耕民との類似性が相対的に少なかったにも関わらず、現在まで持続しています。この新石器時代農耕民と草原地帯関連の二分は、現代の「アングロ・サクソン」/「ケルト」の民族区分を反映していますが、その起源はより古く、相対的に新石器時代農耕民祖先系統が豊富な大陸の人口集団からの連続的移住から生じており、早くも後期青銅器時代に始まっています(関連記事)。
現在の個体群におけるこれらの祖先系統からのハプロタイプの測定により、これらのパターンは、イングランドとスコットランドの場合と同様にウェールズとコーンウォールを区別する、と示されます。イングランド中央部および北部における、より高水準のWHG関連祖先系統も見つかりました。これらの結果は、「民族集団」(白人のイギリス人)内の明確な祖先系統の違いを論証し、UKBなどの情報源を用いるさいの、微妙な人口構造の考慮の必要性を浮き彫りにします。
●祖先系統で階層化された選択的一掃
祖先系統の有意な違いが一見すると均質な現在の人口集団に存続していることを特定し、古代の個体群との遺伝的類似性に基づいてハプロタイプを分類表示できる染色体彩色技術の開発により、これらの影響の解明が試み狩られました。これを達成するため、過去5万年間にヨーロッパ現代人のゲノムに寄与した主要な4祖先系統の流動を表す、定量的混合図モデル(図3)が構築されました。このモデルを用いて、本論文の実証的データセットに相当する期間と標本規模でゲノムが模擬実験され、Relate(関連記事)を用いて系統樹系列が推測されました。中立網状分類指標が訓練され、ゲノムの各部位で、模擬実験された各個体によりたどられる人口構造を通じて時間的にさかのぼる経路が推定されました。訓練された分類指標は次に、品質選別に合格したユーラシア西部の1015点の補完された古代人のゲノムを用いて、各部位でたどられた祖先の経路の推測に用いられました。模擬実験を用いて、本論文の染色体彩色手法は、ヨーロッパ現代人につながる4通りの祖先経路について平均94.6%の正確さがあり、間違った列挙のモデル化に対して堅牢である、と示されます。以下は本論文の図3です。
次に、CLUESを用いて古代DNAの時系列データがモデル化され、それを用いて、GWAS一覧表 から得られた33341点の品質管理された形質関連多様体アレル頻度の軌跡と選択係数が推測されました。推定される中立的で頻度で組み合わされた同数の多様体が、制御設定としても散られました。あり得る交絡因子を制御するため、因果モデルが構築され、アレル頻度についての年代の直接的な影響が読み取り深度と読み取り長および/もしくは誤差率により媒介される間接的な影響から区別され、古代と現在の人口集団のデータ間の体系的な違いを評価するため使用される、マッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)偏りの検証が開発されました。異なるアレル頻度を有する集団間の混合は経時的なアレル頻度変化の解釈を混乱させるかもしれないので、染色体彩色モデルから局所的な祖先系統経路が用いられ、本論文の選択検証においてハプロタイプが階層化されました。これらの経路分類表示での条件付けにより、経時的な混合割合の変化を制御しながら、選択の軌跡を推測することが可能となります。
本論文の分析は、現在の個体群(1000人ゲノム計画のイギリスとフィンランドとイタリア中央部のトスカーナ人の集団)だけから得られたゲノムを用いると、ゲノム規模の有意な選択的一掃を特定しませんが、形質関連多様体は対照群と比較すると選択の証拠が豊富でした。対照的に、補完された古代DNAの遺伝子型確率を用いると、GWAS 群において11ヶ所のゲノム規模の有意な選択的一掃が特定され、一部のSNPが選択の証拠を示すにも関わらず、対照群では一掃は特定されませんでした。これらの結果は、形質関連多様体に対して選好的に作用した選択と一致します。次に、本論文の4通りの局所的な祖先系統経路のそれぞれに、つまり、WHGかEHGかCHGかアナトリア半島農耕民(Anatolian farmers、略してANA)を通じての局所的な祖先系統区域で選択分析が条件付けされ、21ヶ所のゲノム規模の有意な選択の最高点が特定されました。これは、祖先人口集団間の混合がユーラシア人口集団における多くの形質関連遺伝子座での選択の証拠を覆い隠してきた、と示唆しています。
●食性関連遺伝子座での選択
ヨーロッパへの、農耕民導入後ではあるものの、5000年前頃となる草原地帯牧畜民拡大の前となる、ラクターゼ(乳糖分解酵素)消化と関連する強い変化が見つかり、この時期は長年の論争となっています。祖先系統全体の分析における選択の最も強い全体的な兆候は、MCM6(minichromosome maintenance complex component 6、ミニ染色体維持タンパク質6)/ LCT遺伝子座(rs4988235:A)で観察され、派生的アレルがラクターゼ(乳糖分解酵素)活性持続(lactase persistence、略してLP)をもたらしました。
祖先系統全体の分析から推測される軌跡では、LPアレルは6000年前頃に頻度が増加し始め、現在まで増加し続けた、と示唆されます(図4)。祖先系統階層化分析では、この兆候はおもにEHGおよびCHGと関連する二つの祖先背景における一掃により駆動されます。この遺伝子座内の多くの選択されたSNPがrs4988235においてよりも早い選択の証拠を示したことも観察され、MCM6/LCT遺伝子座における洗濯機は以前に考えられていたよりも複雑である、と示唆されます。
これをさらに調べるため、選択検査が拡張され、260万塩基対(megabase、略してMb)規模の一掃の遺伝子座(5608ヶ所)すべてのSNPが含まれ、選択の最初の証拠が確認されました。この遺伝子座におけるほとんどのゲノム規模の有意なSNPはrs4988235より前に頻度が上昇し始めた、と観察され、この遺伝子座における強い正の選択はLPアレルの出現に数千年先行する、と示唆されます。ずっと早い頻度上昇を示すアレルには、12000年前頃に頻度上昇が始まったrs1438307:Tがあります(図4)。このアレルはエネルギー消費を調節し、代謝性疾患に寄与すると、と示されておれ、飢餓への古代の適応と示唆されてきました。
現在の個体群におけるrs1438307とrs4988235との間の高い連鎖不平衡は、LPアレルと飢餓および増加する病原体曝露への考古学的代理との間の最近観察された相関を説明できるかもしれません(関連記事)。補完によりもたらされる偏りの可能性を制御するため、古代DNA配列決定読み取りからの直接的呼び出された遺伝子型尤度を用いて、アレン(Allen)古代DNA情報源第52.2版から得られた刊行されている利用可能な124万配列データで、これらの結果が再現されました。以下は本論文の図4です。
脂肪酸不飽和化酵素(fatty acid desaturase、略してFADS)クラスタ(まとまり)における強い選択も、FADS1(rs174546:C)とFADS2(rs174581:G)で見つかり、これらは脂肪酸代謝と関連しており、より多くの/少ない菜食からより多くの/少ない肉食への食性の変化に対応すると知られています。以前の結果とは対照的に、より菜食的な食性と関連する選択のほとんどは新石器時代の人口集団においてヨーロッパへの到来前に起きており、新石器時代に継続した、と分かりました(図4)。祖先系統全体の分析におけるこの領域での選択の強い兆候はおもに、EHGとWHGとANAのハプロタイプ背景全体で起きた一掃に駆動されています(図4)。
興味深いことに、CHGは異形におけるこの遺伝子座での選択の統計的に有意な証拠は見つかりませんが、EHG背景におけるアレル頻度上昇のほとんどはCHGとの混合(8000年前頃)後に起き、CHG内では選択的アレルはすでに現在の頻度に近いものでした。これは、選択されたアレルがすでに中東の初期農耕民とコーカサスの狩猟採集民(それぞれANAおよびCHG背景と関連しています)においてかなりの頻度で存在し、東方集団が後期新石器時代と青銅器時代に北方と西方へ移動するにつれて、選択の継続を受けやすかったことを示唆します。
古代の狩猟採集民人口集団と農耕民人口集団を区別する選択兆候を具体的に比較すると、脂質や糖の代謝およびさまざまな代謝疾患と関連する多くの領域も観察されます。これらには、たとえばPATZ1のある22番染色体の領域も含まれ、PATZ1は、細胞脂質代謝において重要な役割を果たすFADS1やMORC2(Microrchidia 2、精巣萎縮)の発現を制御しています。3番染色体の別の領域は、免疫耐性および腸の恒常性の両方と関連するGPR15(G Protein-Coupled Receptor 15、Gタンパク質結合受容体15)と重複しています。最後に18番染色体では、クローン病など炎症性腸疾患と関連している、SMAD7にまたがる選択候補領域が回収されました。これらの結果をまとめると、農耕への移行がヒトに新たな食性と生活様式へと適応するかなりの量の選択を課しており、現在観察されるいくつかの疾患の蔓延がこれらの選択的過程の結果かもしれない、と示唆されます。
●免疫関連遺伝子座での選択
免疫および自己免疫疾患と関連するいくつかの遺伝子座における、強い選択の証拠も観察されます。これらの推定される選択事象の一部は以前に主張されていたよりも早く起きており、恐らくは農耕への移行と関連していて、それは現在の自己免疫疾患の高い罹患率を説明できるかもしれません。最も注目すべきことに、6番染色体において8Mb規模の選択的一掃(25.4~33.5Mb)の兆候が検出され、HLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域の全長にまたがっています。この遺伝子座内の多様体の選択の軌跡はいくつかの独立した一掃を裏づけ、それは異なる年代に異なる強度で発生しました。祖先系統全体の分析におけるこの遺伝子座での最も強い選択はHLA-AとHLA-Wの間の遺伝子間の多様体で(rs7747253:A)、これは水痘に対する防御や腸感染症の危険性増加や踵の骨度現象と関連しています。このアレルの頻度の急速な減少は8000年前頃以降始まり、水痘の危険性増加を代償に、腸感染症の危険性が減少しました。
対照的に、この一掃内でも見られるC2(complement C2)遺伝子における選択の兆候(rs9267677:C)は、1000年前頃の急速な上昇の前に、4000年前頃に始まる漸進的な頻度増加を示します。この事例では、好ましいアレルは、おもにヒトパピローマウイルスにより引き起こされるいくつかの性感染症(sexually transmitted diseases、略してSTD)に対する防御や、乾癬の危険性増加と関連しています。この遺伝子座は、現在の人口集団における自己免疫疾患の高い罹患率が部分的には、遺伝的相殺(トレードオフ)に起因するかもしれない、という可能性の好例を提供します。つまり、選択が、自己免疫疾患の感受性増加の多面発現性効果とともに病原体に対する防御を増加させる、というわけです。
これらの結果は、HLA遺伝子座における選択の複雑な時間的動態も浮き彫りにします。HLA遺伝子は免疫系の制御に役割を果たすだけではなく、多くの非免疫関連表現型とも関連しています。この領域における高度な多面発現のため、どの選択圧がさまざまな期間における頻度の増加を駆動したのか、判断が困難となっています。しかし、完新世におけるユーラシア人口集団の生活様式の顕著な変化が、免疫応答に関わる遺伝子座での強い選択の駆動体だった、と示唆されてきました。これらには、より高い移動性や人口密度増加と組み合わされた、食性の変化や家畜とのより密な接触が含まれます。関連論文では、HLA遺伝子座における祖先系統固有の選択の複雑なパターンがさらに調べられています。
蚊に刺されたことから生じる痒みの強さや子供期や成人期の喘息および喘息関連感染症と関連するSLC22A4(solute carrier family 22 member 4A、溶質保因者族22構成員4A)遺伝子座での選択の兆候(rs35260072:C)も特定され、その派生的多様体は9000年前頃以降着実に頻度が増加してきた、と分かりました。しかし、rs35260072と同じSLC22A4候補領域では、以前に報告された、喘息に対する防御となり感染症と関連しているアレル(rs1050152:T)の頻度が、最近の頻度上昇を示唆する以前の報告と歯対照的に、1500年前頃に案低水準になった、と分かりました。同様に、HECTD4(rs11066188:A)およびATXN2(rs653178:C)遺伝子座における選択が検出され、両方とも9000年前頃に頻度が上昇し、これもより最近の頻度上昇を指摘した以前の報告と対照的です。
これらのSNPは尿道炎および尿道症候群 と関連しており、こうした疾患はSTDもしくは5回以上の出産による蓄積された尿道損傷により引き起こされることが多くなっています。両SNP(rs11066188:Aとrs653178:C)は、腸感染症、いくつかの非特定的寄生虫性疾患、住血吸虫症、蠕虫症、スピロヘータ、肺炎、ウイルス性肝炎の危険性増加とも関連しています。これらのSNPは、セリアック病や関節リウマチの危険性も増加させます。したがって、以前には最近の適応の結果と考えられていた、いくつかの高度に多面発言的な疾患関連の遺伝子座は、ずっと長い期間にわたって選択の対象だったかもしれません。
●17q21.31遺伝子座での選択
17番染色体の2Mbの一掃(44.0~46.0Mb)において強い選択の痕跡がさらに検出され、これは神経変性および発達障害と関わっている、17q21.3上の遺伝子座にまたがっています。この遺伝子座には、一部のヒト集団における最近の正の選択の指標を有する逆位および他の構造的多型が含まれます。具体的には、KANSL1遺伝子の部分的重複が反転(H2)および非反転(H1)ハプロタイプで恐らく起きており、両者は現在のヨーロッパ中央部および中東人口集団において高頻度(15~25%)で見られるものの、サハラ砂漠以南のアフリカやアジア東部の人口集団ではずっと稀です。両方のSNP遺伝子型と全ゲノム配列決定(whole-genome sequencing、略してWGS)読み取り深度情報を用いて、本論文で調べられた古代の個体群における反転(H1およびH2)とKANSL1の(複数の)重複状態が判断されました。
H2ハプロタイプは、1万年前頃となるアナトリア半島無土器関連新石器時代個体群の以前に刊行された3点のゲノムのうち2点(Bon001とBon004)で観察されましたが、データはKANSL1の特定には不充分でした。KANSL1重複の最古の証拠は現在のイランで発見された初期新石器時代個体(9900年前頃のAH1)で課金殺され、それに続くのが、現在のジョージア(グルジア)で発見された中石器時代の2個体(9724年前頃のNEO281と9720年前頃のKK1)となり、この3個体は全て反転の異型接合で、反転した重複を有しています。
KANSL1の重複は、現在のロシアの新石器時代の2個体(H1dとなる7919年前頃のNEO560と、H2dとなる7390年前頃のNEO212)でも検出されています。H1dとH2dはともにアナトリア半島農耕民祖先系統とともにヨーロッパの大半に拡大してきており、その頻度は草原地帯関連祖先系統がヨーロッパ亜大陸の大半で優勢になったので、ヨーロッパの大半で変化しなかったようです。H1dとH2dがアナトリア半島農耕民と最初の草原地帯関連祖先系統の両方において明らかに高頻度で見られる、という事実から、H1dおよびH2d多様体に作用した選択的一掃はおそらく両者の祖先人口集団で起きた、と示唆されます。
この遺伝子座における祖先系統全体の分析で観察された選択の最も強い兆候がMAPT(microtubule-associated protein tau、微小管関連タンパク質タウ)遺伝子にあり(rs4792897:G)、この遺伝子がタウタンパク質をコードし、おたふく風邪に対する防御や鼾の危険性増加と関連していることに要注意です。より一般的には、MAPTにおける多型はいくつかの神経変性疾患の危険性増加と関連しており、それにはアルツハイマー病とパーキンソン病が含まれます。しかし、この領域は、複雑な構造多型に起因して、本論文のデータセット、とくにKANSL1遺伝子周辺における参照の偏りの証拠でも豊富であることに要注意です。
●色素沈着遺伝子座での選択
本論文の結果は、北方と西方へ移動した集団におけるより明るい肌の色素沈着の強い選択を特定し、これは選択が減少した紫外線曝露とその結果としてのビタミンD不足により引き起こされた、という見解と一致します。最も強く選択されたアレルは数千年前にほぼ固定に達した、と分かり、この過程は以前に提案されたように最近の性選択と関連していなかった、と示唆されます。祖先系統全体の分析では、SLC45A2遺伝子座における強い選択(rs35395:C)が検出され、13000年前頃以降に選択されたアレル(より明るい色の肌と関連しています)の頻度が、2000年前頃に安定水準に達するまで増加しました(図4)。有力な仮説は、肌における高いメラニン水準は赤道付近のちいきでは紫外線照射への保護のため重要であるのに対して、より明るい色の肌はより高緯度(紫外線照射が弱くなります)で選択され、それはいくらかの紫外線姦通がビタミンDの皮膚の合成に必要だから、というものです。本論文の調査結果は、大きな効果規模の遺伝子座の小さな割合でとくに、完新世における選択の重要な標的としての色素沈着アレルを確証します。
本論文の結果は、これらの過程の期間と地理的拡大に関する詳細な情報も提供し(図4)、より明るい色の肌と関連するアレルは、恐らくさまざまな地域で様々な地時期に起きた類似の環境圧力の結果として繰り返し選択された、と示唆されます。祖先系統階層化分析では、全ての周辺的な祖先系統はSLC45A2遺伝子座における広範な一致を示しますが(図4)、その頻度変化の時期では異なっています。ANA関連祖先系統背景はrs35395での選択の最初の証拠を示し、それに続くのが1万年前頃となるEHGおよびWHGと、2000年前頃のCHGです。全ての祖先系統背景では、ANAを除いて、選択されたハプロタイプは2000年前頃までに安定水準に達に達しましたが、ANAハプロタイプ背景はその1000年以上前にほぼ固定に達しました。SLC24A5遺伝子座における強い選択も検出され(rs1426654:A)、これは肌の色素沈着とも関連しています。この遺伝子座では、選択されたアレルの頻度はSLC45A2よりもさらに早く増加し、3500年前頃にはほぼ固定に徹しました。したがって、この遺伝子座での選択は、北方と西方へ移動した集団では早期に起き、WHG背景では、これらの集団が侵入してきた人口集団と遭遇し混合した後になってやっと起きたようです。
●差異の主軸での選択
中石器時代~新石器時代の移行における遺伝的変化のパターンを超えて、現在観察される多くの遺伝的変異性は、最終的に現在のヨーロッパ人の遺伝的多様性に寄与した狩猟採集民集団における高度な遺伝的分化を反映しています。じっさい、循環器系疾患や代謝疾患や生活病と関連する多くの遺伝子座は、新石器時代への移行の前の遺伝的変異性が、ユーラシア大陸のさまざまな地域に居住する祖先系統群における古代の差異的な選択にたどれます。これらの遺伝子座は、後期更新世と初期完新世における古代の狩猟採集民集団間の分化につながった、上述の混合事象に先行する選択事象を表しているかもしれません。これらのうち一つは、肥満の個体で有意に発現している塩分感受性遺伝子であるSLC24A3遺伝子と重複しています。
別の遺伝子座は、血管疾患と関連するROPN1およびKALRNという2個の遺伝子にまたがっています。さらなる領域には、チアミン輸送をコードし、漢人コホート(特定の性質が一致する個体で構成される集団)において高血圧と関連づけられてきた、SLC35F3遺伝子が含まれています。最後に、肥満および脂質代謝と関連するいくつかの遺伝子(CH25HとFAS)を含む候補領域と、ブドウ糖恒常性および脂肪酸代謝と関わるいくつかの遺伝子(ASXL2、RAB10、HADHA、GPR113)を伴う別の最高点があります。これらの遺伝子座はおもに、ユーラシアの東西のゲノム間の極端な文化の古代のパターンを反映しており、ユーラシア大陸全域のさまざまな環境に居住した更新世人口集団の45000年前頃(関連記事)となる分離後の選択の候補かもしれません。
●病原性構造多様体
稀で繰り返しのコピー数多様体(copy-number variants、略してCNV)が、神経発達障害を引き起こすと知られており、さまざまな発現度と不完全な浸透度を伴う広範囲の精神的および身体的形質と関連しています。経時的な病原性構造多様体の疾患率を理解するため、ヒトの発達障害の最も一般的な要因と知られている、繰り返しのCNVの影響を受けやすい50ヶ所のゲノム領域が調べられました。この分析には、CNV分析品質管理に合格した1442個体の古代人のショットガンゲノムと、比較のため1093個体の現代人のゲノム(関連記事)が含まれました。
読み取り深度に基づく手法とデジタル比較ゲノム混成を用いて、10ヶ所の遺伝子座における古代の個体群のCNVが特定されました。観察されたCNVのほとんど(15q11.2とCHRNA7遺伝子での重複と、TAR 遺伝子座と22q11.2遠位の部分にまたがるCNV)は大規模研究で明確に疾患と関連づけられてきたわけではありませんが、特定されたCNVには欠失と重複が含まれ、それらは発達遅延や異形症の特徴や自閉症などの精神神経的異常と関連づけられてきました(最も顕著なのは1q21.1と3q29と16p12.1とDiGeorge/VCFS遺伝子座ですが、15q11.2の欠失と16p13.11の重複もあります)。全体的に、古代の個体群における保因者頻度はUKBゲノムでの報告と類似しておいます(15q11.2とCHRNA7遺伝子の組み合わせでは1.25%対1.6%、組み合わされた残りの遺伝子座全体では0.8%対1.1%)。これらの結果から、いくつかの症状につながるかもしれない大規模で繰り返しのCNVは、本論文で含まれる古代と現在の人口集団において類似の頻度で存在した、と示唆されます。
●ユーラシア古代人の表現型の遺産
形質関連多様体の選択の証拠を特定することに加えて、現在の個体群における複雑な形質の差異への、(EHGやCHGやWHGや草原地帯牧畜民や新石器時代農耕民と関連する)さまざまな遺伝的祖先系統からの寄与も推定されました。ChromoPainterを用いて、40万点以上のUKB標本染色体彩色に基づいて、祖先系統固有多遺伝危険性得点(ancestry-specific polygenic risk score、略してARS)が計算されました(図5)。これは、どの古代の祖先系統構成要素が特定の形質と有意に関連している遺伝子座において現在のイギリス人口集団で過剰に発現しているのか、特定を可能とし、現在の1個体が、その祖先系統構成要素が本論文で定義された祖先系統分類の一つから完全に構成されているのならば、保有している遺伝的危険性と類似しています。以下は本論文の図5です。
この分析は人口集団間の多遺伝子危険性得点の可能性と関連する問題を避けており、それは、ARSが有効規模推定に用いられた同じ個体から計算されているからです。多くの補完された古代人ゲノムで研究することにより、祖先供給源として古代の人口集団を使用するための高い統計的検出力が提供されます。本論文は、多遺伝子得点が古代の人口集団で有意に過剰拡散していた35点の表現型と、アルツハイマー病の発症の危険性を有意に媒介すると知られている、APOE遺伝子における3点の大きな影響のあるアレル(ApoE2、ApoE3、ApoE4)に焦点を当てました。本論文では、この手法が古代の表現型に直接的な参照をしないものの、代わりにこれらの遺伝的祖先系統構成要素が現在の表現型の景観にどのように寄与したのか説明する、と強調されます。
体感予測質量やFEV1(forced expiratory volume in 1-second、1秒間の努力呼気量)や基礎代謝率など多くの人体計測的形質について、草原地帯関連祖先系統でのARSが最高で、EHGとCHGおよびWHGがそれに続きましたが、新石器時代農耕民祖先系統は一反して、これらの測定では最低点でした。先行研究と一致して、髪と皮膚の色素沈着も有意な違いを示し、WHGとEHGとCHGの祖先系統の肌の色の得点は新石器時代農耕民および草原地帯関連祖先系統より高く(つまり、より濃いことになります)、皮膚の悪性腫瘍と関連する形質の得点は新石器時代農耕民関連祖先系統において上昇しました。新石器時代農耕民関連および草原地帯関連祖先系統は両方とも金髪と明るい茶髪の得点がより高かったのに対して、狩猟採集民関連祖先系統は濃い茶色の髪の得点がより高く、CHG関連祖先系統は黒髪で最高得点でした。
疾患の危険性への遺伝的寄与の観点では、WHGの祖先的構成要素が、コレステロールおよび血圧および糖尿病と関連する形質で驚くほど高得点でした。新石器時代農耕民構成要素は、不安と罪悪感と短気で最高得点となり、CHGおよびWHG祖先系統構成要素は一貫して、これらの形質では最低得点でした。ApoE4アレル(アルツハイマー病の危険性を増加させる、rs429358:Cとrs7412:C)がWHG/EHGハプロタイプ背景で優先的に示されることが分かり、それは恐らく初期狩猟採集民によりユーラシア西部にもたらされた、と示唆されます。この結果は、そのアレルのヨーロッパ現代人の分布と一致し、ヨーロッパ北東部において最高で、これらの祖先系統の割合はヨーロッパ北東部においてヨーロッパ大陸の他地域より高くなっています。
対照的に、草原地帯牧畜民との類似性を有するハプロタイプ背景で、ApoE2アレル(アルツハイマー病の危険性を減少させる、rs429358:Tとrs7412:T)が見つかりました。本論文の祖先系統全体の分析では、7000年前頃に始まり2500年前頃に案低水準に達した、ApoE2を選好する正の選択が特定されました。しかし、より小さな標本規模と位相化されていない遺伝子型での最近の研究とは対照的に、ApoE3(rs429358:Tおよびrs7412:C)もしくはApoE4のどちらかで選択の証拠は特定されませんでした。草原地帯牧畜民における恐らくはApoE2を選好する選択圧は、マラリアもしくは未知のウイルス性感染に対する防御など、感染症の攻撃に対する防御的な免疫応答と関連しているかもしれません。
イギリス内およびユーラシア全域における祖先系統勾配の観点では(図2)、これらの結果は、表現型と疾患危険性における移動に媒介された地理的差異はありふれており、現在の人口集団間の異なる混合過程を通じて地理的に構造化された疾患蔓延の拡大への方向性を示している、との示唆を裏づけます。これらの結果は、身長に関連するヨーロッパにおける選択の有名な議論の解明にも役立ちます。草原地帯およびEHG関連の祖先的構成要素がUKBにおいて身長の遺伝的値を高めている、との本論文の調査結果から、ヨーロッパの南北間の身長差は、多くの先行研究で主張されたように、選択ではなく、祖先系統の違いの結果かもしれない、と論証されます。しかし、本論文の結果は、身長が特定の人口集団において選択されてきた可能性を排除しません。
●考察
狩猟および採集から農耕民とその後の牧畜への移行から生じた食性における根本的変化は、現在のユーラシア人口集団の身体的および精神的健康に広範囲の結果をもたらしました。これらの劇的な文化的変化は、新たな感染症の困難への耐性の選択を含めて、おそらく食性の変化および人口密度の増加と関連する、選択圧の不均一な混合を生み出しました。各一掃領域の高度に多面発現的な性質のため、要因を本論文の選択兆候のいずれかに帰するのは困難で、本論文は全ての形質と関連していない多様体を網羅的に検証したわけではありません。しかし、本論文の結果から、完新世における選択は現在の遺伝的疾患危険性や、代謝および人体計測的形質に影響する遺伝的要因分布にかなりの影響を及ぼしてきた、と示されます。
本論文の分析から、現代人のゲノムにおける自然選択の痕跡の検出能力が、その兆候を覆い隠す、さまざまな祖先人口集団における相反する選択圧により大きく制約されていることも示されます。混合の差異を考慮しながら、選択をたどる手法の開発は、ゲノム規模の有意な選択の頂点を効率的倍増させることができ、食性および生活様式と関連するいくつかの多様体の軌跡の解明に役立ちました。本論文ではさらに、局所的な選択下にあったと考えられている多くの複雑な形質が、現在の差異への古代の個体群の異なる遺伝的寄与によってより適切に説明される、と示されました。本論文の結果は全体的に、古代の選択と中石器時代および新石器時代および青銅器時代に起きた主要な混合事象との間の相互作用が、ユーラシア全域の現代人で観察される遺伝的差異のパターンをどのように深く形成してきたのか、強調します。以下は『ネイチャー』の日本語サイトからの引用(引用1および引用2)です。
ゲノミクス:古代ヨーロッパ人のゲノムは現代人集団のゲノムをどのように形作ったのか
古代ユーラシア人集団のゲノム史を洞察するための手掛かりが、古代DNAの解析によって得られた。この知見を報告する4編の論文が、今週、Natureに掲載される。これらの論文に示された研究では、合わせて1600人以上の古代人の遺伝的データが解析され、過去約1万5000年にわたるヨーロッパの人類集団史に関する知見がもたらされた。
現代の西ユーラシア人集団の遺伝的多様性は、3つの主要な移住現象によって形作られたと考えられている。すなわち、約4万5000年前以降の狩猟採集民の到来、約1万1000年前以降の中東からの新石器時代の農耕民の拡大、そして約5000年前のポントスステップからのステップ牧畜民の到来である。狩猟採集から農耕への転換は、人類の歴史における重要な移行であるが、この移行期におけるヨーロッパとアジアの集団の構造と人口動態の変化に関する詳細な情報は少ない。
Morten Allentoft、Martin Sikora、Eske Willerslevらは1つ目の論文で、こうした過程を大陸横断的な規模で調べるため、ユーラシア大陸の北部と西部で見つかった、主に中石器時代と新石器時代の古代人317人のゲノムデータについて塩基配列を決定したことを報告している(中石器時代には、狩猟採集民と新石器時代の農耕民との間の空白を埋めるという意義がある)。また、今回の研究では、既存の1300人以上の古代人の遺伝子データも解析された。その結果、狩猟採集民から農耕民への移行の遺伝的影響に関して、黒海からバルト海まで伸びる非常に明確な「ゲノムの境界線」が存在することが明らかになった。この境界線の西側では、農耕の導入によって血統の変化を示す大規模な遺伝的変化が起こったが、これと同じ時期に、境界線の東側では、大きな変化は起こらなかった。著者らは、こうした違いが生じたのは境界線の東側の地域の気候条件が中東の農耕技術にあまり適していなかったためで、そのため狩猟採集社会が境界線の西側より約3000年長く続いた可能性があると指摘している。ステップ牧畜民の到来と拡大は、このゲノムの境界線の消失と関連している。
この他に、今週のNatureには、こうした遺伝的変化が現代のヨーロッパ人にどのような形で残っているかを調べた複数の論文(1つ目の論文と著者が重複している)が同時掲載される。2つ目の論文では、神経系の自己免疫疾患である多発性硬化症(MS)に対するヨーロッパ人の遺伝的リスクが高い原因が特定されたことが報告されている。この研究では、古代ゲノムのデータセットの一部と現代の英国在住のヨーロッパ系白人(自己申告による)約41万人のゲノムが比較され、現代のヨーロッパ人において、異なる古代ヨーロッパ人集団由来の遺伝物質が占める割合が定量化された。その結果、MSの遺伝的リスクはポントスステップの牧畜民の間で生じ、約5000年前にヨーロッパに持ち込まれ、これが記録のある移住現象と同時期であったことが明らかになった。また、この論文では、MSに関連した遺伝的バリアントが、感染症の有病率が増加していた時期に、ステップ牧畜民の生活習慣と環境に関連する免疫的優位性をもたらした可能性が示唆されている。
3つ目の論文では、古代の祖先集団の形質と現代人の形質の関連性がさらに指摘されている。例えば、糖尿病とアルツハイマー病のリスクに関連する遺伝的バリアントは、西欧の狩猟採集民の祖先集団に関連しており、北ヨーロッパ人と南ヨーロッパ人の身長差は、異なるステップ牧畜民の祖先集団に関連していることが明らかになった。また、4つ目の論文では、古代デンマークの集団を対象とした研究で、デンマークで発見された100体のヒトの骨格(中石器時代、新石器時代、青銅器時代前期の7300年間にわたる)のゲノム解析の結果が報告されている。この研究では、人口動態、文化、土地利用、食生活の変化のパターンが解明された。
以上の知見は、古代人集団における遺伝的選択と移住現象が、現代のヨーロッパ人に見られる多様な形質にどのように顕著な寄与をしたかを示している。
古代DNA:古代ユーラシア人の選択の全体像と遺伝的遺産
Cover Story:ステップ起源の変化:先史時代のユーラシアにおける移動と生活様式の変化が多発性硬化症の遺伝的リスクの上昇に関連している
今週号の4報の論文でE Willerslevたちは、古代ユーラシアから得られた遺伝学的データを用いて、先史時代の集団に対する大陸横断的な移動の影響を調べている。その結果、古代のステップ集団、農耕民集団、狩猟採集民集団の間の混合に由来すると思われる遺伝的な変化の一部が解き明かされた。特に、ステップ集団の移動が、おそらく狩猟採集から農耕と牧畜に集団が切り替わった際の病原体からの保護に伴う進化的圧力の結果として、ヨーロッパに多発性硬化症への遺伝的リスクの増大をもたらしたことが見いだされている。表紙は、ユーラシアステップの古代墓地で発見された典型的なクルガンの石碑のイラストを用いて、多発性硬化症のリスクとの遺伝的関連性に関わるイメージを表現している。
参考文献:
Irving-Pease EK. et al.(2024): The selection landscape and genetic legacy of ancient Eurasians. Nature, 625, 7994, 312–320.
https://doi.org/10.1038/s41586-023-06705-1
この記事へのコメント