草原地帯牧畜民集団で生じた多発性硬化症の遺伝的危険性
ヨーロッパの現代人に多い多発性硬化症(Multiple sclerosis、略してMS)の起源に関する研究(Barrie et al., 2024)が公表されました。本論文は、古代ゲノムのデータセットの一部と現代のイギリス在住のヨーロッパ系「白人(自己申告)」約41万人のゲノムを比較し、ヨーロッパ現代人におけるヨーロッパ古代人集団由来の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)の割合が定量化されました。その結果、MSの遺伝的危険性はポントス草原地帯の牧畜民の間で生じ、5000年前頃にヨーロッパにもたらされ、これが記録のある移住現象と同時期だった、と明らかになりました。また本論文では、MSに関連した遺伝的多様体は、感染症の有病率が増加していた時期に草原地帯牧畜民の生活習慣と環境に関連する免疫的優位性をもたらしたかもしれない、と示唆されています。
●要約
MSは神経炎症性および神経変性性の疾患で、ヨーロッパ北部において最も多く見られます。MSの遺伝的危険性は免疫関連遺伝子の内部や近傍に位置していると知られていますが、いつどこでどのようにこの遺伝的危険性が生じたのかは不明です。本論文では、中石器時代から青銅器時代の大規模な古代ゲノムデータセットを、新たな中世および中世の後のゲノムとともに用いて、MSの遺伝的危険性がポントス草原に由来する牧畜民で生じ、ヤムナヤ(Yamnaya)文化関連の移動によりヨーロッパへと5000年前頃にもたらされた、と示されます。本論文ではさらに、MS関連免疫遺伝学的多様体は草原地帯人口集団内およびその後のヨーロッパの両方で正の選択を経ており、それは食性と生活様式と人口密度の変化と同時期に起きた恐らく病原体の攻撃により引き起こされた、と示されます。本論文は、現代の免疫応答の決定因子としての新石器時代と青銅器時代の大きな重要性と、変化する環境におけるMSの発症危険性へのその後の影響を浮き彫りにします。
●研究史
MSは、現在世界中の250万人以上に影響を及ぼしている、脳と脊髄の自己免疫疾患です。その疾患率は民族と地理的位置で著しく異なり、最高の有病率はヨーロッパで観察され(10万人につき142.81例)、ヨーロッパ北部人はとくにこの疾患を発症しやすくなっています。この地理的差異の起源と理由はよく理解されていませんが、そうした偏りは、MSを含む自己免疫疾患の有病率が過去50年間に増加し続けた理由への、重要な手がかりを保持しているかもしれません。まだ分かりにくいものの、MSの病因は遺伝子と遺伝子および遺伝子と環境の相互作用が関わっている、と考えられています。証拠の蓄積から、外因性の誘因により、遺伝的に脆弱な個体群において多数の細胞と免疫経路を含む一連の事象が始まり、これが最終的にMS神経病理学につながるかもしれない、と示唆されています。
ゲノム規模関連研究(genome-wide association studies、略してGWAS)は、MSと関連する233個の一般的に発生する遺伝的多様体を特定してきました。そのうち32個の多様体はHLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域内に、201個の多様体はHLA領域外に位置しています。最も強いMSの関連性はHLA領域で見つかっており、これらのうち最も顕著なのはHLA-DRB1*15:01で、このアレル(対立遺伝子)の少なくとも1コピーを有する個体群ではMSの危険性が約3倍増加します。
まとめると、遺伝的要因は疾患危険性全体の約30%を説明する、と推定されていますが、環境および生活様式要因がMSへの主要な一因と考えられています。たとえば、エプスタイン・バーウイルス(Epstein–Barr virus、略してEBV)は子供期に頻繁に発症し、通常は無症状ですが、衛生基準の高い諸国で通常観察されるように、成人初期への感染遅延はMSの32倍の危険性増加と関連しています。喫煙や思春期の肥満や栄養や腸の健康などMS危険性の増加と関連する生活様式要因も、地理的に異なります。自己免疫は他の病原体からの圧力変化からも起きる可能性があり、炎症促進経路と抗炎症経路の微妙な均衡の変化を引き起こします。
ヨーロッパの遺伝的祖先系統(以下、「祖先系統」)は、混合人口集団におけるMS有病率の世界的な違いの一部を説明する、と仮定されています。具体的には、MSを有するアフリカ系のアメリカ合衆国の個体群は、HLA領域において、対照個体群と比較してヨーロッパ祖先系統の増加を示し、ヨーロッパ人のハプロタイプは、HLA-DRB1*15:01を含めてほとんどのHLAアレルでMSの危険性を高めます。逆に、MSを有するアジア系のアメリカ合衆国の個体群は、対照個体群と比較して、HLA領域においてヨーロッパ祖先系統が減少しています。古代ヨーロッパの祖先系統とヨーロッパにおけるMSの危険性は地理的に構造化されていると知られており(図1a・b)、MSの有病率に関するヨーロッパ内の祖先系統の差異の影響は不明です。
●標本
現在の祖先の差異は、古代の人口集団に由来する遺伝的祖先系統の混合としてモデル化でき、その祖先系統は生計生活様式により、ヨーロッパ西部狩猟採集民(Western hunter-gatherer、略してWHG)、ヨーロッパ東部狩猟採集民(Eastern hunter-gatherer、略してEHG)、コーカサス狩猟採集民(Caucasus hunter-gatherer、略してCHG)、アナトリア半島農耕民(Anatolian farmers、略してANA)および新石器時代、草原地帯牧畜民に区別できます(図1c・d)。
新たな中世および中世の後のゲノムと組み合わされた、関連研究(関連記事)で提示された中石器時代から青銅器時代までの大規模な古代ゲノムデータセットの使用により、これら祖先人口集団に関して現在のヨーロッパ人の遺伝的祖先系統が定量化され、生活様式特有の進化の兆候が特定されました。次に、MSの危険性増加と関連する多様体が正の選択を経たのかどうか、判断されました。選択がいつ起きたのか、選択の標的は生活様式に特有だったのかどうか、検討されました。最後に、生計慣行および病原体への曝露を含めて、危険性多様体の選択を引き起こしたかもしれない環境条件が調べられました。全しての手法により提供される証拠の概要は、拡張データ図1で見ることができます。以下は本論文の図1です。
現代人のゲノム内の祖先系統パターンを調べるため、草原地帯牧畜民を含めて中石器時代と新石器時代の古代人318個体のDNA標本の参照パネル(図1)を用いて、イギリス生物銀行(United Kingdom Biobank、略してUKB)における自己認識が「白人のイギリス人」である約41万個体について、特定の遺伝子座における祖先系統(遺伝子座祖先系統)が推定されました。各分類表示された549323の一塩基多型(Single Nucleotide Polymorphism、略してSNP)をUKBのゲノム規模祖先系統と比較することで、「異常得点」が提供されました。2ヶ所の領域は、最も極端祖先系統組成を有していることで際立っており、それは、ラクターゼ(Lactase、略してLCT、乳糖分解酵素)活性持続(lactase persistence、略してLP)を調節すると充分に確証されている2番染色体のLCT/MCM6(minichromosome maintenance complex component 6、ミニ染色体維持タンパク質6)と、6番染色体のHLA領域です。
HLA領域は自己免疫疾患と強く関連しており、本論文ではそのうち、MSと、関節に特徴的に影響を及ぼす一般的な前進性炎症疾患である関節リウマチ(rheumatoid arthritis、略してRA)が調べられました。本論文のデータセット(中石器時代から青銅器時代の大規模な古代ゲノムデータセットおよびデンマークの86個体の新たな中世および中世の後のゲノムデータから構成されます)には合計1750点の補完された二倍体ショットガン配列決定古代ゲノムが含まれ、そのうち1509点はユーラシアに由来し、現代人のデータ(関連記事)とともに、1万年前頃から現在に至るほぼ完全な横断区が達成されました。
●分析結果
MSにとって最高の危険性となるアレルの頻度は確率比(odds ratio、略してOR)で1.5超となり、その全てはHLAクラスII領域内にあり、本論文の古代人集団では顕著なパターンを示しました。とくに、HLA-DRB1*15:01での標識SNP(rs3135388[T])はMSで最高の危険性を有しており(OR=2.9)、イタリア中央部のコンティネンツァ洞窟(Grotta Continenza)の新石器時代(放射性炭素年代で5836~5723年前頃)の1個体(R3、網羅率は4.05倍)で最初に観察され、草原地帯および草原地帯由来人口集団において5300年前頃となるヤムナヤ文化の出現の時期に頻度が急速に上昇ました(図2)。特定の国で生まれ、「典型的な祖先背景」を有して生まれたUKBの個体群の危険性アレル頻度から、HLA-DRB1*15:01の頻度はフィンランドとスウェーデンとアイスランドの現代の人口集団および高い割合の草原地帯祖先系統を有する古代の人口集団において最高だった、と分かりました(図2b挿入図)。以下は本論文の図2です。
特定の遺伝的祖先系統の危険性を調べるため、局所的な祖先系統データセットを用いて、UKBの補完されたデータセットにおいて全てのMS関連の詳細にマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)された遺伝子座各祖先系統について危険性比率が計算されました。MSについては、草原地帯祖先系統がほぼ全てのHLAのSNPにおいて最高の危険性比率でしたが、農耕民および外群祖先系統は最も保護的となることが多く(図3a)、この部位における草原地帯は正ハプロタイプがMS危険性をもたらす、と示唆されます。以下は本論文の図3です。
一部の祖先系統が特定のSNPでより高い危険性を有する、と示されたので、各祖先系統について合計危険性得点の計算が試みられました。完全に1祖先系統から構成される現代の1個体について多遺伝子危険性得点(polygenic risk score、略してPRS)に相当する、統計的な祖先系統固有多遺伝危険性得点(ancestry-specific polygenic risk score、略してARS)が用いられました。ARSは直接的な古代人の遺伝子型呼び出しを用いてのPRSの計算に改善を提供し、それは、ARSが入り込んできた浮動と選択に対して堅牢でありながら、少ない古代DNAの標本数と偏りの影響を軽減するからです。
加速ブートストラップ経由で得られた信頼区間のある付加的なモデル下で、以前の関連研究から足られた有効規模推定値が用いられました。MSのARSでは、草原地帯祖先系統が最大の危険性を有しており、それに続くのがWHGとCHGとEHGの祖先系統で、農耕民および外群祖先系統のARSは最低でした。したがって、草原地帯祖先系統は全ての関連するSNP全体でMSに対して最大の危険性をもたらします。遺伝子座の再標本抽出によるゲノム規模関連について検証され、草原地帯祖先系統の危険性は依然として明確に農耕民祖先系統を上回っている、と分かりました。その兆候のほとんどはHLA領域のSNPにより駆動されましたが、このパターンは、これらのSNPを除外しても存続しました(図3b)。
草原地帯祖先系統が2つのMS関連SNPを除いて全てで危険性をもたらす事実(図3a)から、これらのアレルには共通の進化史がある、と示唆されます。したがって、祖先系統が表現型の予測に使用できるのかどうか、調べられました。年齢と性別と最初の18主成分を制御しながら、疾患関連SNPについてUKBにおける3種類の関連分析が実行されました。
第一の分析は、ゲノム規模関連研究と同様に、通常のSNPに基づく分析でした。第二の分析は、遺伝子型値の代わりに、局所的な祖先系統の確率との関連を検証しました。第三の分析は、通常のゲノム規模関連研究のようなSNPの使用の代わりに、形質を予測する特徴一式としてのハプロタイプの処理によるSNP間の相互作用の検出に用いられる、ハプロタイプ傾向回帰(haplotype trend regression、略してHTR)に基づいていました。余分な柔軟性(HTRX)を有するHTRと呼ばれる新たな手法が開発され、この手法は単一のSNPと非連続的なハプロタイプを含む、ハプロタイプのパターンを検索します。このモデルの性能を評価し、過剰適合を防ぐため、モデルがどれだけ適切に新たなデータに一般化できるのか測定する、標本外データの予測能力が評価されました。模擬実験により、相互作用が欠如しており、相互作用強度が増加するにつれてより多くの分散となる場合に、HTRXが通常のゲノム規模関連研究として同じ量の分散を説明する、と示されます。
本論文における自己認識が「白人のイギリス人」である個体群のコホート(特定の性質が一致する個体で構成される集団)は、MSに関しては比較的検出力が劣っていますが(1949人の症例で398049人の対照群、有病率は0.487%)、MSはHLA領域において草原地帯および農耕民祖先系統と関連していました。HLA領域内の4点の主要な連鎖不平衡(Linkage disequilibrium、略してLD)の塊(クラスI、32.41Mb~32.68Mbと33.04Mb~33.08Mbにより決定されるクラスIIの2ヶ所の下部領域、クラスIII)のうち3点では、局所的な祖先系統が遺伝子型よりも有意に多くの差異を説明します(図4)。以下は本論文の図4です。
通常のGWASと比較しての一部の領域における局所的な祖先系統の性能増加は、領域外のSNPの標識付けにより説明できますが、GWASに対するHTRXの性能増加は、稀なSNPとエピスタシスを含む1ハプロタイプの全体的な効果を定量化します。HLA領域全体にわたって、ハプロタイプは通常のGWAS(2.48%)よりも標本外の差異をより多く説明します(少なくとも2.90%)。相互作用の兆候は、HLAクラスI領域内およびHLAのクラスIとクラスIIのI領域間でも観察されました。各遺伝子座における共発生した祖先系統がMSと関連しているのかどうか、さらに検証されましたが、危険性が草原地帯祖先系統以外の祖先系統と関連していた、という証拠は見つかりませんでした。
草原地帯祖先系統がMSのHLA関連危険性のほとんどに寄与している、と確証されたので、MS危険性が選択下で進化したのかどうか、調べられました。経時的に祖先系統により分解される、全ての関連SNP全体で方向性選択の証拠が検証されました。この検証は、分類表示された個体を含む祖先組換え図(ancestral recombination graph、略してARG)の周縁系統樹における標本の最近傍の推測に基づいて、「経路に基づく染色体彩色」技術を用いました(関連記事)。
その結果得られた祖先の経路分類表示により、古代と現代両方の個体群のハプロタイプについて、経時的な混合割合の変化を制御しながら、危険性関連多様体のアレル頻度の軌跡推測が可能となります。その経路は現在から15000年前頃にまで及び、経路がたどる独特な人口集団で分類表示されています(ANAかCHGかEHGかWHG)。異なる経路を使用するので、この手法は比較的最近の草原地帯の混合もしくは外群人口集団の分類表示を用いず、経路の分類表示は連続的な人口集団の代表ではなく、むしろ相当する人口集団を含む時代にさかのぼる経路を表しています。たとえば、CHGの経路は、草原地帯からのEHGとの統合前CHG人口集団に由来し、次にその後のヨーロッパ人口集団における他の祖先系統と統合しました(図1)。
本論文の祖先系統経路分析では、詳細にマッピングされたMS関連多様体のかなりの割合が、本論文のデータセットでは補完されておらず、これは古代の標本における品質管理選別と正確なHLA領域の推測の難しさのためです。これに対処するため、同じ研究からLDのゲノム規模の有意な要約統計量が取り除かれ、確実に祖先系統経路分類表示を割り当てることができました。これにより、CLUESとPALMを用いて、疾患関連多様体の全体にわたって多遺伝子選択の検証が可能となりました。
MSについては、全ての祖先系統をまとめて検証すると、5000~2000年前頃に疾患危険性が選択的に増加した、という証拠が見つかりました(図5)。4系統の長期の祖先経路(CHG、EHG、WHG、ANA)のそれぞれを上限付けすると、WHGとEHGとCHGの経路における統計的に有意な兆候が見つかりましたが、ANA経路では見つかりませんでした。繰り返すと、選択は草原地帯の牧畜民人口集団で起きた可能性が高そうで、それは、草原地帯牧畜民人口集団がEHG祖先系統とCHG祖先系統のほぼ同じ割合で構成されているからです。祖先系統全体の分析において経時的に遺伝的危険性の最大の変化を駆動したのは、HLA-DRB1*15:01を標識付けしたrs3129934でした。選択の証拠についてHLA-DRB1*15:01ハプロタイプを標識付けする他の3点のSNP(rs3129889、rs3135388、rs3135391)も検証され、祖先系統の階層化された兆候は一貫してCHGにおいて最も強い、と分かりました(図5b)。以下は本論文の図5です。
選択の性質をさらに調べるため、新たな要約統計量である祖先系統の連鎖不平衡(linkage disequilibrium of ancestry、略してLDA)が開発されました。LDAは2ヶ所のSNPにおける局所的な祖先系統間の相関で、祖先系統間の組み換え事象が祖先系統内の組み換え事象と比較して高頻度で起きていたのかどうか、測定します。その後、あるSNPの「LDA得点」が、ゲノムの残りを有するSNPの合計LDAとして定義されました。高いLDA得点からは、参照人口集団から継承されたハプロタイプは予測より長い、と示唆される一方で、低い得点からは、ハプロタイプは予測より短い(つまり、より多くの組み換えを経ているわけです)、と示唆されます。たとえば、LCT/MCM6領域は、比較的最近の選択的一掃から予測されるように、高いLDA得点を示しました。
HLA領域は、6番染色体の他の領域よりもLDA得点が有意に低くなりました。模擬実験を通じて、この兆候は単一の祖先系統ハプロタイプに対して混合祖先系統のハプロタイプに有利な選択により駆動されたに違いない、と示されました。複数のSNP選択モデルを拡張すると、本論文の説明は、少なくとも2ヶ所の分離した遺伝子座がその後で混合してHLA領域において選択を維持した別々の人口集団で選択的に生じた、というもので、新たな用語である「組換え有利選択」を正当と理由づけます。これが意味するのは、組換えにより駆動された、HLA領域における多様な祖先系統での選択があった、ということです。
Fₛₜなど平衡選択の他の測定とは異なり、LDAは特定の年代測定された人口集団からの過剰な祖先系統LDを説明するので、独立した兆候です。HLAクラスII領域については、選択は全ての構成(LDA得点やFₛₜやπ)を測定しますが、HLAクラスI領域については、LDA得点は30.8 Mbで追加の多様ではない最小限を有しており、ここではゲノムが祖先的多様であるものの、遺伝学的に強く制約されている、と示唆されます。したがって、LDA得点は検出される選択の種類と、選択が変化を受けてきたのかどうかについて、情報をもたらします。
MSは古代の個体群に適応度の利点をもたらさなかったでしょうから、この選択は、現在におけるMSの危険性増加が多面発現の副産物である、共有された遺伝的構造により駆動された可能性が高そうです。したがって、1もしくは複数の祖先系統においてCLUES を用いて、選択の統計的に有意な証拠を示し、UKB から得られた4359点の形質と、フィンランド人ゲノミクス(Finnish Genomic、略してFinnGen)研究(関連記事)における2202点の形質についてゲノム規模の有意な形質の関連を有する、LDを取り除いたMS関連SNPが検索されました。全ての選択されたSNPは複数の他の形質とも関連している、と観察されました。
MS危険性を選好する多遺伝子選択の観察された兆候が、遺伝的に相関する形質で作用する選択によってより適切に説明できるのかどうか判断するため、MS関連の選択されたSNPで少なくとも20%の重複がある、UKBとFinnGenにおける形質(合計115点)の体系的分析が実行されました。相関する形質への多遺伝子選択を解明するため特別に設計されたPALMでの共同検定を用いると、検定数を考慮した場合、MS危険性を選好する選択兆候が遺伝的に相関する形質に作用する選択により有意に減ずる、UKBもしくはFinnGenの形質は見つかりませんでした。これは、MSの選択兆候が、検証された遺伝的に相関する形質に作用する選択により説明できないことを論証します。
UKBとFinnGenは多くの形質や疾患に関して検出力不足なので、CLUEを用いて、選択の統計的に有意な証拠を示した全てのLDを取り除いたMS関連SNP(合計32点、そのうち78%となる25点はHLA領域にあります)について、手作業で文献検索されました。その結果、正の選択下のほとんどは特定の病原体および/もしくは感染症(祖先系統経路で選択された疾患もしくは病原体関連の合計、ANAでは11/14、CHGでは6/9、EHGでは6/7、WHGでは17/18/)に対する保護と関連している、と分かりましたが、GWASデータが多くの感染症では利用できないことに要注意です。
選択されたアレルがいくつかの慢性的ウイルス(EBVや水痘帯状疱疹ウイルスや単純ヘルペスウイルスやサイトメガロウイルス)、および小さな狩猟採集民集団において伝染と関連しないウイルスもしくは疾患との保護的関連性を有している、と観察されましたるさらに、多くの選択されたアレルは、寄生虫か、皮下組織や胃腸や呼吸器や尿路や性感染症か、これらもしくは他の感染症と関連する病原体、たとえば、クロストリジオイデス・ディフィシル(Clostridioides difficile)や化膿レンサ球菌(Streptococcus pyogenes)や結核菌(Mycobacterium tuberculosis)について、危険性減少をもたらしました。この証拠は強く示唆的ではあるものの、これら推定される関連の多くは、検出力不足のGWASと候補遺伝子研究における偏りのため統計的に堅牢ではないかもしれない、と本論文は強調します。
MSについてのこれらの調査結果が、MSとは対照的に前進性炎症性疾患であるものの、その特徴的な関節障害でよく知られているRA(関節リウマチ)についての結果と比較されました。RAについての本論文の調査結果は、顕著に異なる祖先系統危険度特性を示します。HLA-DRB1*04:01はRAの最大の遺伝的危険因子で、CLUES分析では、このアレル(rs660895)の分類表示SNPは、3000年前頃までの連続的な負の選択の証拠を示しました。WHGおよびEHG祖先系統はRAと関連するSNPにおいて最も多くの危険性をもたらし(重み付け平均有病率に基づくRA関連SNPの相対的な危険性比率)、これらの祖先系統は、そのより高いARSに反映されているように全体でRAに最大の危険性をもたらす一方で、草原地帯および外群祖先系統は最低点だった、と分かりました。これらの結果は、局所的なGWASで要約されました。RA関連SNPは過去約15000年間にわたって負の多遺伝子選択を受けてきた、と分かりました。祖先系統経路に分解すると、全ての経路は負の選択勾配を示し、名目上の有意性に達しなかったものの、CHG経路は近くなった、と分かりました。
これらの結果から、RAの遺伝的危険性はMSとは対照的に遠い過去においてより高く、RA関連危険性多様体は農耕到来前のヨーロッパの狩猟採集民人口集団においてより高頻度で存在した、と論証されます。狩猟採集民人口集団におけるより高い遺伝的危険性とその後の負の選択の根底にあるかもしれないものを理解するため、選択の統計的に有意な証拠を示す、LDを取り除いたSNP(合計55ヶ所、そのうち65%となる36ヶ所はHLA領域にあります)について、再度手作業で文献検索が実行されました。その結果、選択されたSNPの大半は、全ての経路で異なる病原体および/もしくは感染症に対する防御と関連している(祖先系統経路で選択された疾患もしくは病原体関連の総数は、ANAで16/20、CHGで12/16、EHGで8/13、EHGで14/20、WHGで16/21)、と分かりました。選択されたRA危険性アレルとは通常、MS分析と同様に同じ病原体もしくは疾患と関連していましたが、一部のSNPはMS危険性分析では観察されなかった病原体もしくは疾患、たとえば、赤痢アメーバ(Entamoeba histolytica)や麻疹や肝炎ウイルスや節足動物ウイルス性発熱やウイルス出血性発熱や肺炎球菌性に対して防護的でした。
●考察
過去1万年間に、生活様式における最も極端な地球規模の変化が見られ、一部の地域で農耕が、他地域で牧畜が出現しました。5000年前頃には農耕民祖先系統がヨーロッパ全域で優勢でしたが、比較的多様な遺伝的祖先系統がこの頃に草原地帯からの移動とともに到来しました(関連記事)。本論文では、この遺伝的祖先系統は現在のMSに最も多くの遺伝的危険性をもたらし、これらの多様体はポントス・カスピ海草原(ユーラシア中央部西北からヨーロッパ東部南方までの草原地帯)での牧畜民生活様式の出現、およびヨーロッパのその後の混合人口集団における継続的選択と一致する正の選択の結果だった、と示されてきました。
これらの結果は、ヨーロッパにおけるMS有病率の南北の勾配に関する長年の議論に対処し、ヨーロッパ大陸全体の現代の人口集団における草原地帯祖先系統の勾配、具体的にはHLA領域における勾配が、環境要因との組み合わせでこの現象を引き起こしたかもれない、と示唆します。さらに、HLA領域におけるMS関連多様体間のエピスタシスが以前には論証されてきたものの、本論文では、これを考慮すると独立したSNPの影響だけよりも分散を説明できる、と示されました。これらの危険性アレルを有するハプロタイプの多くが有している祖先系統固有の起源は、個々の危険性予測に利用でき、遺伝的祖先系統関連からMS危険性の機序的な理解への経路を提供できるかもしれません。これらの調査結果が、別のHLAクラスII関連の慢性炎症性疾患であるRAの結果と比較され、RAの遺伝的危険性は対照的なパターンを示す、と分かりました。つまり、RAについては、遺伝的危険性は中石器時代狩猟採集民において最高で、経時的に減少したわけです。
この歴史に関する本論文の解釈は、さまざまな病原体とそのヒト宿主との間の共進化が、生活様式および環境に応じて、これらの人口集団が融合した後の組換えで選好された選択によって、免疫応答遺伝子への大規模で多様な遺伝的祖先系統固有の選択をもたらしたかもしれない、というものです。病原体による進化の同様の事例が、最近刊行されました。後期新石器時代と青銅器時代は、人口集団における感染症の有病率が大きく増加した時期で、それは人口密度増加や、家畜化された動物との接触および家畜やその産物の消費に起因します。多くの疾患関連病原体の最新の共通祖先はこの期間に存在しました(関連記事1および関連記事2)。
これらの疾患は現在一般的ですが、過去におけるその地理的範囲の推測は困難で、より制約されてきたかもしれません。本論文では、選択下にあるMSおよびRA関連多様体が広範な感染症および病原体にいくつかの耐性をもたらした、と示しました。たとえば、HLA-DRB1*15:01は結核に対する保護と関連しており、ハンセン病の危険性を増加させます(関連記事)。しかし本論文は、この仮説を超えての特定の関連性の検出には力不足でした。それは、過去の疾患の分布と多様性に関する知識の乏しさ、考古学的記録における内在性病原体の保存の乏しさ、部分的には広範なワクチン接種計画のためである、多くの感染症への検出力の充分あるGWASの欠如に起因します。まとめると、これらの調査結果から、人口拡散と生活様式の変化と人口密度増加は、新旧両方の病原体の高度で持続的な感染をもたらし、それは今では自己免疫疾患と関連している免疫応答遺伝子における多様体の選択を促進したかもしれない、と示唆されます。
繰り返し出現するパターンは、生活様式の変化が危険性と表現型の結果を駆動する、というものです。本論文のデータから、過去には、生活様式の革新による環境変化が、MSの遺伝的危険性の増加を意図せず駆動した、と示唆されます。現在、過去50年間に観察されたMS事例の有病率増加に伴って、もはや以前の遺伝的構造を選好しない、生活様式の選択や衛生の改善を含めて、環境における変化との顕著な相関が再度観察されます。代わりに、自己組織を傷つけずに広範な種類の病原体や寄生虫と戦うのに必要な、免疫系内での遺伝的に駆動された細胞機能の優れた均衡が、要件の欠如の可能性を含めて、新たな課題と遭遇しています。たとえば、免疫細胞の1群であるCD4+T細胞ヘルパー1型(TH1)細胞が、細胞内病原体に対する強力な細胞性免疫応答を命令する一方で、Tヘルパー2型(TH2)細胞は細胞外の真正細菌や寄生虫に対する体液性の免疫応答を媒介し、組織の恒常性維持と修復を助けます。選択されたMS関連SNPの大半は広範な感染症の課題に対する防御と関連している、本論文では示されてきて、これは青銅器時代における強力ではあるものの均衡のとれたTH1/TH2免疫の選択と一致します。MSで観察された歪んだTH1/TH2均衡は部分的に先進世界の衛生設備増加から生じたかもしれず、それは、免疫系が効率的に戦うよう進化してきた寄生虫の、かなりの負担減少につながりました。
同様に、農耕や動物の家畜化や牧畜やより高い人口密度と関連する新たな病原性の課題は、遺伝的に発症しやすい個体群において、全身性のRA関連炎症状態を引き起こす危険性をかなり増加させたかもしれません。これは、関節障害の可能性の何年も前に、その後の感染症に続く、深刻な結果の危険性増加につながってきて、負の選択をもたらし、したがって、青銅器時代におけるRA関連の炎症と現在のMSとの間の類似を表しているかもしれません。現在では、生活様式が以前には公的だった遺伝的多様体を、自己免疫疾患の危険性として明らかにしてきた、というわけです。
より広くは、後期新石器時代と青銅器時代がヒトの歴史において重要な期間だったことは明らかで、この期間には高度に遺伝的および文化的に分岐した人口集団が進化史、混合しました(関連記事)。これら個別の歴史はおそらく、現在のいくつかの自己免疫疾患の遺伝的危険性と有病率を規定しています。意外なことに、牧畜民の草原地帯生活様式は、ヒトの歴史において最大の生活様式の変化と一般的に考えられている、新石器時代の移行期における農耕の出現と同じかそれ以上に、免疫応答に大きな影響を及ぼしたかもしれません。以下は『ネイチャー』の日本語サイトからの引用(引用1および引用2)です。
ゲノミクス:古代ヨーロッパ人のゲノムは現代人集団のゲノムをどのように形作ったのか
古代ユーラシア人集団のゲノム史を洞察するための手掛かりが、古代DNAの解析によって得られた。この知見を報告する4編の論文が、今週、Natureに掲載される。これらの論文に示された研究では、合わせて1600人以上の古代人の遺伝的データが解析され、過去約1万5000年にわたるヨーロッパの人類集団史に関する知見がもたらされた。
現代の西ユーラシア人集団の遺伝的多様性は、3つの主要な移住現象によって形作られたと考えられている。すなわち、約4万5000年前以降の狩猟採集民の到来、約1万1000年前以降の中東からの新石器時代の農耕民の拡大、そして約5000年前のポントスステップからのステップ牧畜民の到来である。狩猟採集から農耕への転換は、人類の歴史における重要な移行であるが、この移行期におけるヨーロッパとアジアの集団の構造と人口動態の変化に関する詳細な情報は少ない。
Morten Allentoft、Martin Sikora、Eske Willerslevらは1つ目の論文で、こうした過程を大陸横断的な規模で調べるため、ユーラシア大陸の北部と西部で見つかった、主に中石器時代と新石器時代の古代人317人のゲノムデータについて塩基配列を決定したことを報告している(中石器時代には、狩猟採集民と新石器時代の農耕民との間の空白を埋めるという意義がある)。また、今回の研究では、既存の1300人以上の古代人の遺伝子データも解析された。その結果、狩猟採集民から農耕民への移行の遺伝的影響に関して、黒海からバルト海まで伸びる非常に明確な「ゲノムの境界線」が存在することが明らかになった。この境界線の西側では、農耕の導入によって血統の変化を示す大規模な遺伝的変化が起こったが、これと同じ時期に、境界線の東側では、大きな変化は起こらなかった。著者らは、こうした違いが生じたのは境界線の東側の地域の気候条件が中東の農耕技術にあまり適していなかったためで、そのため狩猟採集社会が境界線の西側より約3000年長く続いた可能性があると指摘している。ステップ牧畜民の到来と拡大は、このゲノムの境界線の消失と関連している。
この他に、今週のNatureには、こうした遺伝的変化が現代のヨーロッパ人にどのような形で残っているかを調べた複数の論文(1つ目の論文と著者が重複している)が同時掲載される。2つ目の論文では、神経系の自己免疫疾患である多発性硬化症(MS)に対するヨーロッパ人の遺伝的リスクが高い原因が特定されたことが報告されている。この研究では、古代ゲノムのデータセットの一部と現代の英国在住のヨーロッパ系白人(自己申告による)約41万人のゲノムが比較され、現代のヨーロッパ人において、異なる古代ヨーロッパ人集団由来の遺伝物質が占める割合が定量化された。その結果、MSの遺伝的リスクはポントスステップの牧畜民の間で生じ、約5000年前にヨーロッパに持ち込まれ、これが記録のある移住現象と同時期であったことが明らかになった。また、この論文では、MSに関連した遺伝的バリアントが、感染症の有病率が増加していた時期に、ステップ牧畜民の生活習慣と環境に関連する免疫的優位性をもたらした可能性が示唆されている。
3つ目の論文では、古代の祖先集団の形質と現代人の形質の関連性がさらに指摘されている。例えば、糖尿病とアルツハイマー病のリスクに関連する遺伝的バリアントは、西欧の狩猟採集民の祖先集団に関連しており、北ヨーロッパ人と南ヨーロッパ人の身長差は、異なるステップ牧畜民の祖先集団に関連していることが明らかになった。また、4つ目の論文では、古代デンマークの集団を対象とした研究で、デンマークで発見された100体のヒトの骨格(中石器時代、新石器時代、青銅器時代前期の7300年間にわたる)のゲノム解析の結果が報告されている。この研究では、人口動態、文化、土地利用、食生活の変化のパターンが解明された。
以上の知見は、古代人集団における遺伝的選択と移住現象が、現代のヨーロッパ人に見られる多様な形質にどのように顕著な寄与をしたかを示している。
古代DNA:ステップ牧畜民集団で生じた多発性硬化症の遺伝的リスクの上昇
Cover Story:ステップ起源の変化:先史時代のユーラシアにおける移動と生活様式の変化が多発性硬化症の遺伝的リスクの上昇に関連している
今週号の4報の論文でE Willerslevたちは、古代ユーラシアから得られた遺伝学的データを用いて、先史時代の集団に対する大陸横断的な移動の影響を調べている。その結果、古代のステップ集団、農耕民集団、狩猟採集民集団の間の混合に由来すると思われる遺伝的な変化の一部が解き明かされた。特に、ステップ集団の移動が、おそらく狩猟採集から農耕と牧畜に集団が切り替わった際の病原体からの保護に伴う進化的圧力の結果として、ヨーロッパに多発性硬化症への遺伝的リスクの増大をもたらしたことが見いだされている。表紙は、ユーラシアステップの古代墓地で発見された典型的なクルガンの石碑のイラストを用いて、多発性硬化症のリスクとの遺伝的関連性に関わるイメージを表現している。
参考文献:
Barrie W. et al.(2024): Elevated genetic risk for multiple sclerosis emerged in steppe pastoralist populations. Nature, 625, 7994, 321–328.
https://doi.org/10.1038/s41586-023-06618-z
●要約
MSは神経炎症性および神経変性性の疾患で、ヨーロッパ北部において最も多く見られます。MSの遺伝的危険性は免疫関連遺伝子の内部や近傍に位置していると知られていますが、いつどこでどのようにこの遺伝的危険性が生じたのかは不明です。本論文では、中石器時代から青銅器時代の大規模な古代ゲノムデータセットを、新たな中世および中世の後のゲノムとともに用いて、MSの遺伝的危険性がポントス草原に由来する牧畜民で生じ、ヤムナヤ(Yamnaya)文化関連の移動によりヨーロッパへと5000年前頃にもたらされた、と示されます。本論文ではさらに、MS関連免疫遺伝学的多様体は草原地帯人口集団内およびその後のヨーロッパの両方で正の選択を経ており、それは食性と生活様式と人口密度の変化と同時期に起きた恐らく病原体の攻撃により引き起こされた、と示されます。本論文は、現代の免疫応答の決定因子としての新石器時代と青銅器時代の大きな重要性と、変化する環境におけるMSの発症危険性へのその後の影響を浮き彫りにします。
●研究史
MSは、現在世界中の250万人以上に影響を及ぼしている、脳と脊髄の自己免疫疾患です。その疾患率は民族と地理的位置で著しく異なり、最高の有病率はヨーロッパで観察され(10万人につき142.81例)、ヨーロッパ北部人はとくにこの疾患を発症しやすくなっています。この地理的差異の起源と理由はよく理解されていませんが、そうした偏りは、MSを含む自己免疫疾患の有病率が過去50年間に増加し続けた理由への、重要な手がかりを保持しているかもしれません。まだ分かりにくいものの、MSの病因は遺伝子と遺伝子および遺伝子と環境の相互作用が関わっている、と考えられています。証拠の蓄積から、外因性の誘因により、遺伝的に脆弱な個体群において多数の細胞と免疫経路を含む一連の事象が始まり、これが最終的にMS神経病理学につながるかもしれない、と示唆されています。
ゲノム規模関連研究(genome-wide association studies、略してGWAS)は、MSと関連する233個の一般的に発生する遺伝的多様体を特定してきました。そのうち32個の多様体はHLA(Human Leukocyte Antigen、ヒト白血球型抗原)領域内に、201個の多様体はHLA領域外に位置しています。最も強いMSの関連性はHLA領域で見つかっており、これらのうち最も顕著なのはHLA-DRB1*15:01で、このアレル(対立遺伝子)の少なくとも1コピーを有する個体群ではMSの危険性が約3倍増加します。
まとめると、遺伝的要因は疾患危険性全体の約30%を説明する、と推定されていますが、環境および生活様式要因がMSへの主要な一因と考えられています。たとえば、エプスタイン・バーウイルス(Epstein–Barr virus、略してEBV)は子供期に頻繁に発症し、通常は無症状ですが、衛生基準の高い諸国で通常観察されるように、成人初期への感染遅延はMSの32倍の危険性増加と関連しています。喫煙や思春期の肥満や栄養や腸の健康などMS危険性の増加と関連する生活様式要因も、地理的に異なります。自己免疫は他の病原体からの圧力変化からも起きる可能性があり、炎症促進経路と抗炎症経路の微妙な均衡の変化を引き起こします。
ヨーロッパの遺伝的祖先系統(以下、「祖先系統」)は、混合人口集団におけるMS有病率の世界的な違いの一部を説明する、と仮定されています。具体的には、MSを有するアフリカ系のアメリカ合衆国の個体群は、HLA領域において、対照個体群と比較してヨーロッパ祖先系統の増加を示し、ヨーロッパ人のハプロタイプは、HLA-DRB1*15:01を含めてほとんどのHLAアレルでMSの危険性を高めます。逆に、MSを有するアジア系のアメリカ合衆国の個体群は、対照個体群と比較して、HLA領域においてヨーロッパ祖先系統が減少しています。古代ヨーロッパの祖先系統とヨーロッパにおけるMSの危険性は地理的に構造化されていると知られており(図1a・b)、MSの有病率に関するヨーロッパ内の祖先系統の差異の影響は不明です。
●標本
現在の祖先の差異は、古代の人口集団に由来する遺伝的祖先系統の混合としてモデル化でき、その祖先系統は生計生活様式により、ヨーロッパ西部狩猟採集民(Western hunter-gatherer、略してWHG)、ヨーロッパ東部狩猟採集民(Eastern hunter-gatherer、略してEHG)、コーカサス狩猟採集民(Caucasus hunter-gatherer、略してCHG)、アナトリア半島農耕民(Anatolian farmers、略してANA)および新石器時代、草原地帯牧畜民に区別できます(図1c・d)。
新たな中世および中世の後のゲノムと組み合わされた、関連研究(関連記事)で提示された中石器時代から青銅器時代までの大規模な古代ゲノムデータセットの使用により、これら祖先人口集団に関して現在のヨーロッパ人の遺伝的祖先系統が定量化され、生活様式特有の進化の兆候が特定されました。次に、MSの危険性増加と関連する多様体が正の選択を経たのかどうか、判断されました。選択がいつ起きたのか、選択の標的は生活様式に特有だったのかどうか、検討されました。最後に、生計慣行および病原体への曝露を含めて、危険性多様体の選択を引き起こしたかもしれない環境条件が調べられました。全しての手法により提供される証拠の概要は、拡張データ図1で見ることができます。以下は本論文の図1です。
現代人のゲノム内の祖先系統パターンを調べるため、草原地帯牧畜民を含めて中石器時代と新石器時代の古代人318個体のDNA標本の参照パネル(図1)を用いて、イギリス生物銀行(United Kingdom Biobank、略してUKB)における自己認識が「白人のイギリス人」である約41万個体について、特定の遺伝子座における祖先系統(遺伝子座祖先系統)が推定されました。各分類表示された549323の一塩基多型(Single Nucleotide Polymorphism、略してSNP)をUKBのゲノム規模祖先系統と比較することで、「異常得点」が提供されました。2ヶ所の領域は、最も極端祖先系統組成を有していることで際立っており、それは、ラクターゼ(Lactase、略してLCT、乳糖分解酵素)活性持続(lactase persistence、略してLP)を調節すると充分に確証されている2番染色体のLCT/MCM6(minichromosome maintenance complex component 6、ミニ染色体維持タンパク質6)と、6番染色体のHLA領域です。
HLA領域は自己免疫疾患と強く関連しており、本論文ではそのうち、MSと、関節に特徴的に影響を及ぼす一般的な前進性炎症疾患である関節リウマチ(rheumatoid arthritis、略してRA)が調べられました。本論文のデータセット(中石器時代から青銅器時代の大規模な古代ゲノムデータセットおよびデンマークの86個体の新たな中世および中世の後のゲノムデータから構成されます)には合計1750点の補完された二倍体ショットガン配列決定古代ゲノムが含まれ、そのうち1509点はユーラシアに由来し、現代人のデータ(関連記事)とともに、1万年前頃から現在に至るほぼ完全な横断区が達成されました。
●分析結果
MSにとって最高の危険性となるアレルの頻度は確率比(odds ratio、略してOR)で1.5超となり、その全てはHLAクラスII領域内にあり、本論文の古代人集団では顕著なパターンを示しました。とくに、HLA-DRB1*15:01での標識SNP(rs3135388[T])はMSで最高の危険性を有しており(OR=2.9)、イタリア中央部のコンティネンツァ洞窟(Grotta Continenza)の新石器時代(放射性炭素年代で5836~5723年前頃)の1個体(R3、網羅率は4.05倍)で最初に観察され、草原地帯および草原地帯由来人口集団において5300年前頃となるヤムナヤ文化の出現の時期に頻度が急速に上昇ました(図2)。特定の国で生まれ、「典型的な祖先背景」を有して生まれたUKBの個体群の危険性アレル頻度から、HLA-DRB1*15:01の頻度はフィンランドとスウェーデンとアイスランドの現代の人口集団および高い割合の草原地帯祖先系統を有する古代の人口集団において最高だった、と分かりました(図2b挿入図)。以下は本論文の図2です。
特定の遺伝的祖先系統の危険性を調べるため、局所的な祖先系統データセットを用いて、UKBの補完されたデータセットにおいて全てのMS関連の詳細にマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)された遺伝子座各祖先系統について危険性比率が計算されました。MSについては、草原地帯祖先系統がほぼ全てのHLAのSNPにおいて最高の危険性比率でしたが、農耕民および外群祖先系統は最も保護的となることが多く(図3a)、この部位における草原地帯は正ハプロタイプがMS危険性をもたらす、と示唆されます。以下は本論文の図3です。
一部の祖先系統が特定のSNPでより高い危険性を有する、と示されたので、各祖先系統について合計危険性得点の計算が試みられました。完全に1祖先系統から構成される現代の1個体について多遺伝子危険性得点(polygenic risk score、略してPRS)に相当する、統計的な祖先系統固有多遺伝危険性得点(ancestry-specific polygenic risk score、略してARS)が用いられました。ARSは直接的な古代人の遺伝子型呼び出しを用いてのPRSの計算に改善を提供し、それは、ARSが入り込んできた浮動と選択に対して堅牢でありながら、少ない古代DNAの標本数と偏りの影響を軽減するからです。
加速ブートストラップ経由で得られた信頼区間のある付加的なモデル下で、以前の関連研究から足られた有効規模推定値が用いられました。MSのARSでは、草原地帯祖先系統が最大の危険性を有しており、それに続くのがWHGとCHGとEHGの祖先系統で、農耕民および外群祖先系統のARSは最低でした。したがって、草原地帯祖先系統は全ての関連するSNP全体でMSに対して最大の危険性をもたらします。遺伝子座の再標本抽出によるゲノム規模関連について検証され、草原地帯祖先系統の危険性は依然として明確に農耕民祖先系統を上回っている、と分かりました。その兆候のほとんどはHLA領域のSNPにより駆動されましたが、このパターンは、これらのSNPを除外しても存続しました(図3b)。
草原地帯祖先系統が2つのMS関連SNPを除いて全てで危険性をもたらす事実(図3a)から、これらのアレルには共通の進化史がある、と示唆されます。したがって、祖先系統が表現型の予測に使用できるのかどうか、調べられました。年齢と性別と最初の18主成分を制御しながら、疾患関連SNPについてUKBにおける3種類の関連分析が実行されました。
第一の分析は、ゲノム規模関連研究と同様に、通常のSNPに基づく分析でした。第二の分析は、遺伝子型値の代わりに、局所的な祖先系統の確率との関連を検証しました。第三の分析は、通常のゲノム規模関連研究のようなSNPの使用の代わりに、形質を予測する特徴一式としてのハプロタイプの処理によるSNP間の相互作用の検出に用いられる、ハプロタイプ傾向回帰(haplotype trend regression、略してHTR)に基づいていました。余分な柔軟性(HTRX)を有するHTRと呼ばれる新たな手法が開発され、この手法は単一のSNPと非連続的なハプロタイプを含む、ハプロタイプのパターンを検索します。このモデルの性能を評価し、過剰適合を防ぐため、モデルがどれだけ適切に新たなデータに一般化できるのか測定する、標本外データの予測能力が評価されました。模擬実験により、相互作用が欠如しており、相互作用強度が増加するにつれてより多くの分散となる場合に、HTRXが通常のゲノム規模関連研究として同じ量の分散を説明する、と示されます。
本論文における自己認識が「白人のイギリス人」である個体群のコホート(特定の性質が一致する個体で構成される集団)は、MSに関しては比較的検出力が劣っていますが(1949人の症例で398049人の対照群、有病率は0.487%)、MSはHLA領域において草原地帯および農耕民祖先系統と関連していました。HLA領域内の4点の主要な連鎖不平衡(Linkage disequilibrium、略してLD)の塊(クラスI、32.41Mb~32.68Mbと33.04Mb~33.08Mbにより決定されるクラスIIの2ヶ所の下部領域、クラスIII)のうち3点では、局所的な祖先系統が遺伝子型よりも有意に多くの差異を説明します(図4)。以下は本論文の図4です。
通常のGWASと比較しての一部の領域における局所的な祖先系統の性能増加は、領域外のSNPの標識付けにより説明できますが、GWASに対するHTRXの性能増加は、稀なSNPとエピスタシスを含む1ハプロタイプの全体的な効果を定量化します。HLA領域全体にわたって、ハプロタイプは通常のGWAS(2.48%)よりも標本外の差異をより多く説明します(少なくとも2.90%)。相互作用の兆候は、HLAクラスI領域内およびHLAのクラスIとクラスIIのI領域間でも観察されました。各遺伝子座における共発生した祖先系統がMSと関連しているのかどうか、さらに検証されましたが、危険性が草原地帯祖先系統以外の祖先系統と関連していた、という証拠は見つかりませんでした。
草原地帯祖先系統がMSのHLA関連危険性のほとんどに寄与している、と確証されたので、MS危険性が選択下で進化したのかどうか、調べられました。経時的に祖先系統により分解される、全ての関連SNP全体で方向性選択の証拠が検証されました。この検証は、分類表示された個体を含む祖先組換え図(ancestral recombination graph、略してARG)の周縁系統樹における標本の最近傍の推測に基づいて、「経路に基づく染色体彩色」技術を用いました(関連記事)。
その結果得られた祖先の経路分類表示により、古代と現代両方の個体群のハプロタイプについて、経時的な混合割合の変化を制御しながら、危険性関連多様体のアレル頻度の軌跡推測が可能となります。その経路は現在から15000年前頃にまで及び、経路がたどる独特な人口集団で分類表示されています(ANAかCHGかEHGかWHG)。異なる経路を使用するので、この手法は比較的最近の草原地帯の混合もしくは外群人口集団の分類表示を用いず、経路の分類表示は連続的な人口集団の代表ではなく、むしろ相当する人口集団を含む時代にさかのぼる経路を表しています。たとえば、CHGの経路は、草原地帯からのEHGとの統合前CHG人口集団に由来し、次にその後のヨーロッパ人口集団における他の祖先系統と統合しました(図1)。
本論文の祖先系統経路分析では、詳細にマッピングされたMS関連多様体のかなりの割合が、本論文のデータセットでは補完されておらず、これは古代の標本における品質管理選別と正確なHLA領域の推測の難しさのためです。これに対処するため、同じ研究からLDのゲノム規模の有意な要約統計量が取り除かれ、確実に祖先系統経路分類表示を割り当てることができました。これにより、CLUESとPALMを用いて、疾患関連多様体の全体にわたって多遺伝子選択の検証が可能となりました。
MSについては、全ての祖先系統をまとめて検証すると、5000~2000年前頃に疾患危険性が選択的に増加した、という証拠が見つかりました(図5)。4系統の長期の祖先経路(CHG、EHG、WHG、ANA)のそれぞれを上限付けすると、WHGとEHGとCHGの経路における統計的に有意な兆候が見つかりましたが、ANA経路では見つかりませんでした。繰り返すと、選択は草原地帯の牧畜民人口集団で起きた可能性が高そうで、それは、草原地帯牧畜民人口集団がEHG祖先系統とCHG祖先系統のほぼ同じ割合で構成されているからです。祖先系統全体の分析において経時的に遺伝的危険性の最大の変化を駆動したのは、HLA-DRB1*15:01を標識付けしたrs3129934でした。選択の証拠についてHLA-DRB1*15:01ハプロタイプを標識付けする他の3点のSNP(rs3129889、rs3135388、rs3135391)も検証され、祖先系統の階層化された兆候は一貫してCHGにおいて最も強い、と分かりました(図5b)。以下は本論文の図5です。
選択の性質をさらに調べるため、新たな要約統計量である祖先系統の連鎖不平衡(linkage disequilibrium of ancestry、略してLDA)が開発されました。LDAは2ヶ所のSNPにおける局所的な祖先系統間の相関で、祖先系統間の組み換え事象が祖先系統内の組み換え事象と比較して高頻度で起きていたのかどうか、測定します。その後、あるSNPの「LDA得点」が、ゲノムの残りを有するSNPの合計LDAとして定義されました。高いLDA得点からは、参照人口集団から継承されたハプロタイプは予測より長い、と示唆される一方で、低い得点からは、ハプロタイプは予測より短い(つまり、より多くの組み換えを経ているわけです)、と示唆されます。たとえば、LCT/MCM6領域は、比較的最近の選択的一掃から予測されるように、高いLDA得点を示しました。
HLA領域は、6番染色体の他の領域よりもLDA得点が有意に低くなりました。模擬実験を通じて、この兆候は単一の祖先系統ハプロタイプに対して混合祖先系統のハプロタイプに有利な選択により駆動されたに違いない、と示されました。複数のSNP選択モデルを拡張すると、本論文の説明は、少なくとも2ヶ所の分離した遺伝子座がその後で混合してHLA領域において選択を維持した別々の人口集団で選択的に生じた、というもので、新たな用語である「組換え有利選択」を正当と理由づけます。これが意味するのは、組換えにより駆動された、HLA領域における多様な祖先系統での選択があった、ということです。
Fₛₜなど平衡選択の他の測定とは異なり、LDAは特定の年代測定された人口集団からの過剰な祖先系統LDを説明するので、独立した兆候です。HLAクラスII領域については、選択は全ての構成(LDA得点やFₛₜやπ)を測定しますが、HLAクラスI領域については、LDA得点は30.8 Mbで追加の多様ではない最小限を有しており、ここではゲノムが祖先的多様であるものの、遺伝学的に強く制約されている、と示唆されます。したがって、LDA得点は検出される選択の種類と、選択が変化を受けてきたのかどうかについて、情報をもたらします。
MSは古代の個体群に適応度の利点をもたらさなかったでしょうから、この選択は、現在におけるMSの危険性増加が多面発現の副産物である、共有された遺伝的構造により駆動された可能性が高そうです。したがって、1もしくは複数の祖先系統においてCLUES を用いて、選択の統計的に有意な証拠を示し、UKB から得られた4359点の形質と、フィンランド人ゲノミクス(Finnish Genomic、略してFinnGen)研究(関連記事)における2202点の形質についてゲノム規模の有意な形質の関連を有する、LDを取り除いたMS関連SNPが検索されました。全ての選択されたSNPは複数の他の形質とも関連している、と観察されました。
MS危険性を選好する多遺伝子選択の観察された兆候が、遺伝的に相関する形質で作用する選択によってより適切に説明できるのかどうか判断するため、MS関連の選択されたSNPで少なくとも20%の重複がある、UKBとFinnGenにおける形質(合計115点)の体系的分析が実行されました。相関する形質への多遺伝子選択を解明するため特別に設計されたPALMでの共同検定を用いると、検定数を考慮した場合、MS危険性を選好する選択兆候が遺伝的に相関する形質に作用する選択により有意に減ずる、UKBもしくはFinnGenの形質は見つかりませんでした。これは、MSの選択兆候が、検証された遺伝的に相関する形質に作用する選択により説明できないことを論証します。
UKBとFinnGenは多くの形質や疾患に関して検出力不足なので、CLUEを用いて、選択の統計的に有意な証拠を示した全てのLDを取り除いたMS関連SNP(合計32点、そのうち78%となる25点はHLA領域にあります)について、手作業で文献検索されました。その結果、正の選択下のほとんどは特定の病原体および/もしくは感染症(祖先系統経路で選択された疾患もしくは病原体関連の合計、ANAでは11/14、CHGでは6/9、EHGでは6/7、WHGでは17/18/)に対する保護と関連している、と分かりましたが、GWASデータが多くの感染症では利用できないことに要注意です。
選択されたアレルがいくつかの慢性的ウイルス(EBVや水痘帯状疱疹ウイルスや単純ヘルペスウイルスやサイトメガロウイルス)、および小さな狩猟採集民集団において伝染と関連しないウイルスもしくは疾患との保護的関連性を有している、と観察されましたるさらに、多くの選択されたアレルは、寄生虫か、皮下組織や胃腸や呼吸器や尿路や性感染症か、これらもしくは他の感染症と関連する病原体、たとえば、クロストリジオイデス・ディフィシル(Clostridioides difficile)や化膿レンサ球菌(Streptococcus pyogenes)や結核菌(Mycobacterium tuberculosis)について、危険性減少をもたらしました。この証拠は強く示唆的ではあるものの、これら推定される関連の多くは、検出力不足のGWASと候補遺伝子研究における偏りのため統計的に堅牢ではないかもしれない、と本論文は強調します。
MSについてのこれらの調査結果が、MSとは対照的に前進性炎症性疾患であるものの、その特徴的な関節障害でよく知られているRA(関節リウマチ)についての結果と比較されました。RAについての本論文の調査結果は、顕著に異なる祖先系統危険度特性を示します。HLA-DRB1*04:01はRAの最大の遺伝的危険因子で、CLUES分析では、このアレル(rs660895)の分類表示SNPは、3000年前頃までの連続的な負の選択の証拠を示しました。WHGおよびEHG祖先系統はRAと関連するSNPにおいて最も多くの危険性をもたらし(重み付け平均有病率に基づくRA関連SNPの相対的な危険性比率)、これらの祖先系統は、そのより高いARSに反映されているように全体でRAに最大の危険性をもたらす一方で、草原地帯および外群祖先系統は最低点だった、と分かりました。これらの結果は、局所的なGWASで要約されました。RA関連SNPは過去約15000年間にわたって負の多遺伝子選択を受けてきた、と分かりました。祖先系統経路に分解すると、全ての経路は負の選択勾配を示し、名目上の有意性に達しなかったものの、CHG経路は近くなった、と分かりました。
これらの結果から、RAの遺伝的危険性はMSとは対照的に遠い過去においてより高く、RA関連危険性多様体は農耕到来前のヨーロッパの狩猟採集民人口集団においてより高頻度で存在した、と論証されます。狩猟採集民人口集団におけるより高い遺伝的危険性とその後の負の選択の根底にあるかもしれないものを理解するため、選択の統計的に有意な証拠を示す、LDを取り除いたSNP(合計55ヶ所、そのうち65%となる36ヶ所はHLA領域にあります)について、再度手作業で文献検索が実行されました。その結果、選択されたSNPの大半は、全ての経路で異なる病原体および/もしくは感染症に対する防御と関連している(祖先系統経路で選択された疾患もしくは病原体関連の総数は、ANAで16/20、CHGで12/16、EHGで8/13、EHGで14/20、WHGで16/21)、と分かりました。選択されたRA危険性アレルとは通常、MS分析と同様に同じ病原体もしくは疾患と関連していましたが、一部のSNPはMS危険性分析では観察されなかった病原体もしくは疾患、たとえば、赤痢アメーバ(Entamoeba histolytica)や麻疹や肝炎ウイルスや節足動物ウイルス性発熱やウイルス出血性発熱や肺炎球菌性に対して防護的でした。
●考察
過去1万年間に、生活様式における最も極端な地球規模の変化が見られ、一部の地域で農耕が、他地域で牧畜が出現しました。5000年前頃には農耕民祖先系統がヨーロッパ全域で優勢でしたが、比較的多様な遺伝的祖先系統がこの頃に草原地帯からの移動とともに到来しました(関連記事)。本論文では、この遺伝的祖先系統は現在のMSに最も多くの遺伝的危険性をもたらし、これらの多様体はポントス・カスピ海草原(ユーラシア中央部西北からヨーロッパ東部南方までの草原地帯)での牧畜民生活様式の出現、およびヨーロッパのその後の混合人口集団における継続的選択と一致する正の選択の結果だった、と示されてきました。
これらの結果は、ヨーロッパにおけるMS有病率の南北の勾配に関する長年の議論に対処し、ヨーロッパ大陸全体の現代の人口集団における草原地帯祖先系統の勾配、具体的にはHLA領域における勾配が、環境要因との組み合わせでこの現象を引き起こしたかもれない、と示唆します。さらに、HLA領域におけるMS関連多様体間のエピスタシスが以前には論証されてきたものの、本論文では、これを考慮すると独立したSNPの影響だけよりも分散を説明できる、と示されました。これらの危険性アレルを有するハプロタイプの多くが有している祖先系統固有の起源は、個々の危険性予測に利用でき、遺伝的祖先系統関連からMS危険性の機序的な理解への経路を提供できるかもしれません。これらの調査結果が、別のHLAクラスII関連の慢性炎症性疾患であるRAの結果と比較され、RAの遺伝的危険性は対照的なパターンを示す、と分かりました。つまり、RAについては、遺伝的危険性は中石器時代狩猟採集民において最高で、経時的に減少したわけです。
この歴史に関する本論文の解釈は、さまざまな病原体とそのヒト宿主との間の共進化が、生活様式および環境に応じて、これらの人口集団が融合した後の組換えで選好された選択によって、免疫応答遺伝子への大規模で多様な遺伝的祖先系統固有の選択をもたらしたかもしれない、というものです。病原体による進化の同様の事例が、最近刊行されました。後期新石器時代と青銅器時代は、人口集団における感染症の有病率が大きく増加した時期で、それは人口密度増加や、家畜化された動物との接触および家畜やその産物の消費に起因します。多くの疾患関連病原体の最新の共通祖先はこの期間に存在しました(関連記事1および関連記事2)。
これらの疾患は現在一般的ですが、過去におけるその地理的範囲の推測は困難で、より制約されてきたかもしれません。本論文では、選択下にあるMSおよびRA関連多様体が広範な感染症および病原体にいくつかの耐性をもたらした、と示しました。たとえば、HLA-DRB1*15:01は結核に対する保護と関連しており、ハンセン病の危険性を増加させます(関連記事)。しかし本論文は、この仮説を超えての特定の関連性の検出には力不足でした。それは、過去の疾患の分布と多様性に関する知識の乏しさ、考古学的記録における内在性病原体の保存の乏しさ、部分的には広範なワクチン接種計画のためである、多くの感染症への検出力の充分あるGWASの欠如に起因します。まとめると、これらの調査結果から、人口拡散と生活様式の変化と人口密度増加は、新旧両方の病原体の高度で持続的な感染をもたらし、それは今では自己免疫疾患と関連している免疫応答遺伝子における多様体の選択を促進したかもしれない、と示唆されます。
繰り返し出現するパターンは、生活様式の変化が危険性と表現型の結果を駆動する、というものです。本論文のデータから、過去には、生活様式の革新による環境変化が、MSの遺伝的危険性の増加を意図せず駆動した、と示唆されます。現在、過去50年間に観察されたMS事例の有病率増加に伴って、もはや以前の遺伝的構造を選好しない、生活様式の選択や衛生の改善を含めて、環境における変化との顕著な相関が再度観察されます。代わりに、自己組織を傷つけずに広範な種類の病原体や寄生虫と戦うのに必要な、免疫系内での遺伝的に駆動された細胞機能の優れた均衡が、要件の欠如の可能性を含めて、新たな課題と遭遇しています。たとえば、免疫細胞の1群であるCD4+T細胞ヘルパー1型(TH1)細胞が、細胞内病原体に対する強力な細胞性免疫応答を命令する一方で、Tヘルパー2型(TH2)細胞は細胞外の真正細菌や寄生虫に対する体液性の免疫応答を媒介し、組織の恒常性維持と修復を助けます。選択されたMS関連SNPの大半は広範な感染症の課題に対する防御と関連している、本論文では示されてきて、これは青銅器時代における強力ではあるものの均衡のとれたTH1/TH2免疫の選択と一致します。MSで観察された歪んだTH1/TH2均衡は部分的に先進世界の衛生設備増加から生じたかもしれず、それは、免疫系が効率的に戦うよう進化してきた寄生虫の、かなりの負担減少につながりました。
同様に、農耕や動物の家畜化や牧畜やより高い人口密度と関連する新たな病原性の課題は、遺伝的に発症しやすい個体群において、全身性のRA関連炎症状態を引き起こす危険性をかなり増加させたかもしれません。これは、関節障害の可能性の何年も前に、その後の感染症に続く、深刻な結果の危険性増加につながってきて、負の選択をもたらし、したがって、青銅器時代におけるRA関連の炎症と現在のMSとの間の類似を表しているかもしれません。現在では、生活様式が以前には公的だった遺伝的多様体を、自己免疫疾患の危険性として明らかにしてきた、というわけです。
より広くは、後期新石器時代と青銅器時代がヒトの歴史において重要な期間だったことは明らかで、この期間には高度に遺伝的および文化的に分岐した人口集団が進化史、混合しました(関連記事)。これら個別の歴史はおそらく、現在のいくつかの自己免疫疾患の遺伝的危険性と有病率を規定しています。意外なことに、牧畜民の草原地帯生活様式は、ヒトの歴史において最大の生活様式の変化と一般的に考えられている、新石器時代の移行期における農耕の出現と同じかそれ以上に、免疫応答に大きな影響を及ぼしたかもしれません。以下は『ネイチャー』の日本語サイトからの引用(引用1および引用2)です。
ゲノミクス:古代ヨーロッパ人のゲノムは現代人集団のゲノムをどのように形作ったのか
古代ユーラシア人集団のゲノム史を洞察するための手掛かりが、古代DNAの解析によって得られた。この知見を報告する4編の論文が、今週、Natureに掲載される。これらの論文に示された研究では、合わせて1600人以上の古代人の遺伝的データが解析され、過去約1万5000年にわたるヨーロッパの人類集団史に関する知見がもたらされた。
現代の西ユーラシア人集団の遺伝的多様性は、3つの主要な移住現象によって形作られたと考えられている。すなわち、約4万5000年前以降の狩猟採集民の到来、約1万1000年前以降の中東からの新石器時代の農耕民の拡大、そして約5000年前のポントスステップからのステップ牧畜民の到来である。狩猟採集から農耕への転換は、人類の歴史における重要な移行であるが、この移行期におけるヨーロッパとアジアの集団の構造と人口動態の変化に関する詳細な情報は少ない。
Morten Allentoft、Martin Sikora、Eske Willerslevらは1つ目の論文で、こうした過程を大陸横断的な規模で調べるため、ユーラシア大陸の北部と西部で見つかった、主に中石器時代と新石器時代の古代人317人のゲノムデータについて塩基配列を決定したことを報告している(中石器時代には、狩猟採集民と新石器時代の農耕民との間の空白を埋めるという意義がある)。また、今回の研究では、既存の1300人以上の古代人の遺伝子データも解析された。その結果、狩猟採集民から農耕民への移行の遺伝的影響に関して、黒海からバルト海まで伸びる非常に明確な「ゲノムの境界線」が存在することが明らかになった。この境界線の西側では、農耕の導入によって血統の変化を示す大規模な遺伝的変化が起こったが、これと同じ時期に、境界線の東側では、大きな変化は起こらなかった。著者らは、こうした違いが生じたのは境界線の東側の地域の気候条件が中東の農耕技術にあまり適していなかったためで、そのため狩猟採集社会が境界線の西側より約3000年長く続いた可能性があると指摘している。ステップ牧畜民の到来と拡大は、このゲノムの境界線の消失と関連している。
この他に、今週のNatureには、こうした遺伝的変化が現代のヨーロッパ人にどのような形で残っているかを調べた複数の論文(1つ目の論文と著者が重複している)が同時掲載される。2つ目の論文では、神経系の自己免疫疾患である多発性硬化症(MS)に対するヨーロッパ人の遺伝的リスクが高い原因が特定されたことが報告されている。この研究では、古代ゲノムのデータセットの一部と現代の英国在住のヨーロッパ系白人(自己申告による)約41万人のゲノムが比較され、現代のヨーロッパ人において、異なる古代ヨーロッパ人集団由来の遺伝物質が占める割合が定量化された。その結果、MSの遺伝的リスクはポントスステップの牧畜民の間で生じ、約5000年前にヨーロッパに持ち込まれ、これが記録のある移住現象と同時期であったことが明らかになった。また、この論文では、MSに関連した遺伝的バリアントが、感染症の有病率が増加していた時期に、ステップ牧畜民の生活習慣と環境に関連する免疫的優位性をもたらした可能性が示唆されている。
3つ目の論文では、古代の祖先集団の形質と現代人の形質の関連性がさらに指摘されている。例えば、糖尿病とアルツハイマー病のリスクに関連する遺伝的バリアントは、西欧の狩猟採集民の祖先集団に関連しており、北ヨーロッパ人と南ヨーロッパ人の身長差は、異なるステップ牧畜民の祖先集団に関連していることが明らかになった。また、4つ目の論文では、古代デンマークの集団を対象とした研究で、デンマークで発見された100体のヒトの骨格(中石器時代、新石器時代、青銅器時代前期の7300年間にわたる)のゲノム解析の結果が報告されている。この研究では、人口動態、文化、土地利用、食生活の変化のパターンが解明された。
以上の知見は、古代人集団における遺伝的選択と移住現象が、現代のヨーロッパ人に見られる多様な形質にどのように顕著な寄与をしたかを示している。
古代DNA:ステップ牧畜民集団で生じた多発性硬化症の遺伝的リスクの上昇
Cover Story:ステップ起源の変化:先史時代のユーラシアにおける移動と生活様式の変化が多発性硬化症の遺伝的リスクの上昇に関連している
今週号の4報の論文でE Willerslevたちは、古代ユーラシアから得られた遺伝学的データを用いて、先史時代の集団に対する大陸横断的な移動の影響を調べている。その結果、古代のステップ集団、農耕民集団、狩猟採集民集団の間の混合に由来すると思われる遺伝的な変化の一部が解き明かされた。特に、ステップ集団の移動が、おそらく狩猟採集から農耕と牧畜に集団が切り替わった際の病原体からの保護に伴う進化的圧力の結果として、ヨーロッパに多発性硬化症への遺伝的リスクの増大をもたらしたことが見いだされている。表紙は、ユーラシアステップの古代墓地で発見された典型的なクルガンの石碑のイラストを用いて、多発性硬化症のリスクとの遺伝的関連性に関わるイメージを表現している。
参考文献:
Barrie W. et al.(2024): Elevated genetic risk for multiple sclerosis emerged in steppe pastoralist populations. Nature, 625, 7994, 321–328.
https://doi.org/10.1038/s41586-023-06618-z
この記事へのコメント