ネアンデルタール人由来の新型コロナウイルス感染症の遺伝的リスクの評価
ネアンデルタール人(Homo neanderthalensis)由来の新型コロナウイルス感染症(COVID-19)の遺伝的リスクの評価に関する研究(Wohlers et al., 2020)が公表されました。本論文は査読前なので、あるいは今後かなり修正されるかもしれませんが、ひじょうに興味深い内容なので取り上げます。今年(2020年)、新型コロナウイルス(SARS-CoV-2)の世界的大流行は、かなりの感染率と死亡率をもたらし、100万人以上の命を奪いました。SARS-CoV-2により起きる症状は新型コロナウイルス感染症と呼ばれ、無症状もしくは軽症から呼吸不全への急速な進行まで、症状が大きく異なります。SARS-CoV-2の世界的大流行の初期には、主要なリスク因子として、高齢や性別(男性であること)やいくつかの併存疾患が明らかになりました。
一般的に、ゲノム規模関連研究(GWAS)は、遺伝子型を疾患感受性や重症度のような表現型に関連づけますが、その関連づけは因果関係を意味するわけではありません。通常は多くの相関多様体を含むGWASの関連兆候の根底にある原因となる多様体を特定するために、第一段階でいわゆるファインマッピング(ゲノムの機能・場所の精細な識別)が実行されます。最終的には、ファインマッピングの後に実験的検証を行ない、原因となる多様体と仕組みを最終的に特定する必要があります。GWASはコホートデータに基づいていますが、原因となる多様体の代理としての関連する多様体を介して、個人的なリスクを評価できます。このため、コホートの遺伝的連鎖パターンは、個人の遺伝的背景を表す必要があります。しかし、この要件は、とくに非ヨーロッパ系統を有する個体では、しばしば満たされません。世界的な新型コロナウイルス感染症の流行では、これが個人の遺伝的リスク予測を危うくし、以下に示されるように、現在のリスク要因を注意して用いる必要があるかもしれません。
新型コロナウイルス感染症に関して、現時点で唯一の査読誌に掲載されたGWAS論文は、22個の高度に相関したリスク多様体の信頼できる組み合わせを、コンピュータシミュレーションにより示し、その中には代表する多様体であるrs11385942が含まれます。組み合わせると、これらの多様体は原因となる多様体を含む全体的な確率が95%以上となりますが、22個の多様体の原因となる確率は、それぞれ1~11%(中央値は4%)です。この最初の研究は、スペイン人とイタリア人のコホートのメタ分析でした(1610例)。
新型コロナウイルス宿主遺伝学イニシアチブ(COVID-19 Host Genetics Initiative)は、このデータを世界規模のメタGWASに含めました(8638例)。この最新のファインマッピングでは、わずか10個の多様体の信頼できる組み合わせが得られ、これは刊行された22個の信頼できる組み合わせの多様体の下位区分となります。このファインマッピングは、GWASコホート自体の連鎖不平衡情報を利用していません。これは、最初のスペイン人とイタリア人のコホートに適用されています。さらに、たとえば原因となる多様体が全コホートで発生しない場合など、ヨーロッパ人と非ヨーロッパ人との間の違いにより影響を受ける可能性があります。したがって、比較的均質なGWASコホート内のリスクハプロタイプの世界規模の遺伝的多様性は、以下に示されるように、知見の解釈を助け、早期の特定のために、精査されねばなりません。
これら22個のリスク多様体のうち、19個はクロアチアのヴィンディヤ洞窟(Vindija Cave)遺跡で発見された5万年前頃のネアンデルタール人女性(Vindija 33.19)のゲノム(関連記事)において特定可能で、4個は保護的アレル(対立遺伝子)を有しており、それは原因となる多様体を含むリスク可能性が64%となります。欠落多様体が同様にリスクアレルだった場合、この可能性は82%に増加します。最近のネアンデルタール人(Homo neanderthalensis)に関する研究(関連記事)では、この19個のうち13個が取り上げられ、61%の原因となる多様体を含む全体の最大確率が伴います。しかし、2ヶ所は保護的アレルを有するので、以前に評価されたヴィンディヤ洞窟のネアンデルタール人のハプロタイプのリスク確率はわずか52%です。
本論文の結果は、ネアンデルタール人のハプロタイプに基づく以前の研究の評価を補完します。本論文は以前の研究と同様に1000ゲノム計画のデータを用いますが、重要な違いが三つあります。まず、22個全ての新型コロナウイルス感染症関連多様体を組み込んだ、65800塩基対のより大きなゲノム領域内でハプロタイプを調べたことです。原因となる多様体を含む全体的な確率は、これら全てで95%以上です。これにより、以前の分析による61%の確率が大きく増加します。次に、22個の信頼できる組み合わせの多様体の位置のハプロタイプのみが調査されました。つまり、新型コロナウイルス感染症関連のハプロタイプのみです。以前は、全ての多様体の位置を含む全てのハプロタイプが、遺伝子座の包括的な系統樹を得るために用いられ、それは最新の代表となる多様体であるrs35044562を有するハプロタイプが、どのようにネアンデルタール人とクレード(単系統群)を形成するのか、示しました。本論文では、系統関係とは無関係なリスク関連ハプロタイプが特徴づけられました。最後に、以前のハプロタイプに基づく評価は、リスク多様体としてハプロタイプを分類するために、代表となる多様体であるrs35044562のみを用いていましたが、本論文は、リスク多様体の個々の確率を利用します。
1000ゲノム計画のハプロタイプは、H1~H38という38の異なるハプログループに分類されます(図1C)。リスク関連ハプロタイプは、全データセットで10%の総頻度となり、異なる大陸の集団では1~31%の範囲で変動します(図1A)。H1~H8の8ハプログループは10以上のハプロタイプを有し、最も一般的なのは保護的ハプログループのH1です。H2~H8のリスクハプロタイプは、大陸の集団間で異なる傾向があります。H2~H8のリスクハプロタイプでは、新型コロナウイルス感染症の遺伝的リスクの確率は8~96%の間となり、大きく異なります。
高リスクのハプログループであるH2・H3・H8は、1個もしくは2個のアレルが異なり、低リスクハプログループであるH5・H6・H7とは異なります。H5・H6・H7は保護的ハプログループであるH1と類似しています。しかし、ネアンデルタール人のハプロタイプとはひじょうに異なるリスクハプログループを有する個体群は、依然として原因となる多様体を有している可能性があります(図1C)。これはとくに、ハプログループH5(リスク確率19%)もしくはH6(リスク確率11%)を有するアフリカ人と、ハプログループH7(リスク確率8%)を有するアジア人に当てはまります。ハプログループH3はリスク確率が最も高く、ヨーロッパ人とアメリカ人において最も一般的なリスクハプログループです(図1B)。
全てのヒトのリスクハプログループは、以前に評価された3個のネアンデルタール人のハプロタイプとは異なります(図1C)。それらは、13個の以前に評価されたネアンデルタール人のアレルのうち最大11個と、19個のヴィンディヤ洞窟ネアンデルタール人のアレルのうち16個を共有します。非現生人類ホモ属(古代型ホモ属)と交雑していない参照現代人ゲノム配列を必要とせず、現代人のゲノムにおける古代型ホモ属系統を検出し、個人水準でのネアンデルタール人から継承した領域を特定する新たな手法であるIBDmixを用いて、30000塩基対以上のヴィンディヤ洞窟ネアンデルタール人から遺伝子移入された配列が得られました。遺伝子移入された配列は、リスクハプログループのH2・H3・H4・H8で65800塩基対のゲノム領域と重複していましたが、最も保護的なホモ接合型のH1ハプログループと、全ての低リスクのH5・H6ハプログループでは、欠けていました。
したがって、全ての高いリスクのハプログループは、ネアンデルタール人から遺伝子移入された領域内に位置し、全てのヒト高リスクハプログループで共有されている、19個のリスク関連アレルのうち3個の欠如は、ネアンデルタール人内の遺伝的多様性により最もよく説明されます。遺伝子移入されたハプロタイプは、評価されたヴィンディヤ洞窟ネアンデルタール人とは異なる、ヴィンディヤ洞窟ネアンデルタール人に似た集団に起源があるようです。これは、非アフリカ系現代人全員の主要な祖先集団と交雑したネアンデルタール人集団が、ヴィンディヤ洞窟ネアンデルタール人と似ているものの、やや異なっていたことを反映しているのでしょう。
アフリカ人では、保護的なH1と低リスクのH5・H6ハプログループが、ほぼ排他的に見られます。それでもアフリカ人集団は、代表となるリスクアレルであるrs11385942と、興味深いことに、2個の保護的なネアンデルタール人型アレルを有しています。したがって、rs11385942が原因となる確率は11%にすぎないことを考えると、この代表となる多様体がアフリカ人に関して、新型コロナウイルス感染症を重篤化するリスクであると誤って分類する可能性は充分あります。これは、代表となる多様体rs35044562を用いた分類と矛盾します。全体的に、リスクであるrs11385942のGA型のアレルを有する個体群を分類すると、477個のハプロタイプはリスクであるとみなされ、これらは原因となるリスクアレルを含む平均確率が82%にすぎません。代わりにrs35044562のメタGWASリスクアレルが分類に用いられた場合、アフリカ人のハプログループであるH5・H6は、リスクであるとみなされるでしょう。リスクと考えられる全体の410個のハプロタイプは、原因となるリスクアレルを含む平均確率が92%です。
アジア東部のハプロタイプの1%のみがリスクハプログループに分類され、それらのいずれも、おもにヨーロッパ人で見られる最大のリスク確率ハプログループであるH3には分類されません。これとは対照的に、アジア南部のリスクハプロタイプ頻度は31%で、全ての大陸の集団では最高となり、これはハプログループH2・H4・H8の優勢の結果です。これらのハプログループには、最高のリスクハプログループであるH3と比較して、それぞれ2%、8%、9%のリスク可能性を減少させる保護的アレルが含まれています。したがって、ほとんどのアジア南部のハプロタイプは、ヨーロッパのハプロタイプよりもリスク確率が低くなります。
以前の研究では、アジア南部とアジア東部の人類集団間の違いを、予期せぬ重要なものとして示し、遺伝的選択の可能性が示唆されました。本論文の分析では、アジア南部のリスクハプログループは遺伝的に多様で、適応の結果かもしれない、と示されます。アジア東部のリスクハプロタイプの枯渇と、アジア南部のハプロタイプ多様性は両方、重度の呼吸器系疾患に関連する病原体への曝露に起因する、と仮定できます。さらに、rs76374459の防御的なG型アレルは、アジア南部で優勢なハプログループであるH2・H4・H7・H8で共有されています。この多様体が原因である場合(2%の確率)、rs11385942もしくはrs3504456は、これらのハプログループを有する個体群を、リスクがある、と誤って分類するでしょう。これはヨーロッパ人にはほとんど当てはまりませんが、ほとんどの非ヨーロッパ人に当てはまります。以下、本論文の図1です。
結論として、新型コロナウイルス感染症のリスクの高低の分類は、この評価がヨーロッパ人のリスク多様体と確率に基づいている場合、とくに代表となる多様体rs11385942を用いると、非ヨーロッパ人集団では間違いがちである、と明らかになりました。したがって、集団間で観察されたリスクハプログループ多様性は、非ヨーロッパ人ではリスク評価を危うくします。この状況は現在、民族を超えたGWASと同様に、メタGWASと、非ヨーロッパ人集団での世界規模のGWASにより改善されています。民族を超えたGWASに関しては、23andMe社による最近のGWASにおいて、本論文で取り上げられた主要な遺伝的リスク要因が複製され、代表となる多様体および20個の多様体の信頼できる組み合わせとして、rs13078854を有しています。
さらに、新型コロナウイルス宿主遺伝学のイニシアチブの最新の、コンピュータシミュレーションによるファインマッピングは、10個のみの信頼できる組み合わせの多様体を示し、その全ては一般的な高リスクハプログループを、一般的な低リスクハプログループと区別し、それはネアンデルタール人の研究で用いられた13個の多様体のうち10個です。したがって、現在進行中のさまざまな遺伝学的研究は、すでに候補となる原因多様体の組み合わせを特定・定量化・限定し、集団遺伝学的観点と組み合わせることで、コンピュータシミュレーションや、たとえば実験的手法のように補完的な手法を用いて、候補一覧を絞り込むのに役立たせています。これらの多様な体系の遺伝学的取り組みは最終的に、新型コロナウイルス感染症重篤化の非環境的変動を説明する、遺伝的原因および対応する分子メカニズムにまとまるでしょう。
参考文献:
Wohlers I. et al.(2020): COVID-19 genetic risk and Neanderthals: A case study highlighting the importance of scrutinizing diversity. bioRxiv.
https://doi.org/10.1101/2020.11.02.365551
一般的に、ゲノム規模関連研究(GWAS)は、遺伝子型を疾患感受性や重症度のような表現型に関連づけますが、その関連づけは因果関係を意味するわけではありません。通常は多くの相関多様体を含むGWASの関連兆候の根底にある原因となる多様体を特定するために、第一段階でいわゆるファインマッピング(ゲノムの機能・場所の精細な識別)が実行されます。最終的には、ファインマッピングの後に実験的検証を行ない、原因となる多様体と仕組みを最終的に特定する必要があります。GWASはコホートデータに基づいていますが、原因となる多様体の代理としての関連する多様体を介して、個人的なリスクを評価できます。このため、コホートの遺伝的連鎖パターンは、個人の遺伝的背景を表す必要があります。しかし、この要件は、とくに非ヨーロッパ系統を有する個体では、しばしば満たされません。世界的な新型コロナウイルス感染症の流行では、これが個人の遺伝的リスク予測を危うくし、以下に示されるように、現在のリスク要因を注意して用いる必要があるかもしれません。
新型コロナウイルス感染症に関して、現時点で唯一の査読誌に掲載されたGWAS論文は、22個の高度に相関したリスク多様体の信頼できる組み合わせを、コンピュータシミュレーションにより示し、その中には代表する多様体であるrs11385942が含まれます。組み合わせると、これらの多様体は原因となる多様体を含む全体的な確率が95%以上となりますが、22個の多様体の原因となる確率は、それぞれ1~11%(中央値は4%)です。この最初の研究は、スペイン人とイタリア人のコホートのメタ分析でした(1610例)。
新型コロナウイルス宿主遺伝学イニシアチブ(COVID-19 Host Genetics Initiative)は、このデータを世界規模のメタGWASに含めました(8638例)。この最新のファインマッピングでは、わずか10個の多様体の信頼できる組み合わせが得られ、これは刊行された22個の信頼できる組み合わせの多様体の下位区分となります。このファインマッピングは、GWASコホート自体の連鎖不平衡情報を利用していません。これは、最初のスペイン人とイタリア人のコホートに適用されています。さらに、たとえば原因となる多様体が全コホートで発生しない場合など、ヨーロッパ人と非ヨーロッパ人との間の違いにより影響を受ける可能性があります。したがって、比較的均質なGWASコホート内のリスクハプロタイプの世界規模の遺伝的多様性は、以下に示されるように、知見の解釈を助け、早期の特定のために、精査されねばなりません。
これら22個のリスク多様体のうち、19個はクロアチアのヴィンディヤ洞窟(Vindija Cave)遺跡で発見された5万年前頃のネアンデルタール人女性(Vindija 33.19)のゲノム(関連記事)において特定可能で、4個は保護的アレル(対立遺伝子)を有しており、それは原因となる多様体を含むリスク可能性が64%となります。欠落多様体が同様にリスクアレルだった場合、この可能性は82%に増加します。最近のネアンデルタール人(Homo neanderthalensis)に関する研究(関連記事)では、この19個のうち13個が取り上げられ、61%の原因となる多様体を含む全体の最大確率が伴います。しかし、2ヶ所は保護的アレルを有するので、以前に評価されたヴィンディヤ洞窟のネアンデルタール人のハプロタイプのリスク確率はわずか52%です。
本論文の結果は、ネアンデルタール人のハプロタイプに基づく以前の研究の評価を補完します。本論文は以前の研究と同様に1000ゲノム計画のデータを用いますが、重要な違いが三つあります。まず、22個全ての新型コロナウイルス感染症関連多様体を組み込んだ、65800塩基対のより大きなゲノム領域内でハプロタイプを調べたことです。原因となる多様体を含む全体的な確率は、これら全てで95%以上です。これにより、以前の分析による61%の確率が大きく増加します。次に、22個の信頼できる組み合わせの多様体の位置のハプロタイプのみが調査されました。つまり、新型コロナウイルス感染症関連のハプロタイプのみです。以前は、全ての多様体の位置を含む全てのハプロタイプが、遺伝子座の包括的な系統樹を得るために用いられ、それは最新の代表となる多様体であるrs35044562を有するハプロタイプが、どのようにネアンデルタール人とクレード(単系統群)を形成するのか、示しました。本論文では、系統関係とは無関係なリスク関連ハプロタイプが特徴づけられました。最後に、以前のハプロタイプに基づく評価は、リスク多様体としてハプロタイプを分類するために、代表となる多様体であるrs35044562のみを用いていましたが、本論文は、リスク多様体の個々の確率を利用します。
1000ゲノム計画のハプロタイプは、H1~H38という38の異なるハプログループに分類されます(図1C)。リスク関連ハプロタイプは、全データセットで10%の総頻度となり、異なる大陸の集団では1~31%の範囲で変動します(図1A)。H1~H8の8ハプログループは10以上のハプロタイプを有し、最も一般的なのは保護的ハプログループのH1です。H2~H8のリスクハプロタイプは、大陸の集団間で異なる傾向があります。H2~H8のリスクハプロタイプでは、新型コロナウイルス感染症の遺伝的リスクの確率は8~96%の間となり、大きく異なります。
高リスクのハプログループであるH2・H3・H8は、1個もしくは2個のアレルが異なり、低リスクハプログループであるH5・H6・H7とは異なります。H5・H6・H7は保護的ハプログループであるH1と類似しています。しかし、ネアンデルタール人のハプロタイプとはひじょうに異なるリスクハプログループを有する個体群は、依然として原因となる多様体を有している可能性があります(図1C)。これはとくに、ハプログループH5(リスク確率19%)もしくはH6(リスク確率11%)を有するアフリカ人と、ハプログループH7(リスク確率8%)を有するアジア人に当てはまります。ハプログループH3はリスク確率が最も高く、ヨーロッパ人とアメリカ人において最も一般的なリスクハプログループです(図1B)。
全てのヒトのリスクハプログループは、以前に評価された3個のネアンデルタール人のハプロタイプとは異なります(図1C)。それらは、13個の以前に評価されたネアンデルタール人のアレルのうち最大11個と、19個のヴィンディヤ洞窟ネアンデルタール人のアレルのうち16個を共有します。非現生人類ホモ属(古代型ホモ属)と交雑していない参照現代人ゲノム配列を必要とせず、現代人のゲノムにおける古代型ホモ属系統を検出し、個人水準でのネアンデルタール人から継承した領域を特定する新たな手法であるIBDmixを用いて、30000塩基対以上のヴィンディヤ洞窟ネアンデルタール人から遺伝子移入された配列が得られました。遺伝子移入された配列は、リスクハプログループのH2・H3・H4・H8で65800塩基対のゲノム領域と重複していましたが、最も保護的なホモ接合型のH1ハプログループと、全ての低リスクのH5・H6ハプログループでは、欠けていました。
したがって、全ての高いリスクのハプログループは、ネアンデルタール人から遺伝子移入された領域内に位置し、全てのヒト高リスクハプログループで共有されている、19個のリスク関連アレルのうち3個の欠如は、ネアンデルタール人内の遺伝的多様性により最もよく説明されます。遺伝子移入されたハプロタイプは、評価されたヴィンディヤ洞窟ネアンデルタール人とは異なる、ヴィンディヤ洞窟ネアンデルタール人に似た集団に起源があるようです。これは、非アフリカ系現代人全員の主要な祖先集団と交雑したネアンデルタール人集団が、ヴィンディヤ洞窟ネアンデルタール人と似ているものの、やや異なっていたことを反映しているのでしょう。
アフリカ人では、保護的なH1と低リスクのH5・H6ハプログループが、ほぼ排他的に見られます。それでもアフリカ人集団は、代表となるリスクアレルであるrs11385942と、興味深いことに、2個の保護的なネアンデルタール人型アレルを有しています。したがって、rs11385942が原因となる確率は11%にすぎないことを考えると、この代表となる多様体がアフリカ人に関して、新型コロナウイルス感染症を重篤化するリスクであると誤って分類する可能性は充分あります。これは、代表となる多様体rs35044562を用いた分類と矛盾します。全体的に、リスクであるrs11385942のGA型のアレルを有する個体群を分類すると、477個のハプロタイプはリスクであるとみなされ、これらは原因となるリスクアレルを含む平均確率が82%にすぎません。代わりにrs35044562のメタGWASリスクアレルが分類に用いられた場合、アフリカ人のハプログループであるH5・H6は、リスクであるとみなされるでしょう。リスクと考えられる全体の410個のハプロタイプは、原因となるリスクアレルを含む平均確率が92%です。
アジア東部のハプロタイプの1%のみがリスクハプログループに分類され、それらのいずれも、おもにヨーロッパ人で見られる最大のリスク確率ハプログループであるH3には分類されません。これとは対照的に、アジア南部のリスクハプロタイプ頻度は31%で、全ての大陸の集団では最高となり、これはハプログループH2・H4・H8の優勢の結果です。これらのハプログループには、最高のリスクハプログループであるH3と比較して、それぞれ2%、8%、9%のリスク可能性を減少させる保護的アレルが含まれています。したがって、ほとんどのアジア南部のハプロタイプは、ヨーロッパのハプロタイプよりもリスク確率が低くなります。
以前の研究では、アジア南部とアジア東部の人類集団間の違いを、予期せぬ重要なものとして示し、遺伝的選択の可能性が示唆されました。本論文の分析では、アジア南部のリスクハプログループは遺伝的に多様で、適応の結果かもしれない、と示されます。アジア東部のリスクハプロタイプの枯渇と、アジア南部のハプロタイプ多様性は両方、重度の呼吸器系疾患に関連する病原体への曝露に起因する、と仮定できます。さらに、rs76374459の防御的なG型アレルは、アジア南部で優勢なハプログループであるH2・H4・H7・H8で共有されています。この多様体が原因である場合(2%の確率)、rs11385942もしくはrs3504456は、これらのハプログループを有する個体群を、リスクがある、と誤って分類するでしょう。これはヨーロッパ人にはほとんど当てはまりませんが、ほとんどの非ヨーロッパ人に当てはまります。以下、本論文の図1です。
結論として、新型コロナウイルス感染症のリスクの高低の分類は、この評価がヨーロッパ人のリスク多様体と確率に基づいている場合、とくに代表となる多様体rs11385942を用いると、非ヨーロッパ人集団では間違いがちである、と明らかになりました。したがって、集団間で観察されたリスクハプログループ多様性は、非ヨーロッパ人ではリスク評価を危うくします。この状況は現在、民族を超えたGWASと同様に、メタGWASと、非ヨーロッパ人集団での世界規模のGWASにより改善されています。民族を超えたGWASに関しては、23andMe社による最近のGWASにおいて、本論文で取り上げられた主要な遺伝的リスク要因が複製され、代表となる多様体および20個の多様体の信頼できる組み合わせとして、rs13078854を有しています。
さらに、新型コロナウイルス宿主遺伝学のイニシアチブの最新の、コンピュータシミュレーションによるファインマッピングは、10個のみの信頼できる組み合わせの多様体を示し、その全ては一般的な高リスクハプログループを、一般的な低リスクハプログループと区別し、それはネアンデルタール人の研究で用いられた13個の多様体のうち10個です。したがって、現在進行中のさまざまな遺伝学的研究は、すでに候補となる原因多様体の組み合わせを特定・定量化・限定し、集団遺伝学的観点と組み合わせることで、コンピュータシミュレーションや、たとえば実験的手法のように補完的な手法を用いて、候補一覧を絞り込むのに役立たせています。これらの多様な体系の遺伝学的取り組みは最終的に、新型コロナウイルス感染症重篤化の非環境的変動を説明する、遺伝的原因および対応する分子メカニズムにまとまるでしょう。
参考文献:
Wohlers I. et al.(2020): COVID-19 genetic risk and Neanderthals: A case study highlighting the importance of scrutinizing diversity. bioRxiv.
https://doi.org/10.1101/2020.11.02.365551
この記事へのコメント