アフリカ人の包括的なゲノムデータ

 アフリカ人の包括的なゲノムデータを報告した研究(Choudhury et al., 2020)が公表されました。世界規模でのゲノム解析により、現代人で最も遺伝的多様性が高いのはアフリカ人と示されています。こうしたゲノムデータは、医療にも役立てられています。しかし、現在までに、約2000のアフリカの民族言語集団のうちわずかしか遺伝的に特徴づけられておらず、ヨーロッパ集団で一般的な限定的な数の多様体が含まれています。そのため、アフリカ人における新規で医学的に関連する稀な変異はほとんど不明のままで、複雑な疾患への遺伝的要因の理解が進んでいません。

 サハラ砂漠以南のアフリカ人集団は古典的に、アフロ・アジア(AA)、ナイル・サハラ(NS)、バンツー語族を含むニジェール・コンゴ(NC)、コイサン(KS)の各語族で説明されてきました。これらの語族の中には独立した集団も含まれており、たとえばコイとサンは、それぞれ異なる歴史があるにも関わらず、文献ではコイサン一括されています。バンツー語族はサハラ砂漠以南のアフリカでは最も広範に分布していまが、これは過去5000年にわたるアフリカ大陸全体の一連の移住に起因します(関連記事)。

 これらの移住事象とそれに続く在来集団との混合は、新たな環境と経験への適応を伴うので、アフリカのゲノムの全体像の形成においてたいへん重要な役割を果たしてきました。これらの適応の特徴は、マラリアと関連するHBB遺伝子、ラクターゼ(乳糖分解酵素)をコードするLCT遺伝子、肝機能障害と関連するAPOL1遺伝子、グルコース-6-リン酸脱水素酵素(G6PD)と関連するG6PD遺伝子の多様性で示される、重要な生理的特性もしくは伝染性流行病と関連するアレル(対立遺伝子)多様性のパターンにおいて明らかです。最近の研究では、食性・身長・血圧・肌の色といった多様な特徴に対して、混合により導入された新たな変異の重要性を反映する選択の兆候が特定されています。

 現代人で最も遺伝的多様性の高いアフリカ人のゲノムを研究することは、疾患の集団人口統計的理解への特有の機会を提供します。アフリカにおけるヒトの遺伝と健康(H3Africa)協会は、アフリカ人のゲノム研究の不足を補うために創設され、アフリカ人全体の遺伝的多様性を特徴づけ、ゲノム研究の枠組みを促進することが目的です。そこで本論文では、H3アフリカ研究においてアフリカの13ヶ国の50の民族言語集団から得られた、426人の全ゲノム配列データ(314人分の平均網羅率が30倍の高品質なゲノムデータと、112人分の平均網羅率が10倍の中程度の品質のゲノムデータ)が分析されました。これらの集団のいくつかは、本論文で初めて研究結果が報告されます。本論文では、一塩基多様体(SNV)に焦点が当てられました。以下、本論文で取り上げられた集団の地理(図1a)と主成分分析結果(図1b)を示した本論文の図1です。
画像


●移住と混合

 これまで充分に研究されていなかった地域からの標本を含めることで、アフリカの集団規模のゲノムデータが得られました。主成分分析では、第一主成分は、ナイル・サハラ(NS)とアフロ・アジア(AA)とある程度は東部のニジェール・コンゴ(NC)個体群(ウガンダのバンツー語族個体群、略してUBS)を、他のNC話者から分離します。第二主成分は、残りのNC話者を西方から南方への勾配に沿って位置づけます。非NC話者集団をいくつか含むマリの個体群(MAL)は顕著な例外で、個人間のより多くの分散を示します。ベニンのフォン(FNB)、グル語話者(WGR)、ギニアのスス語話者(SSG)、コートジボワール人(CIV)、MALを含むアフリカ西部集団は近くに位置づけられますが、しばしばナイジェリアのヨルバ人(YRI)やエサン人(ESN)のような他のアフリカ西部NC話者からは独立しています。ウガンダのバンツー語族個体群(UBS)および南部のボツワナ(BOT)のNC話者は、それぞれの地域から以前に研究された集団とクラスタ化します。

 ナイジェリアのベロム(Berom)集団(BRN)、カメルーンの個体群(CAM)、コンゴ民主共和国の個体群(DRC)、ザンビアのバンツー語族話者(BSZ)、ウガンダのNS話者(UNS)の5集団は、主成分分析で特徴的な位置を示します。BRNは他のアフリカ西部集団とは独立して存在し、アフリカ東部集団に近づいています。CAMとDRCはカメルーンとコンゴの地理的近さと一致して、一まとまりに位置し、独立したアフリカ中央西部集団を形成します。UNSは他のNS集団であるグムズ(Gumuz)とは独立して位置します。同様に、BSZは他のNS話者集団とは大きく離れています。これらの集団のいくつかは独特の遺伝的位置を示し、標本抽出された集団の広範なゲノム多様性が確認されます。NC話者集団の地理的距離と遺伝的距離との間には有意な正の相関が観察されました。

 次に、非NC話者からの遺伝子流動が本論文の対象集団を区分したのかどうか、さらには混合事象が検証されました。結果は、アフリカ大陸全体の混合パターンに関する現在の理解と一致しており、ボツワナ(BOT)へのコイサン(KS)の遺伝子流動、UBSにおけるアフロ・アジア(AA)語族集団の遺伝子流動、アフリカ中央西部集団であるDRCとCAMにおける熱帯雨林狩猟採集民(RFF)からの様々な程度の遺伝子流動を示します。さらに、これらの分析では、2回の興味深く未報告の混合事象も明らかになりました。それは、ウガンダのNS話者(UNS)におけるRFFの遺伝子流動と、ナイジェリアのベロム集団(BRN)におけるNC話者からの遺伝子流動です。追加の母集団データセットを用いたさらなる分析では、UNSと他のNC話者集団との間の違いは、AAとの混合の欠如、およびRFFからの遺伝子流動の増加に起因するかもしれない、と示唆されました。アフリカ東部系統の追跡は、過去数千年のサヘル横断移動に由来し、ナイジェリアのハウサ(Hausa)人を含む他の集団で報告されてきました。しかし、アフリカ東部の遺伝子流動の観察は、おそらくチャドに由来し、最大となる在来の中央部ナイジェリア集団であるBRNにおいてひじょうに独特です。

 ボツワナの分析から、集団間の遺伝的距離への非NCの遺伝子流動の寄与が強調されます。対照的に、ザンビアのバンツー語族話者(BSZ)は、アンゴラやコンゴやボツワナの隣接地域集団とは異なり、RFFもしくはKS集団のような非NC話者からの主要な遺伝子流動の証拠を示しません。同様に、在来集団の混合の低水準は、マラウイとモザンビークのバンツー語族話者で指摘されてきました。アフリカ中央部を横断するバンツー語族集団の移動経路復元の試みでは、アンゴラ集団がアフリカ東部および南部のバンツー語族話者にとっての最良の起源地と結論づけられ、アンゴラ経由のバンツー語族の移動の西方経路が示唆されました(関連記事)。

 データセットにDRCとBSZ集団を含めることで、この経路がさらに調査されました(図2b)。主成分分析と同祖対立遺伝子(identity-by-descent、略してIBD。かつて共通祖先を有していた2個体のDNAの一部が同一であることを示します。IBD領域の長さは2個体が共通祖先を有していた期間に依存し、たとえばキョウダイよりもハトコの方が短くなります)から、BSZは他のアフリカ中央部集団と比較して、UBSとBOTの両方に遺伝的に近い、と示されました。さらに混合の検証では、アフリカ東部および南部のバンツー語族話者系統にとって最も可能性が高いアフリカ中央部起源集団として、BSZを支持します。また、集団間で共有されるIBDの程度から、BSZにとってアンゴラ集団が最も密接な中央部もしくは中央西部の集団だった、と示唆されます。まとめると、これらの推定から、ザンビアがバンツー語族のアフリカ東部および南部両方への経路の中継地点だった、と示唆されます。

 いくつかの主要な混合事象を推定する試みでは、アフリカ南部におけるKSの遺伝子流動と、CAMにおけるRFFの遺伝子流動は以前の研究とほぼ一致した、と示されました。UNS におけるRFFの混合の年代範囲は、CAMにおけるそれと類似しており、以前の研究と一致します。これは、60~70世代前頃に、中央部熱帯雨林の東西両方のRFF集団の範囲が変化した可能性を示唆します。アフリカ西部へのサヘル横断移動に関する以前の研究では、移動の異なる2波が示唆されました。一方は100世代以上前(2900年前頃)で、もう一方はもっと最近となる過去35世代(1015年前頃)です。さまざまなアフリカ東部の代理集団に基づくと、BRNにおける混合は50~70世代前(1500~2000年前頃)に起きた、と推定されます。これらの年代は、地域水準もしくはより広範な地理的規模で、これまで知られていない人口統計学的事象が起きたことを示唆します。

 ボツワナとカメルーンとマリの定義された地政学的境界と、非NC話者集団をいくつか含むマリの個体群(MAL)間のホモ接合性の明確に長い断片の内部で、民族言語集団内もしくは集団間の広範な変異のような、これらの集団のいくつかの人口史における追加の特有の傾向が観察されました。片親からの単系統遺伝となるミトコンドリアとY染色体の分析では、BOTのミトコンドリアDNA(mtDNA)ハプログループ(mtHg)L0dや、BRN のmtHg-L3や、MALのY染色体ハプログループ(YHg)E1b1bといった、特定の優占するHgが特定され、これらの集団への複雑な祖先の寄与がさらに強調されます。以下、各集団の系統混合比(図2a)と、バンツー語族集団の移動経路(図2b)と、主要な混合事象の年代(図2c)を示した本論文の図2です。
画像


●ゲノム多様性と選択の痕跡

 一塩基多様体(SNV)は標本規模と相関し、集団ごとに1200万~2000万のSNVが特定されました。合計で約340万のSNVはこれまで報告されていませんでした。新規SNVは、カメルーンの個体群(CAM)で最も少なく、ボツワナ(BOT)と非NC話者集団をいくつか含むマリの個体群(MAL)で最も多い(絶対数でも標本抽出された個体の最も少ない数に正規化した場合でも)、と明らかになりました。

 データセット内の新規多様体が飽和しているのか判断するため、BOTを開始母集団として用いて、発見された新規多様体の累積数を配置していき、追加の集団ごとに1標本でしか確認されていない(シングルトン)新規SNVを削除した後でも平坦域には達せず、最後の2集団(FNBとMAL)間でも依然として6000以上の新規SNVが存在しました。また、本論文の対象集団、とくにコイサン(KS)系統間では、多様体の発見と非中央西部アフリカ人系統の割合の間で、強い相関があることも明らかになりました。

 選択を受けたと推定される遺伝子は、C5AR1やMYH10(細菌感染)、ARHGEF1やERCC2やTRAF2(ウイルス感染)、IFNGR2(細菌およびウイルス感染)といった、免疫関連機能とおもに関わっています。BOTを代理とする、アフリカ南部、CAMを代理とするアフリカ中央部、グル語話者(WGR)を代理とするアフリカ西部の各集団に固有の選択に関しては、BOTでは代謝関連(MRAP2とARSKとGPD2)、WGR(C12orf65とFAN1)とCAM(FZR1とTDP1とKCTD1)ではDNA修復関連の遺伝子で見つかりました。BOTにおける選択の痕跡では、KSからの優先的な遺伝子流動の証拠が見つかりました。

 本論文のデータセットで観察された複雑な集団構造と可変的な選択圧は、集団間のアレル(対立遺伝子)頻度の分化を促進する、と知られています。そこで、集団間でかなり異なる(40%以上)アレル頻度を有する、高度に分化した多様体(HDV)が特定されました。2497のHDVのうち1106がBOT(アフリカ南部)とMAL(アフリカ北西部)で観察され、この地理的分離は最も異なるアレル頻度を生成します。これらのHDVのうちいくつかは、BOTにおける高い割合と歴史的により深いKS系統も繁栄しています。

 機能喪失(LOF)多様体では、インフルエンザやヒト免疫不全ウイルス(HIV)やC型肝炎ウイルス(HCV)の死亡率との相関が観察され、環境および社会経済的要因とともに、遺伝的影響が推定されます。病原性もしくは病原性の可能性がある262の固有の多様体のうち、54は低いアレル頻度を示します。マラリアによる死亡を防ぐ遺伝子座の予想と一致して、G6PDのアレルの推定値は、アフリカ全体の固有のマラリアの分布と概ね一致します。鎌状赤血球症の変異は、マラリアが蔓延するアフリカ西部および東部の集団において高いアレル頻度を示します。全体的に、62の遺伝子とその周辺領域で自然選択の新たな証拠が見つかりました。


●まとめ

 本論文の結果は、バンツー語族を含むニジェール・コンゴ(NC)話者集団の遺伝的連続を明らかにし、バンツー語族移動の経路と年代と範囲に関する理解を拡張します。本論文で提案されたバンツー語族の拡散経路は、カルンドゥ(Kalundu)土器伝統の拡大と重なり、これもバンツー語族の拡大と関連づけられてきました。しかし、カルンドゥ土器の拡大の推定年代は、本論文の混合年代に先行し、カルンドゥ土器伝統とバンツー語族の移動との間の関連は疑問視されており、考古学的な移動と遺伝的な移動との間の類似は未解決のままです。あるいは、先に文化的拡散が起き、その後で人類集団の移動が伴ったのかもしれませんし、推定混合年代が実際よりも新しいのかもしれません。

 ナイジェリアの言語はひじょうに多様で、ゲノムデータの観点でもアフリカの最も代表的な国です。ベロムにおけるかなりのナイル・サハラ(NS)集団との混合と、NCおよび非NC両方の話者における高度に分化した多様体(HDV)と新規変異両方との観察から、既知の刊行データベースにおけるナイジェリア集団は、ナイジェリアのゲノム多様性を過小評価している可能性が高いだけではなく、ほぼ確実にアフリカ大陸集団の貧弱な一般的代理である、と示唆されます。アフリカ全体の多様性のより包括的な要約の提供には、複数のアフリカ人集団における追加の深い配列が必要です。

 HIVやエボラ熱やラッサ熱を含むウイルスの流行がアフリカ全土で報告されています。この背景として、ウイルス感染に重要な遺伝子と重複する選択された遺伝子座の観察は、アフリカ全土の人類集団のゲノム形成における、ウイルス感染に対する耐性および/もしくは感受性の、まだ報告されていない役割の可能性を裏づけます。これは、インフルエンザとHIVに関わる遺伝子の推定LOF多様体と、疾患死亡率との強い相関関係により支持されましたが、疾患死亡率との相関についてはさらなる分析が必要です。免疫関連遺伝子の他に、DNA修復や炭水化物および脂質代謝に関連する遺伝子の正の選択、またNC話者内の地域固有の正の選択も観察されました。

 アフリカ人のゲノムの多様性と変異に対する祖先の事象と感染性病原体への暴露の複合効果は、ウガンダのバンツー語族個体群(UBS)とNS話者(UNS)との間で観察されたアレル頻度の違いにより示されます。このアレル頻度の違いから、マラリアが流行している西部地域(UBS)からではなく、マラリアがあまり一般的ではない北部地域(UNS)からの最近の移住が別の妥当な説明になる、と示唆されます。他のアレルからも、同様の想定が可能です。

 本論文の知見から、アフリカのゲノムデータの充足と使用には、多様体の高水準の精選に加えて、広く確認されて包括的な変異の概要が必要である、と示唆されます。アフリカのゲノム変異は、アフリカ人の移住と世界集団両方の多様体分布より良い表示である可能性が高く、したがって、アフリカ人のゲノム変異の完全な目録は、医療遺伝学および集団遺伝学の両方により良いゲノム参照を提供できるかもしれません。アフリカ現代人のゲノム研究が進めば、近年になってアフリカでも進展した古代DNA研究(関連記事)とともに、アフリカ人の人口史をさらに正確に理解できるようになるでしょう。以下は『ネイチャー』の日本語サイトからの引用(引用1および引用2)です。


遺伝学:アフリカ人集団における遺伝的多様性

 高深度塩基配列解読されたアフリカ人ゲノムの、これまでで最大級の研究から、300万を超える遺伝的バリアントが発見されたことを報告する論文が、今週、Nature に掲載される。今回の研究は、バントゥー諸語話者集団のルートに沿った古代人の移動に関する知見をもたらした。

 アフリカは現生人類の起源において中心的な役割を果たしているにもかかわらず、アフリカ人集団に見られる多様性については、これまでほとんど知られていなかった。今回、H3アフリカコンソーシアムのZané Lombardたちは、これまでに試料採取されていなかった集団を含む50の民族言語集団に属する426人の全ゲノム塩基配列解読解析を行うことで、この不均衡の問題に取り組み、アフリカ全体のゲノム多様性の幅を探った。今回新たに発見されたバリアントの大部分は、今回新たに試料採取された民族言語集団から見つかっている。また、ウイルス免疫、DNA修復、代謝に関連する62の遺伝子とその周辺領域での自然選択の新たな証拠が見いだされた。さらに、祖先集団内および祖先集団間での混合に複雑なパターンが見られ、バントゥー諸語話者集団の拡大ルートに沿って移動した入植者の中継地点がザンビアであった可能性が高いことを示す証拠も見つかった。以上の知見は、アフリカ大陸内の人類の移動に関する理解を深めるものであり、ヒトの疾患に対する応答と遺伝子流動が、集団の多様性の強い決定要因であることを明らかにした。

 Lombardたちは、人類の祖先をより包括的に理解し、健康研究を向上させるためには、アフリカ人のゲノム多様性に関する特徴解明の幅を広げること(対象者と対象集団を増やすことなど)が必要だと強調している。


進化遺伝学:高深度のアフリカ人ゲノムから得られたヒトの移動と健康についての情報

Cover Story:アフリカの多様性:全ゲノム解析によって明らかになったアフリカの豊かな遺伝的遺産の詳細

 アフリカは、現生人類のゆりかごと見なされているが、アフリカの人々の遺伝的多様性はごく一部しか調べられていない。今回H3アフリカコンソーシアムのZ Lombard、A Adeyemo、N Hanchardたちは、50の民族言語グループをカバーする426人の全ゲノム塩基配列解読の解析結果を提示して、この不均衡の是正を促している。著者たちは、300万を超える新規バリアント(その大半が、これまで試料採取されていなかった集団で見られた)を明らかにするとともに、ウイルス免疫、DNA修復、代謝に関連するこれまで報告されていなかった62の座位を特定した。さらに著者たちは、集団内と集団間での祖先の混合も発見し、バントゥー諸語話者集団の拡散経路においてザンビアが中継地点であった可能性が高いことを示す証拠を見いだした。これらの知見は、アフリカ全体における人類の移動に関する理解を深めるのに役立つとともに、遺伝子流動と疾患への応答が、集団のゲノムレベルの多様性の強力な駆動要因であることを明らかにしている。表紙は、今回の研究で集められた遺伝子データを基に、ジンバブエのマリーゴールド・ビーズ飾り協同組合が手織りで作ったビーズのネックレスである。



参考文献:
Choudhury A. et al.(2020): High-depth African genomes inform human migration and health. Nature, 586, 7831, 741–748.
https://doi.org/10.1038/s41586-020-2859-7

この記事へのコメント

この記事へのトラックバック