アメリカ合衆国の退役軍人の大規模なゲノムデータ
アメリカ合衆国の退役軍人の大規模なゲノムデータを報告した研究(Verma et al., 2024)が公表されました。日本語の解説記事もあります。GWAS(genome-wide association studies、ゲノム規模関連研究)から得られた調査結果は、疾患の遺伝学的基礎の基本的知識を提供し、予防と治療のための精密な手法を促進してきました。現在のGWASの結果は多様な人口集団の個体群が充分に表されていないことにより制約されており、遺伝子と形質と疾患との間の関係の知識に関する一般化に懸念が生じています。アメリカ合衆国退役軍事省(Veterans Affairs、略してVA)の退役軍人計画(Million Veteran Program、略してMVP)部局は、アメリカ合衆国で最大級の生物銀行の一つで、この需要に対応しており、MVPの29%はアフリカ系(African、略してAFR)や混合アメリカ人(Admixed American、略してAMR)やアジア東部人(East Asian、略してEAS)の参照人口集団で構成されています。635000人以上の登録者および電子健康記録(electronic health record、略してEHR)から得られた詳細な表現型データと関連すると4430万以上の遺伝子型決定された多様体で、MVPには多様な人口集団の遺伝子型と表現型の関連に関する知識の関係を埋める規模と豊富なデータがあります。
MVPのデータを活用して、AFRとAMRとEASとヨーロッパ(European、略してEUR)の参照人口集団との遺伝的類似性に基づく4人口集団における2068個の形質全体で、GWASが実行されました。統計的精細マッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が採用され、推定される原因多様体が浮き彫りになります。この取り組みにより、多様な人口集団内の複雑な形質の遺伝的構造を特徴づけ、人口集団間の遺伝的傾向を比較することが可能となりました。多様体の発見と精細なマッピングの正確さについて、この研究では非EUR人口集団の個体群を含める利点も定量化されました。精細なマッピングは、多面的および異質的両方の関連を浮き彫りにする、人口集団全体の遺伝子と形質の関連の景観をマッピングする関連する遺伝子座における、推定される作動因子遺伝子の指定の基盤を提供しました。
635969人の登録者のうち、1270個の形質にわたって26049個の多様体と形質の関連が特定され、そのうち3477個の関連は、非EUR人口の個体が含まれた場合のみ有意でした。精細なマッピングは936個の形質にわたって57601個の独立した兆候を明らかにし、これらの兆候のうち15045個は単一多様体へと高い信頼性でマッピングされました。人口集団間のアレル(対立遺伝子)頻度の差異と2069点の高い信頼性の兆候と549個数の遺伝子候補から生じた結果は、非EUR集団に固有でした。注目すべきことに、rs76024540にマッピングされた兆候は、EUR人口集団よりもAFR人口集団においてひじょうに一般的な状態である、肥厚性瘢痕(ケロイド)の作動因子遺伝子としてSLC22A18(solute carrier family 22 member 18A、溶質保因者族22構成員18A)/SLC22A18AS(solute carrier family 22 member 18AS、溶質保因者族22構成員18AS)を示唆しました。認知症とのAPOE遺伝子座の関連を除いて、正妻にマッピングされた多様体について、人口集団全体にわたる効果規模異質性の事例はほとんど観察されませんでした。
この研究は、登録者の多様性増加に伴うGWASの検出力増加を強調し、より多い多様体の発見さと、EUR人口集団だけで可能な場合よりも精細なマッピングの正確さを達成しました。本論文の調査結果は、人口集団全体の遺伝的構造における差異よりも類似点が多いことを明らかにしており、ほとんどの違いは人口集団間のアレル頻度の差異に起因します。ただ、この研究の登録者には女性が8%しか含まれず、登録者は概して一般人口と比較して高年齢なので、女性や若年者に特異的な、あるいはそうした集団で多くみられる病態に関する研究に限界があります。しかし、こうした大規模なデータは、治療など「実用的」に大きく貢献できそうなのは当然として、広く人類進化史の解明にも役立ちそうで、その観点からも注目されます。
参考文献:
Verma A. et al.(2024): Diversity and scale: Genetic architecture of 2068 traits in the VA Million Veteran Program. Science, 385, 6706, eadj1182.
https://doi.org/10.1126/science.adj1182
MVPのデータを活用して、AFRとAMRとEASとヨーロッパ(European、略してEUR)の参照人口集団との遺伝的類似性に基づく4人口集団における2068個の形質全体で、GWASが実行されました。統計的精細マッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が採用され、推定される原因多様体が浮き彫りになります。この取り組みにより、多様な人口集団内の複雑な形質の遺伝的構造を特徴づけ、人口集団間の遺伝的傾向を比較することが可能となりました。多様体の発見と精細なマッピングの正確さについて、この研究では非EUR人口集団の個体群を含める利点も定量化されました。精細なマッピングは、多面的および異質的両方の関連を浮き彫りにする、人口集団全体の遺伝子と形質の関連の景観をマッピングする関連する遺伝子座における、推定される作動因子遺伝子の指定の基盤を提供しました。
635969人の登録者のうち、1270個の形質にわたって26049個の多様体と形質の関連が特定され、そのうち3477個の関連は、非EUR人口の個体が含まれた場合のみ有意でした。精細なマッピングは936個の形質にわたって57601個の独立した兆候を明らかにし、これらの兆候のうち15045個は単一多様体へと高い信頼性でマッピングされました。人口集団間のアレル(対立遺伝子)頻度の差異と2069点の高い信頼性の兆候と549個数の遺伝子候補から生じた結果は、非EUR集団に固有でした。注目すべきことに、rs76024540にマッピングされた兆候は、EUR人口集団よりもAFR人口集団においてひじょうに一般的な状態である、肥厚性瘢痕(ケロイド)の作動因子遺伝子としてSLC22A18(solute carrier family 22 member 18A、溶質保因者族22構成員18A)/SLC22A18AS(solute carrier family 22 member 18AS、溶質保因者族22構成員18AS)を示唆しました。認知症とのAPOE遺伝子座の関連を除いて、正妻にマッピングされた多様体について、人口集団全体にわたる効果規模異質性の事例はほとんど観察されませんでした。
この研究は、登録者の多様性増加に伴うGWASの検出力増加を強調し、より多い多様体の発見さと、EUR人口集団だけで可能な場合よりも精細なマッピングの正確さを達成しました。本論文の調査結果は、人口集団全体の遺伝的構造における差異よりも類似点が多いことを明らかにしており、ほとんどの違いは人口集団間のアレル頻度の差異に起因します。ただ、この研究の登録者には女性が8%しか含まれず、登録者は概して一般人口と比較して高年齢なので、女性や若年者に特異的な、あるいはそうした集団で多くみられる病態に関する研究に限界があります。しかし、こうした大規模なデータは、治療など「実用的」に大きく貢献できそうなのは当然として、広く人類進化史の解明にも役立ちそうで、その観点からも注目されます。
参考文献:
Verma A. et al.(2024): Diversity and scale: Genetic architecture of 2068 traits in the VA Million Veteran Program. Science, 385, 6706, eadj1182.
https://doi.org/10.1126/science.adj1182
この記事へのコメント