ヒトゲノムの多様体を用いたゲノム変異制約図

 取り上げるのがたいへん遅れてしまいましたが、ヒトゲノムの多様体を用いたゲノム変異制約図に関する研究(Chen et al., 2024)が公表されました。純化自然選択によって引き起こされる、破壊的な多様体の減少(制約)は、ヒト疾患の根底にあるタンパク質コード遺伝子の研究に広く用いられてきましたが、タンパク質非コード領域に関して制約を評価しようとする試みはより困難と分かっています。この研究は、オープンアクセスのヒトゲノムアレル(対立遺伝子)頻度参照データセットとして最大のものである、ゲノム集積データベース(gnomAD:Genome Aggregation Database)から76156例のヒトゲノムのデータセットを集積・処理して公開し、これを用いて全ゲノムのゲノム制約図「Gnocchi(genomic non-coding constraint of haploinsufficient variation)」を作製しました。

 本論文は、局所的な塩基配列の状況とゲノムの領域的な特徴を組み合わせて、多様体の減少を検出する、改良された変異モデルを提示します。予想された通り、タンパク質コード配列の平均的制約は、非コード領域のものより強くなっていました。非コードゲノム内では、制約領域に既知の調節エレメントとヒトの複雑な疾患や形質に関与する多様体が多く見られ、これによって、生物学的アノテーション(注釈付け)、疾患の関連付け、自然選択の三角測量による非コードDNA解析が促進されました。より強く制約された調節エレメントはより強く制約されたタンパク質コード遺伝子を調節する傾向があることから、従来の遺伝子制約の指標ではまだ認識されていない制約遺伝子の特定に、非コード領域の制約が役立ち得る、と示唆されます。本論文は、このゲノム規模の制約図によって、ヒト遺伝子の機能的多様体の特定と解釈が改善することを実証します。人類進化研究への応用という点でも、本論文は注目されます。以下は『ネイチャー』の日本語サイトからの引用です。


ヒト遺伝学:7万6156例のヒトゲノムのバリアントを用いたゲノム変異制約マップ

ヒト遺伝学:非コード領域を含むヒトゲノムの変異制約マップ

 ゲノム集積データベースであるgnomADの最新版にはヒトゲノム7万6156例のデータセットが含まれている。今回、そのデータを用いて、タンパク質非コード領域を含む全ゲノムのゲノム制約マップが作製された。



参考文献:
Chen S. et al.(2024): A genomic mutational constraint map using variation in 76,156 human genomes. Nature, 625, 7993, 92–100.
https://doi.org/10.1038/s41586-023-06045-0

この記事へのコメント