藤本明洋「全ゲノムシークエンスによる人類遺伝学 ヒトゲノムの変異と多様性」
井原泰雄、梅﨑昌裕、米田穣編『人間の本質にせまる科学 自然人類学の挑戦』所収の論文です。本論文は、近年発展の著しい塩基配列決定(シークエンス)の技術的側面に触れつつ、疾患の危険性や表現型の個人差に関わるヒトゲノムの変異や多型の全体像を解説しています。ゲノムの変異や多型は塩基配列の違いで、さまざまな種類があります。一塩基多様体(Single Nucleotide Variant、略してSNV)は変異の中で最も数が多く、検出が比較的容易です。同一のSNVを有する個体が集団中にある程度割合で存在する場合には、一塩基多型(Single Nucleotide Polymorphism、略してSNP)とも呼ばれます。挿入・欠失は、50塩基対未満の塩基配列の長さの違いです。タンパク質コード領域に生じた挿入・欠失は、タンパク質の構造に大きな影響を与える場合があります。マイクロサテライトは、1~6塩基を単位とする繰り返しです。マイクロサテライトはSNVと比較して違いのパターンが多いため、個人差を効率的に調べられます。構造異常は50塩基対以上の挿入・欠失、逆位(塩基配列の逆転)、染色体転座(異なる染色体の融合)、コピー数多型・変異(DNA量の増減)などです。構造異常は、SNVや挿入・欠失よりも遺伝子の機能に与える影響が大きい、と考えられています。トランスポゾンはゲノム上の異なる領域に移動できるDNA配列で、その挿入はほぼ無作為に起き、機能的変化を引き起こすことは少ない、と考えられています。その他には、染色体末端の繰り返し配列であるテロメアの長さの加齢による減少などがあります。
塩基対列決定では、長い間おもにサンガーシークエンス法が用いられてきました。これは、DNA合成を停止させる塩基を一部混合した反応液の使用により、決定したDNA分枝のDNA合成を途中で止め、合成が停止した部分の塩基の種類の読み取りにより、塩基配列を1塩基ずつ決定する方法です。この方法により、一度に500~800塩基対程度を読み取れます。2000年代後半になり、大量の塩基配列を一度に多数同時に(超並列で)決定できる塩基配列決定技術(次世代シークエンサー)が利用可能になりました。これは、DNA分子をガラス板上に固定し、塩基配列を蛍光で1文字ずつ決定していく方法です。この方法では、読み取り長は短い(100~300塩基対)ものの、一度に大量の配列データを得られます。現在では、ヒトゲノム1人分のデータを数日間にて約10蔓延で得られます。これにより、全ゲノム塩基配列決定が可能となり、ヒトゲノム多様性や癌ゲノムの研究が著しく発展しました。こうして生命科学のデータ量が増大し、手作業での解析は不可能になり、コンピュータの利用が必要になりました。コンピュータを用いた生命科学研究は、生物情報学(バイオインフォマティクス)と総称されます。ただ、次世代シークエンサーによる全ゲノム塩基配列決定にはエラーが含まれると考えられ、参照ゲノム配列に対いるマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が行なわれます。
進化というか子孫に関わる変異は、生殖細胞内で起きます。次世代シークエンサーで大量のゲノムデータを得られるようになったことで、仮定を用いて推定されていた変異率の実測が可能になりました。ヒトの変異率は、平均で1世代あたり1.2×10⁻⁸程度(全ゲノムで1世代あたり約60個の変異)と推定されました。変異の約75%は男性で生じ、変異率は父親の年齢と正に相関し、父親の年齢が16.5歳上昇するごとに倍になる、と明らかになりました。つまり、世代当たりの変異率は世代時間に依存します。母親の場合、年齢に関係なく15個程度の変異が生じていました。変異の多くはSNVでした。変異の一因として、ダイオキシンの血中濃度が示唆されています。一方、体細胞変異については、どの組織でも年齢と相関し、1年当たり40個の変異が生じている、と明らかになりました。つまり、1個体の細胞のゲノムには違いが生じている、というわけです。
全ゲノム塩基配列決定により、集団の遺伝的多様性についても全体像が明らかになりつつあります。ヒトゲノムには1人当たり、SNVが350万個、挿入・欠失が45万個、構造異常が1万個、マイクロサテライトの挿入・欠失が10万個あると推定されていますが、この数は集団により異なり、解析法の改良によって修正される可能性があります。集団遺伝学では、集団の遺伝的多様性の程度(数やアレル頻度)は集団規模に依存する、と予測されています。遺伝的多様性の集団比較の結果、アフリカ集団はアジア集団およびヨーロッパ集団と比較して遺伝的多様性が高い、と明らかになりました。これは、現生人類(Homo sapiens)がアフリカ集団起源とする説と整合的です(アフリカ集団の一部がアジアおよびヨーロッパ集団の祖先になりました)。
今後の課題として、遺伝の関与が強く示唆される疾患でも原因となる変異が見つからない場合も多いため、ゲノム解析法の改良が挙げられます。また、次世代シークエンサーは費用もエラー率も低いものの、読み取り長が短いため、ヒトゲノムに多い繰り返し配列を解析できない場合もあります。さらに、データ解析が参照ゲノム配列に依存するため、参照ゲノム配列で抜けている領域や大きく異なる領域の解析は不得意です。近年利用可能になった長鎖シークエンス法は、エラー率が高いものの、読み取り長が長く繰り返し配列の解析に有効と考えられるため、次世代シークエンサーの弱点を補う技術と期待されています。
参考文献:
藤本明洋(2021)「全ゲノムシークエンスによる人類遺伝学 ヒトゲノムの変異と多様性」井原泰雄、梅﨑昌裕、米田穣編『人間の本質にせまる科学 自然人類学の挑戦』(東京大学出版会)第6章P94-108
塩基対列決定では、長い間おもにサンガーシークエンス法が用いられてきました。これは、DNA合成を停止させる塩基を一部混合した反応液の使用により、決定したDNA分枝のDNA合成を途中で止め、合成が停止した部分の塩基の種類の読み取りにより、塩基配列を1塩基ずつ決定する方法です。この方法により、一度に500~800塩基対程度を読み取れます。2000年代後半になり、大量の塩基配列を一度に多数同時に(超並列で)決定できる塩基配列決定技術(次世代シークエンサー)が利用可能になりました。これは、DNA分子をガラス板上に固定し、塩基配列を蛍光で1文字ずつ決定していく方法です。この方法では、読み取り長は短い(100~300塩基対)ものの、一度に大量の配列データを得られます。現在では、ヒトゲノム1人分のデータを数日間にて約10蔓延で得られます。これにより、全ゲノム塩基配列決定が可能となり、ヒトゲノム多様性や癌ゲノムの研究が著しく発展しました。こうして生命科学のデータ量が増大し、手作業での解析は不可能になり、コンピュータの利用が必要になりました。コンピュータを用いた生命科学研究は、生物情報学(バイオインフォマティクス)と総称されます。ただ、次世代シークエンサーによる全ゲノム塩基配列決定にはエラーが含まれると考えられ、参照ゲノム配列に対いるマッピング(多少の違いを許容しつつ、ヒトゲノム配列内の類似性が高い処理を同定する情報処理)が行なわれます。
進化というか子孫に関わる変異は、生殖細胞内で起きます。次世代シークエンサーで大量のゲノムデータを得られるようになったことで、仮定を用いて推定されていた変異率の実測が可能になりました。ヒトの変異率は、平均で1世代あたり1.2×10⁻⁸程度(全ゲノムで1世代あたり約60個の変異)と推定されました。変異の約75%は男性で生じ、変異率は父親の年齢と正に相関し、父親の年齢が16.5歳上昇するごとに倍になる、と明らかになりました。つまり、世代当たりの変異率は世代時間に依存します。母親の場合、年齢に関係なく15個程度の変異が生じていました。変異の多くはSNVでした。変異の一因として、ダイオキシンの血中濃度が示唆されています。一方、体細胞変異については、どの組織でも年齢と相関し、1年当たり40個の変異が生じている、と明らかになりました。つまり、1個体の細胞のゲノムには違いが生じている、というわけです。
全ゲノム塩基配列決定により、集団の遺伝的多様性についても全体像が明らかになりつつあります。ヒトゲノムには1人当たり、SNVが350万個、挿入・欠失が45万個、構造異常が1万個、マイクロサテライトの挿入・欠失が10万個あると推定されていますが、この数は集団により異なり、解析法の改良によって修正される可能性があります。集団遺伝学では、集団の遺伝的多様性の程度(数やアレル頻度)は集団規模に依存する、と予測されています。遺伝的多様性の集団比較の結果、アフリカ集団はアジア集団およびヨーロッパ集団と比較して遺伝的多様性が高い、と明らかになりました。これは、現生人類(Homo sapiens)がアフリカ集団起源とする説と整合的です(アフリカ集団の一部がアジアおよびヨーロッパ集団の祖先になりました)。
今後の課題として、遺伝の関与が強く示唆される疾患でも原因となる変異が見つからない場合も多いため、ゲノム解析法の改良が挙げられます。また、次世代シークエンサーは費用もエラー率も低いものの、読み取り長が短いため、ヒトゲノムに多い繰り返し配列を解析できない場合もあります。さらに、データ解析が参照ゲノム配列に依存するため、参照ゲノム配列で抜けている領域や大きく異なる領域の解析は不得意です。近年利用可能になった長鎖シークエンス法は、エラー率が高いものの、読み取り長が長く繰り返し配列の解析に有効と考えられるため、次世代シークエンサーの弱点を補う技術と期待されています。
参考文献:
藤本明洋(2021)「全ゲノムシークエンスによる人類遺伝学 ヒトゲノムの変異と多様性」井原泰雄、梅﨑昌裕、米田穣編『人間の本質にせまる科学 自然人類学の挑戦』(東京大学出版会)第6章P94-108
この記事へのコメント