集団遺伝学と医学における「祖先系統」理解の問題

 集団遺伝学と医学における「祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)」の理解の問題点を指摘し、その改善を提起した見解(Lewis et al., 2022)が公表されました。日本語の解説記事もあります。明白な健康格差は、「人種」と健康との関連性について議論を活性化させ、その中には、「人種」は健康および生物医学においてどのように変数として用いるべきで、また用いるべきでないのか、といったものも含まれます。人種が生物学的変数として扱われてきた長い歴史の後には、人種分類は歴史的に偶発的な社会的・経済的・政治的過程の産物だった、という広範な合意があります。

 したがって、多くの学会は、人種と「人種主義(人種差別、racism)」の使用を再検討し、今後の「人種」の使用についての意図を述べてきました。一般的な提案の一つは、人種の代わりとして遺伝学的概念、とくに遺伝学的祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)と人口集団(population)という分類を用いることです。しかし、祖先系統という分類の使用には技術的限界があり、ヒトの遺伝学的多様性と人口史を適切に把握できず、遺伝学的祖先系統という分類をその代わりに認めることにより、人種の最も問題のある側面の一つである、生物学との本質的な関連を保持する危険性があります。

 人種区別の過程は、表現型に基づく識別の動的な認知過程を伴いますが、これは多くの場合、文脈に大きく依存します。諸研究は、肌の色素沈着や髪の質感など人類分類の割り当てに歴史的に用いられてきた表現型と関連する遺伝的変異を見つけてきましたが、そうした遺伝学的相関は、人種的に定義された集団と対応する方法で分布していない場合があります。人種は生物学的構成物ではなく、社会政治的構成物です。たとえばアメリカ合衆国において、ヨーロッパ南部および東部からの移民が人口調査で「白人」として分類され始めたのは20世紀になってからで、アメリカ大陸先住民の人口調査の分類は、植民化の歴史と連邦政府の政策を反映しています。そのため、社会科学者や他の人々は、人種使用の最も強力な事例は、生物学的なあらゆるものの代用としてではなく、健康上の結果への人種の影響の追跡に限定されている、と主張します。

 人種使用の主要な代替案の一つである遺伝学的祖先系統は、統計および集団遺伝学者や疫学者や公衆衛生従事者や医師や患者と関連しています。とくに遺伝学的祖先系統は、遺伝学的技術の臨床応用との関連性を新たにしました。それは、遺伝学的危険性得点の精度が祖先系統により異なるからです。遺伝学的祖先系統と人口集団の分類は一般人とも関連しており、消費者企業から祖先系統の報告に支払った何千万もの人々により明らかです。これら異なる分野全体で、遺伝学的祖先系統の支配的な記述は意味のある分類として大陸と関連しています。遺伝学的研究内では、大陸祖先系統という分類は集団分類表示の最も一般的な種類となりました。同様に、消費者遺伝学的製品は、1個体がその「祖先系統」をたどれるこれら大陸集団の割合に基づくデータとともに、報告を顧客に提供します。

 人種分類の体系は大陸を意味のある集団境界として歴史的にみなしてきたので、人種分類と大陸祖先系統分類とがしばしば混同されることは、驚くべきではありません。大陸祖先系統分類が使用される場合はいつでも、生物学的属性としての人種の誤解が裏口から再び入る危険性は高くなります。大陸規模の分類や遺伝学的祖先系統や人種集団についての不充分で微妙な判断は、三つの融合につながる可能性があります。


●祖先系統の平板化概念

 現代人の遺伝学的祖先系統は、祖先から継承しているゲノムの範囲により定義されます。遺伝学者は、祖先組換え図(ARG)として知られるこの概念を有しています。簡単に言うと、個体の遺伝学的祖先系統は、特定の祖先から継承されたヒト家系図を通る経路の部分集合です。ほとんどの場合、遺伝学者は同時に複数個体のARGを研究します。

 重要なことにこの定義は、遺伝学的祖先系統の定義に必要ではない二つのことがある、と明らかにします。一つ目は、人口集団もしくは集団による分類です。二つ目は、たとえば個体群を地理的もしくは文化的情報で分類することによる、系図的つながりから離れた個体群の文脈化です。しかし、祖先系統の推定や報告に関する現在の慣行はほぼ常に分類を課し、その場合、個体群を文脈化するたった一つの方法に初期化されることがひじょうに多くなります。どちらの慣行も、ヒトの遺伝学的差異についての研究者の主張の正確性と信頼性を制約します。

 遺伝学とゲノム科学の亜領域にまたがる多くの統計的方法論があり、その成果は「遺伝学的祖先系統」として組み立てられ、そのほとんどはARGと遺伝学的類似性だけを把握するそのいくつかに近接しようとはしません。これらの手法の大半は、個体を個別の分類の混合として分類するかモデル化することを含みます。その他の場合、分類は分析から明らかになります。これらの場合、結果として得られる分類は分析に含まれる個体群にひじょうに敏感なだけではなく、共有された祖先系統を表していないかもしれません。その他の場合、分類とその表示は下流分析で課されます。

 分類の使用に関する懸念は、これらの技術的限界を超えています。遺伝学的祖先系統に分類を課すことは、ヒトの遺伝学的多様性と、人口史について現代人が知っていることを的確に把握できません。遺伝的類似性のパターンを視覚化する標準的方法は、遺伝学的変異データの主成分分析(PCA)の図示結果によることで、これはそのデータの次元を削減する技術です。ほとんどの遺伝学的分析は、研究データを文脈化するため、参照人口集団のデータを用います。最も一般的に用いられる参照データは、世界中に広がっている数十の場所から標本抽出された個体群により作成されました。これらの人口集団の個体群がこの方法で図視される場合、ほぼ大陸分類を表す明確なクラスタ(まとまり)が可視化されます(図1)。顕著な初期の結果は、標本抽出された個体の祖父母4人の場所を確認すると、遺伝学的祖先系統は大陸起源と強く一致する、ということです。

 しかし、新たに組み立てられたデータセットが示すのは、人々がニューヨーク市の住民などさまざまに標本抽出される場合、明確なクラスタの構造のこの観点がいかに悪化するのか、ということです(図1)。さまざまな大陸集団と対応している参照人口集団の個体群の明確に分離したクラスタは、連続的な遺伝学的差異の背景へと融合します。これは、人口史について知られていることと一致しており、大規模な移住と集団間の不断の混合が標準でした。これらの歴史の影響は、世界のさまざまな地域における遺伝学的差異のさまざまな構造につながります。そうした研究は、とくに遺伝学的祖先系統として組み立てられた情報が医療に影響を及ぼすかもしれない場合に、大陸別分類の使用がいかに不適切なのか、示します。

 混合および「混合個体」という用語を使うことは、複数の人口集団を、通常は大陸祖先系統人口集団からの最近の祖先系統を有するものとして、人類内において個別の分類の概念を強化します。この使用は、大陸祖先系統分類の概念を回避するのではなく、むしろそうした分類使用の誤りを悪化させます。なぜならば、これらの個体群は通常、「純粋な」大陸祖先系統人口集団の混合として概念化されているからです。

 祖先系統の概念化は、全てのヒトを説明するのに充分なほど一般的でなければなりません。そのための唯一の方法は、祖先系統が連続的であることを認める概念と手段を用いることです。分類には合理的な使用があります。たとえば、遺伝学的危険性得点の予測能力の違いを報告する場合ですが、この場合でさえ、性能の違いは多くの要因によるもので、祖先系統など1要因にだけ焦点を当てることは、集団間の違いを本質化することにつながる可能性があります。しかし、ある分類一式への初期設定での訴求力はそれらの集団を本質化する危険性があり、これら抽象的な集団間の差異が具体的であるかのように扱われる可能性が高くなります。

 分類の使用を必要としないことに加えて、遺伝学的祖先系統の定義は、個体の祖先の文脈のあらゆる側面で沈黙しています。祖先組換え図には構造がありますが、それ自体は個体の地理的位置もしくは文化について何も示唆しません。研究者は、この文脈を提供するのかどうか、およびその方法の選択に直面します。重要なのは、考慮される期間に応じて複数の文脈を与えることができることです。なぜならば、現生人類(Homo sapiens)の過去において各世代の祖先がいるからです。古代DNAと集団遺伝学の進歩は、人類史のさまざまな時点での人口集団構造についてますます多くの情報を提供しつつあります。したがって、現代のヒトゲノムは、個人の年代的に階層化された祖先記録をますます可視化できます。

 しかし、この遺伝学的祖先系統の歴史的概念は、分類の一式のみが用いられた場合に平板化されます。大陸祖先系統分類の場合、その使用はいくつかの特定の時点において、ヒトは大陸間の自然地理的な境界によりほぼ均質な集団に区分されていた、という仮定を反映しています。これは人類史のひじょうに過度な単純化です。大陸祖先系統分類の使用は、さまざまな分類が関連する場合にも時間断片を不明瞭にします。たとえば、5万年前頃には現生人類とネアンデルタール人(Homo neanderthalensis)の分類が、5000年前頃のヨーロッパでは「草原地帯関連」や「ヨーロッパ」狩猟採集民や「近東」農耕民といった分類が(関連記事)あり、500年前頃には、移住と奴隷貿易の波が、アメリカ大陸におけるヒトの遺伝的多様性の新たなパターンを形成しつつありました。


●祖先系統のより複雑な概念

 遺伝学的祖先系統を持ち出そうとする研究者にとっての意味は何でしょうか?研究者はまず、研究課題に答えるために分類を課す必要があるのかどうか、問うべきです。分類が本質的と考えられていたものの、その後に回避できると示されるようになった多くの状況があり、たとえば、ゲノム規模関連研究では人口集団の階層構造が補正されています。遺伝学的祖先系統分類を回避できる事例では、避けるべきです。研究者が分類を課すための科学的必要性を正当化できる場合、次に考えるべきなのは、自らが課した分類に表示(地理や民族や言語など)を提供すべきかどうか、ということです。分類表示を提供する必要があるならば、その選択に科学的正当性を与え、課されたそれらの分類表示の潜在的不利益を考慮した、と示すべきです。

 研究者はさらに、遺伝学的祖先系統が歴史的概念であることを反映する、複数の種類の分類を使用すべきです。現代人は全員、対象期間に応じて複数の祖先系統を有しています。単一の「祖先系統」を有する個体は存在しません。複数形を常に使用すべきです。さまざまな地理的解像度、たとえば「ヨルバ人」対「アフリカ西部人」は、さまざまな時間断片で代理として機能できます。さまざまな時点の祖先系統分類は、医学的関連があるかもしれません。古代DNA情報を組み込むことで、さまざまな時間断片の厳密な調査も可能となりますが、この手法の将来性はどれだけ多くの古代DNAがじっさいに回収され、分析されるかに依存するでしょう。一つの時間断片での代理として大陸祖先系統分類を使用することは、とくに慎重に正当化されねばなりません。それは、人種分類と大陸祖先系統分類の融合のためです。さらに将来の研究では、最近の祖先がARGの遠い地域に由来する個体群の遺伝学的祖先系統を概念化する、よりよい方法を見つけねばなりません。

 人口集団により異なる有病率を示すいくつかの疾患については、新たな変異の偶然の到来、人口史、歴史的な環境暴露の違いの結果として、遺伝学的危険性要因がじっさいに機能しているかもしれません。しかし、遺伝学がそうした原因となる役割を果たしていることもあり得ますが、遺伝学的祖先系統は差別の影響を含む環境の影響における違いの代理としても機能するかもしれません。研究者が健康の結果を理解するさいに何らかの分類を持ち出す時はいつでも、遺伝学的および環境の影響を共同でモデル化し、モデル化されていない要因のために差異の説明に失敗すると認めることに、注意深く努力する必要があります。

 科学は還元的であり、単純な大陸分類を用いるモデルは、ヒトの遺伝学的多様性理解の過程を始めるのに役立ちました。しかし、全てのモデルには適用性の合理的な領域と限界があり、今やずっと複雑なモデル一式が広範な使用事例で基準となるべきです。これはとくに重要で、なぜならば、ヒト遺伝学は生物学に分類されますが、人類学や人口統計学や疫学や歴史学や社会学など、実際にはいくつかの分野が交差する科学だからです。使用されたモデルの限界が統計および集団遺伝学者によってよく理解されている場合でも、他の人々はそのモデルを、還元的分類を用いて単に近似と推定を公式化している、と認識するのではなく、むしろ現実の記述とみなす可能性があります。したがって、これらの分類を用いる危険性の一つは、他者が真の自然的なものとして分類を解釈する可能性があることで、それは不正確です。代わりに、そうした分類は近似値もしくはひじょうに狭い種類の質問に答えることを可能とする、研究の発見を助けるものです。人種的区分と大陸祖先系統分類の関連のため、これは大陸分類ではとくに重要です。

 個々の研究者は、大陸祖先系統分類を使用すること自体では人種差別主義者でありませんが、こうした慣行の累積の影響は人種主義につながり、それを持続させます。ヒトの差異についての類型的思考は、社会的結果に悪影響を及ぼしてきました。大陸祖先系統分類への継続的依存は、推論の失敗、分野間の誤解、ヒトの差異を理解する還元的で限定的な方法に根差す報告された発見につながっています。これらは個体と集団について医学的固定観念を悪化させ、それに対処するのではなく健康格差につながり、生物学としての人種の理解(誤解)を具象化する可能性があります。さらに、この問題は大陸祖先系統分類に限りません。国の分類は、政治的目標のために生物学的として具象化でき、またそうされてきました。

 この解決は、祖先系統が生物医学研究生態系全体でどのように概念化され使用されているのか、という問題への対処を必要とするでしょう。これは、祖先系統のより複雑な概念の開発と操作運用と広範な使用を含んでいるでしょう。それは、関連する概念から遺伝学的祖先系統により意味するものの曖昧さを解消し、可能な限り祖先系統を分類変数として扱わず、祖先系統を歴史的過程の反映として扱うもので、どの研究でも多くの異なる種類の分類を使用すべきだ、と意味します。

 この移行を促進するには、さまざまな分野が祖先系統の概念を使用し運用可能にする方法と理由の確かな経験的理解が必要です。祖先系統のこのより複雑な概念が実際に使用されることを確実にするには、体系的水準の変化が必要でしょう。新たな計算とデータ構造が必要になるでしょう。たとえば、分類を課さない遺伝学的祖先系統のより広範な代理や、複数の期間を表す祖先系統分類の使用を可能とする、容易に利用できるソフトウェア手法です。ARGを直接的に推定する手法のさらなる開発と採用が奨励されるべきです。科学者や医師のため、教材を開発する必要があります。

 ヒトの生物学的分類を用いる研究に従事する全分野の科学者は孤立して研究するのではなく、理想的には影響を受ける共同体との関わりを含めて、学際的研究団として研究すべきです。これらの試みの支援において、雑誌編集者は基準を設定し、専門家共同体は最良の実践を刊行すべきで、資金提供者はどの研究課題を支援するのか、慎重に検討すべきです。これらの組織が生物学的変数としての人種の使用を正当に批判しているように、大陸祖先系統分類の使用が新たな怠慢にならないことこそ最重要です。アメリカ合衆国の科学と工学と医学の学会は最近になって特別に、「ゲノム研究における人口集団記述語としての人種と民族と祖先系統の使用」という委員会を立ち上げました。これが本論文で提起された点の検討と整理の機会を代表するよう、望まれます。

 祖先系統のより複雑な概念の採用は、同様に集団および統計遺伝学と古代DNA研究の研究課題に活気を与え続けるはずです。遺伝学的祖先系統の概念の本拠地であるこれらの分野において、実践の変化が最大の全体的影響を与えるかもしれません。これらの変化は、遺伝学と健康格差との間のつながりを探るあらゆる研究の前提条件です。さらに一般的には、連続的変異と歴史的深さを反映する祖先系統のより複雑な概念とともに、集団間の権力動態などヒト集団の複雑な歴史を反映する、科学への道を開き始めることができます。


 以上、本論文についてざっと見てきました。本論文は、古代ゲノム研究も含めて集団遺伝学で多用される「祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)」という概念の使用の危険性と、今後の改善についての展望を提示しています。古代ゲノム研究においても、「祖先系統」の使用の危険性も限界も指摘されているとは思いますが(関連記事)、とくに、それが報道機関で一般向けに伝えられるさいには本質的と把握される危険性が高く、要注意です。その意味では報道機関や一般向け書籍を刊行する出版社とともに、研究者側も自身の研究とその成果の発信のさいには注意が必要になるでしょう。もちろん、私のようにその成果を受け取る側の一般大衆も、理解の向上に努めねばなりませんが。


参考文献:
Lewis ACF. et al.(2022): Getting genetic ancestry right for science and society. Science, 376, 6590, 250–252.
https://doi.org/10.1126/science.abm7530

この記事へのコメント