現代日本人の遺伝的構成の地域差(追記有)
現代日本人の遺伝的構成の地域差に関する研究(Watanabe, and Ohashi., 2023)が公表されました。日本人起源論への関心は現代日本社会においてそれなりに高いように思われ、関連する研究が注目されることもあります。そうした関心のある人々の間では、現代日本人の遺伝的構成に地域差があることもよく知られているでしょう。本論文は、本州・四国・九州とそのごく近隣の島々を中心とする日本列島「本土」の現代人集団を対象として、その地域差の由来を検証します。なお、本論文において頻繁に引用される文献で、当ブログにて取り上げたものは参考文献に掲載し、敬称は省略します。
追記(2022年2月22日)
本論文の日本語解説記事が公表されました。
●要約
現代日本人には2つの主要な祖先集団があり、それは在来の縄文狩猟採集民と大陸部のアジア東部農耕民です。現在の日本人集団の形成過程を判断するため、この研究は要約統計量である祖先系統標識指標(ancestry marker index、略してAMI)を用いて、祖先の人口集団に由来する多様体についての検出手法を開発しました。本論文はAMIを現代日本人集団の標本に適用し、縄文時代の人々【以下、「縄文人」と表記します】に由来する可能性が高かった206648ヶ所の一塩基多型(SNP)を特定しました(縄文由来多様体)。日本全域から収集された現代日本人10842個体における縄文由来多様体の分析から、縄文人の混合割合は都道府県間で異なり、おそらくは先史時代の人口規模の違いに起因する、と明らかになりました。現代日本人の祖先人口集団におけるゲノム規模SNPのアレル(対立遺伝子)頻度の推定は、それぞれの生計に適応的な表現型の特徴を示唆しました。本論文はこれらの調査結果に基づいて、現在の日本列島の人口集団の遺伝子型と表現型の段階的変化配について形成モデルを提案します。
●研究史
現代の日本人集団は、3つの主要な人口集団で構成されています。それは、おもに北海道に住むアイヌと、おもに沖縄県に住む琉球人と、本州・四国・九州【およびそのごく近隣の島々】に住む本土日本人です。日本人集団の形成過程に関する今では確立した理論である二重構造モデルは、埴原和郎の形態学的知見(1991年)に基づいて提案されました。このモデルでは、日本人は、縄文時代(16500~2800年前頃)に日本列島に暮らしていた新石器時代【本論文は縄文時代を新石器時代に区分しますが、異論があるとは思います】狩猟採集民である縄文人と、弥生時代開始の頃(2800年前頃)にアジア東部大陸部から稲作農耕技術とともに日本列島に到来した移民との間の混合に由来する、と仮定されます(関連記事)。大陸からの移民の稲作農耕慣行はその後、日本全体に拡大し、古代日本社会に大きな変容をもたらしました。
二重構造モデルによると、日本列島本土と比較して、アイヌと琉球の人口集団は遺伝的に移民による影響が小さかったことになります。遺伝学的研究は二重構造だけではなく、日本列島の詳細な人口史も明らかにしました(関連記事)。縄文人遺骸から抽出された全ゲノム解析から、縄文人は他のアジア東部人と高度に区別され、アジア東部および北東部人の基底部系統を形成する、と示されました(関連記事)。縄文時代個体群と他のアジア東部人との間の遺伝的関係から、縄文人の祖先人口集団はアジア南東部からアジア東部へと沿岸経路を通ったかもしれない最初の波の移民の一つである、と示唆されます(Gakuhari et al., 2020、関連記事)。
縄文人は遺伝的にアイヌおよび琉球人口集団と密接に関連しており、本土日本人で見られるゲノム構成要素の10~20%が縄文人に由来することも明らかにされました(Kanzawa-Kiriyama et al., 2019、関連記事)。最近の研究では、中国の漢人と密接に関連している「アジア東部人」集団に加えて、「アジア北東部人」集団も現代日本人の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)に寄与した、と分かりました(Cook et al., 2021、関連記事)。「アジア東部人」と「アジア北東部人」を含む大陸部人口集団からの縄文人の深い分岐が示されたので(Cook et al., 2021)、現代の本土日本人は基底部アジア東部系統(つまり縄文人)と大陸部アジア東部人に由来するゲノム構成要素を有する人口集団である、と結論づけることができます。本論文はCook et al., 2021により特定された2つの大陸部祖先人口集団を、区別が必要ではない限り、まとめて「大陸部アジア東部人」と呼びます。
二重構造モデルは、日本列島の人口集団の形成史に関する有力な仮説です。しかし、日本人集団における地域的差異の形成過程は、長きにわたって確立してきた二重構造モデルによりまだ完全には説明されていません。いくつかの研究は、形態学的特徴および古典的な遺伝学的指標の東西の勾配を指摘し、埴原和郎は、「日本の東西間の現在の違いは縄文時代と弥生時代に由来する可能性が高い」と述べながら、これらの研究を参照しました。最近、いくつかの研究は、ゲノム規模での日本列島の人口集団間のゲノムの地域的差異を論証してきました(Watanabe et al., 2021、関連記事)。
とくに、日本列島全体からの日本人標本の大規模な収集を用いて、東北と関東と九州の人口集団が遺伝的に琉球の人口集団とより密接に関連しているのに対して、近畿と四国の人口集団は大陸部アジア東部の人口集団とより密接に関連している、と先行研究では示されてきました(Watanabe et al., 2021)。日本人の表現型を定義する遺伝的要素にも、地域的な段階的変化があるようです。2021年の研究では、身長の多遺伝子得点(polygenic score、略してPS)が、中国の漢人とより密接に関連している本土日本人ではより高かった、と明らかにしました。
したがって、遺伝的および表現型の特徴における地域差が日本人には存在し、「中国の漢人との遺伝的関連性の程度」により定義されると推測されます。本論文は埴原和郎とその後の人類学者によるこれらの推測を、以下の仮説に要約できます。つまり、現代の本土日本人における遺伝的な地域差は、縄文時代後期から弥生時代にかけての縄文人と大陸部アジア東部からの移民の混合割合の地域的な地理的違いにより起きています。この仮説を検証するため、本論文は現代の日本列島の人口集団における「縄文由来多様体」に焦点を当てました。
2つの供給源人口集団の混合に由来する人口集団では、異なる供給源人口集団のハプロタイプ間の組換えが、混合事象後に必然的に起きました。結果として、2つの祖先人口集団に由来するハプロタイプは、混合人口集団の染色体に斑状に存在し、各祖先人口集団に由来するハプロタイプにおけるアレルは、相互と連鎖不平衡(linkage disequilibrium、略してLD)にあるもと予測されます。この研究は、祖先系統標識指標(ancestry marker index、略してAMI)という要約統計量を用いて手法を開発し、現代の本土日本人における縄文人に由来する祖先系統標識多様体(つまり、縄文由来多様体)を検出します。
AMIの重要な特徴は、縄文人の骨格標本から得られたゲノムを必要としないことです。AMIは、古代型人類【絶滅ホモ属、非現生人類ホモ属】と初期ユーラシア人の混合事象に由来すると推測された出アフリカ人口集団における特定のSNPを用いて、古代型人類に由来するハプロタイプの検出に使われた、S∗からの着想で開発されました。縄文人は他のアジア東部の人口集団と高度に区別されるので、日本人以外の現在のアジア東部人口集団で見られない固有の多様体を有していた、と予測されます。したがって、現代の本土日本人も縄文人に由来する特定の多様体を有している可能性が高そうです。AMIは、日本人に固有の多様体間のLDに基づいて、縄文由来多様体を検出します。
本論文は、日本人集団のゲノムデータからの縄文由来多様体の抽出に成功しました。本論文は、縄文祖先系統の程度および遺伝的指標の代理として縄文由来多様体を用いて包括的分析を行ない、骨格遺骸の形態学的特徴からは明らかではなかった、現代日本人の祖先系(縄文人祖先系統と大陸部アジア東部祖先系統の混合)の多遺伝子性特徴を推定します。これにより、遺伝的および表現型の地域的な段階的変化が日本人で起きた機序を解明できるようになります。本論文は、そうした調査結果に基づいて、日本列島における現在の地域的な人口集団の形成についてモデルを提案します。
●祖先系統に由来する多様体を検出するための要約統計量である祖先系統標識指標の開発
まず、古代型祖先系統の特定に最も広く用いられている統計の一つであるS∗は縄文由来ゲノム構成要素の検出にも使える、と考えられました。しかし、合着(合祖)模擬実験から、現代日本人の人口史の仮定下では不可能だった、と明らかになりました。S∗は混合に由来する多様体が完全なLD(決定係数であるr²=1)で存在するゲノム構成要素ではより高い値を取り、そうしたゲノム構成要素は「混合に由来するゲノム構成要素」として検出されます。しかし、複数の縄文由来多様体が相互と完全なLDにある縄文由来ゲノム構成要素は、模擬実験ではほとんど生成されませんでした。そうした構成要素は、2つの人口集団間の分岐後の期間が、現生人類(Homo sapiens)と古代型人類【絶滅ホモ属、非現生人類ホモ属】の場合のように長ければ、豊富でした。
結論として、他のアジアの人口集団からの縄文人の分岐後の期間(つまり、数万年前)が、現生人類と古代型人類の分岐後の期間(つまり、数十万年前)よりずっと短かったので、S∗は縄文由来多様体の検出に適していませんでした。したがって、この研究は新たな要約統計量であるAMIを開発し、縄文由来の多様体(1型)を日本人固有の多様体の他の型、つまり大陸部アジア東部人の多様体(2型)と【縄文人と弥生時代以降に大陸部アジア東部から到来した集団との】混合後の日本人系統における新たな多様体(3型)から区別しました(図1)。以下は本論文の図1です。
AMIは、現代日本人の祖先人口集団の一部である縄文人が、他の大陸部アジア東部人口集団と遺伝的に高度に区分され、現代日本人は他のアジア東部人口集団では観察されない縄文系統(1型)で蓄積された固有の多様体を継承してきた、という発想に基づいて開発されました。第一段階は、縄文人と非縄文人の祖先系統の分岐後に非縄文人祖先系統において出現した多様体を削除するため、現代日本人に固有の多様体を抽出することでした。次の段階で、AMIが計算され、縄文由来多様体が日本人固有の多様体の他の型から区別されました。
縄文由来多様体(1型)以外の日本人交友の多様体には2種類あります。一方の多様体(2型)は大陸部アジア東部人に由来し、大陸部アジア東部人系統で出現し、混合を通じて日本人系統に移ったものの、アジア東部人口集団では最終的には失われました。もう一方は新規多様体(3型)で、混合後日本人系統でのみ出現しました(図1)。これら日本人固有の多様体のうち、縄文由来多様体(1型)は、同じハプロタイプに蓄積されるか、あるいは相互にLDにある、と考えられます。換言すると、1型の多様体は2型および3型と比較してLDにおいてより多くの多様体の組み合わせを有する、と予測されます。
AMIを計算するため、まず日本人固有の多様体の組み合わせ間でLD係数r²が計算されました。AMIは、r²が1000塩基対ごとの特定の多様体の密度により割った焦点の日本人固有の多様体について切断値を超過する多様体の数です。AMIを計算すると、より多くの日本人固有の多様体を伴うLDにおける多様体は、縄文由来多様体(1型)として区別されるでしょう。AMIの有用性を確認するため、縄文人と大陸部アジア東部人の混合を仮定する合着(合祖)模擬実験が実行されました。100万塩基対模擬実験では、日本人固有の多様体(1型と2型と3型)は各系統から抽出され、AMIが各日本人固有の多様体について計算されました。AMIの分布から、縄文由来多様体(1型)は他の日本人固有の多様体(2型および3型)よりもAMI値が大きい、と示されました(図2A)。以下は本論文の図2です。
受信者操作特性(Receiver operating characteristic、略してROC)分析では、縄文由来多様体(1型)はAMIにより他の日本人固有の多様体(2型および3型)と区別できる、と示されました。カットオフ値の指標となるユーデンインデックスは28.0374であった。切断値の測定であるヨーデン(Youden)指標は28.0374でした。0から0.8までr²閾値を変化させることによるROC分析が実行され、曲線下面積(Area Under the Curve、略してAUC)値が計算され、r²における違いに起因する検出能力の違いが調べられました。1型は0で検出できず、0.01と0.2の間の検出能力にほぼちがいはなく、検出能力はr²が0.2を超過すると低下する、と分かりました。縄文人と他の大陸部アジア東部人の分岐時間や、有効人口規模や、現在の日本人集団における縄文祖先系統の割合を変えることにより、さらに模擬実験が実行され、さまざまな人口史へのAMIの堅牢性が確認されました。ヨーデン指標の値は仮定された人口史に依存して異なりますが、縄文由来多様体は正確に検出できました。
●実際のデータにおける縄文多様体の検出
両アレルのSNPにのみ焦点が当てられ、縄文由来多様体が検出されました。韓国個人ゲノム計画(Korean Personal Genome Project、略してKPGP)の韓国人87個体(関連記事)と、1000人ゲノム計画(1000 Genome Project、略して1 KG)の世界規模の26人口集団のデータセットを用いて、約170万のSNPが本土日本人に固有と分かりました(1 KG JPT、JPTとは東京の日本人)。これら170万のSNPのうち、AMI閾値を超える208648が縄文由来多様体とみなされました。縄文由来多様体はゲノム全体に分布していました。
縄文由来多様体の検出精度を調べるため、縄文時代の2個体、つまり北海道の礼文島の船泊遺跡の3800年前頃の個体(Kanzawa-Kiriyama et al., 2019、F23)および愛知県田原市の伊川津貝塚遺跡の2500年前頃の個体(Gakuhari et al., 2020、IK002)と、本土日本人104個体について、縄文由来多様体に基づいて縄文アレル得点(Jomon allele score、略してJAS)が計算されました。縄文由来多様体がAMIにより適切に検出されたならば、IK002もしくはF23のJASは本土日本人よりも高いと予測されます。JPT人口集団のうち、NA18976は主成分分析(principal component analysi、略してPCA)により大陸部アジア東部人の方と遺伝的に近い、と明らかになり、JASはより低いと予測されました。JASの分布は補足データの補足図9に示されます。
NA18976を除く本土日本人103個体の平均JASは0.0164でした。予測されたように、NA18976のJASは他の本土日本人個体よりもずっと低い最低(0.00269)でした。IK002とF23のJASはそれぞれ0.0523と0.0555で、縄文由来多様体が現代の本土日本人個体群よりも縄文人の方でより頻繁に見つかりました。これらは、AMIが縄文時代の人口集団に由来するSNPを検出できる、と示唆します。JASは縄文時代のIK002とF23の両個体についてさえ、約5%にすぎないことに注意せねばなりません。これは、現代日本人個体群のAMI分析から得られた縄文固有多様体の数が、単一の縄文時代個体の全ゲノム配列から得られたものの数十倍だったことを示唆します。
●JASの縄文由来多様体を用いての本土日本人における地域・都道府県別の地域的な遺伝的違いの検出
本土日本人における地域的差異についての本論文の仮説を検証するため、地域人口集団の遺伝学的分析(Watanabe et al., 2021)で以前に用いられた日本人10842個体の3917の縄文由来多様体の補完された遺伝子型から、各地理的地域と都道府県について平均JASが計算されました。明治時代以後(1868年以後)の日本人の移住により大きく影響を受けた北海道の標本を除去し、合計10412点の標本がその後の分析に用いられました。北海道を除く各都府県の標本は10地域に区分されました。それは、東北と関東と北陸と中部と東海と近畿と中国と四国と九州と沖縄で、1979年の研究と一致します。詳細な地理的区分は以下の補足図1に示されます。
これら10地理的地域のJASは、図3Aと補足表3に示されます。JASは沖縄において最高で(0.0255)、続いて東北(0.0189)と関東(0.018)で、最低は近畿(0.0163)で、それに続くのが四国(0.016)でした。都道府県規模では、本土日本の平均JASは、最北端および最南端に位置する都道府県で高くなる傾向にありました(図3B)。JASは東北地方の青森県(0.0192)と岩手県(0.0195)と福島県(0.0187)と秋田県(0.0186)、および九州地方の鹿児島県(0.0186)でとくに高かった、と示されました。興味深いことに、島根県のJAS(0.0184)は東北地方や鹿児島県のJASとほぼ同じで、沖縄や九州の個体群と出雲の個体群との遺伝的類似性(関連記事)と一致します。これらの県の日本人個体群は、他の都府県の個体群よりも多くの縄文由来ゲノム構成要素を有している、と考えられます。
より低いJASの都府県は近畿地方と四国地方に位置し、和歌山県(0.0157)と高知県(0.016)と徳島県(0.0161)と三重県(0.0161)が含まれます。これらの人口集団は大陸部アジア東部人に由来するゲノム構成要素をより多く有している、と考えられます。各都府県のJASと、各都道府県の常染色体の183708のSNPのアレル頻度による先行研究のPCAから得られた主成分1(principal component 1 、略してPC1)値は、図3Cに示されます。JASはPC1と強く相関しました。その地理的分布は、AMIによる縄文人由来多様体の検出について、より厳密な切断値(AMIが100超)によっても変わりませんでした。以下は本論文の図3です。
JASの地域差は縄文時代における人口規模の地域的違いに関連していた、と推測されました。したがって、JASと縄文時代の人口規模に関連する3指標との間の相関が調べられました。その3指標とは、日本の文化庁の埋蔵文化財関係統計資料から得られた遺跡数、縄文時代後期の遺跡数から推定された人口規模、常用対数(弥生時代の遺跡数を縄文時代後期の遺跡数遺跡数で割った数)です。JASと各地域の人口規模との間の正の相関と、JASと縄文時代後期から弥生時代への人口成長率との間の負の相関から、縄文時代におけるより小さな人口規模と、現代の本土日本人におけるより低いJAS(つまり、大陸部アジア東部からの市民のゲノム構成要素のより高い寄与)が示唆されます。
さらに、2つの異なるモデルaとbの構築により炭化米遺骸の放射性炭素年代測定に基づくベイズ技術を用いて稲作農耕の到来年代を推定した、先行研究が参照されました。その研究では、稲作農耕が九州北部に到達した後、近畿と四国に九州南部よりも早く到達した、と示唆されており、これは近畿と四国におけるJASの低水準と一致します。各地域におけるJASと稲作農耕の到来年代との間の関係から、JASがより低いと、稲作農耕の到来がより早かった、と示唆されました。要するに、地域的な現代日本人集団間の遺伝的な段階的変化は、おもに縄文人の混合割合の違いにより起きており、恐らくは縄文時代末期から弥生時代にかけての各地域における人口規模の違いに起因する、と結論づけられます。
●縄文由来ハプロタイプによるアレル頻度推定は縄文と大陸部アジア東部祖先系統の表現型の特徴を明らかにします
縄文時代個体群のゲノムを用いずに、大陸部人口集団との混合に先行する、現代日本人の祖先である縄文人におけるゲノム規模SNPのアレル頻度を推定する手法が考案されました。焦点となるSNPの周辺の現代日本人のハプロタイプは、縄文由来多様体の存在に応じて、「縄文由来ハプロタイプ」と「大陸部ハプロタイプ」に分類できます。焦点となるSNPにおける縄文人のアレル頻度は、縄文由来ハプロタイプ内の各アレルの割合により推定できます。現代日本人の大陸部祖先系統のアレル頻度は、大陸部ハプロタイプ内の各アレルの割合です。
現代日本人413個体のゲノムを用いて(Tokyo Healthy Control、略してTHCデータセット)、現代日本人の縄文および大陸部祖先系統(「THC」縄文祖先系統と「THC大陸部祖先系統」)における6481773のSNPにこの研究で開発された手法が適用され、アレル頻度が推定されました。THC祖先系統のアレル頻度は、以前に報告された(Kanzawa-Kiriyama et al., 2019、Gakuhari et al., 2020、Cooke et al., 2021)古代人(縄文時代11個体と古墳時代3個体)のゲノムとTHCの現代日本人および北京の漢人(CHB)集団のゲノムを用いて検証されました(図4)。本土日本で発掘された1400~1300年前頃となる古墳時代の個体群は、現代日本人個体群と類似した縄文祖先系統の割合を有しています(Cooke et al., 2021)。
まず、ヨルバ人を外群として仮定した対でのf3が、THC縄文祖先系統の割合のアレル頻度が実際の縄文時代個体群のアレル頻度と類似しているのかどうか、という検証に用いられました(図4)。先行研究の各縄文時代個体とのTHC縄文祖先系統のf3値は、古墳時代と現代日本人と現代漢人の個体群のf3値より高い(f3が0.04超)、と示されました。THC縄文祖先系統と縄文時代個体群について計算されたf3値は、縄文時代個体群の組み合わせのf3値と同等でした(図4)。これらの結果から、THC縄文祖先系統は実際の縄文時代個体群に遺伝的に近く、現代日本人で見られる縄文由来ハプロタイプを用いての縄文人のアレル頻度推定に成功できた、と示唆されます。これらの結果は、本論文で抽出された現代日本人における縄文由来多様体が縄文人に由来する、という強い確信も提供します。以下は本論文の図4です。
日本人の祖先人口集団の表現型の特徴を推定するため、以前のゲノム規模関連研究(genome-wide association study、略してGWAS)結果が、THCの現代日本人と縄文人および大陸部の祖先系統のゲノム規模SNPのアレル頻度と組み合わされました。各人口集団のアレル頻度について、平均2βf値が計算されました。2βf値は、GWASのp値が設定された閾値(0.01と0.001と0.0001)より低い各SNPについて、有効アレル頻度の2倍に有効規模を乗じて計算され、ゲノム規模のSNPに対する平均2βfにより、その形質について特定の人口集団における平均的な表現型を評価できるようになります。平均2βf値は焦点となる人口集団内の平均的な多遺伝子得点(polygenic score、略してPS)に相当します。
以前の量的形質遺伝子座(quantitative trait locus、略してQTL、特定の表現型と統計学的に関連するゲノムの領域)GWASにおける60の形質について、平均2βf値が計算されました。まず、現代THC日本人に焦点が当てられ、現代日本人における60すべての形質についての平均2βf値は、大陸部祖先系統に近かった、と示されました。混合人口集団における祖先系統の割合から得られた人口集団頻度の偏差は、混合事象後の正の自然選択の兆候である、と知られています。THCの現代日本人の平均2βf値は、日本の人口集団における大陸部祖先系統の高い割合(80~90%)を反映しており、縄文祖先系統の表現型が自然選択に起因して現在の日本人において優勢になった可能性は低いようです。
次に、縄文と大陸部の祖先系統間のとくに大きな違いがある形質を特定するため、模擬実験から得られた帰無分布に基づいてD統計が計算されました。Dの絶対値がより大きいほど、縄文と大陸部の祖先系統間の表現型の違いがより有意になる、と推測できます。平均2βfがTHC大陸部祖先系統よりもTHC縄文祖先系統でより大きい場合、Dは正の値です。各形質のD値はGWASのp値閾値に応じて変わり、図5Aと補足表5に示されます。以下は本論文の図5です。
極端なD値を示した形質は、GWASのp値閾値に応じてわずかに異なりました。これは、p値閾値が厳密に設定された場合、比較的小さな有効規模のSNPの多遺伝子効果が除去され、より大きな有効規模の数点のSNPが強調されるかもしれないからです。たとえば、厳密なp値閾値を設定すると(0.001超と0.0001超)最高のD値を示す中性脂肪(形質識別番号はTG)については、TGが有意に増加する11番染色体上のZPR1遺伝子の非翻訳領域(UTR)3′末端の遺伝子座(rs964184)のC(シトシン)/G(グアニン)があります。THC縄文祖先系統におけるG(グアニン)アレル頻度は94%で、THC現代日本(28%)および大陸部(18%)の祖先系統のアレル頻度や、1 KGの現代の人口集団のアレル頻度よりも顕著に高くなっています。具体的には、アフリカ(AFR)では22%、ヨーロッパ(EUR)では16%、アジア南部(SAS)では23%、アジア東部(EAS)では24%、アメリカ大陸(AMR)では28%です。
次に、極端なD値が得られた以下の形質に焦点が当てられました(図5A)。それは、正のD値については中性脂肪(形質識別番号はTG)と血糖(形質識別番号はBS)、負のD値については身長(形質識別番号はheight)とC反応性タンパク(形質識別番号はCRP)と好酸球算定(形質識別番号はEosino)です。これらのD値から、縄文祖先系統では、遺伝的にはより低身長で、中性脂肪と血糖の水準がより高水準だったのに対して、大陸部祖先系統では、遺伝的に身長がより高く、CRPと好酸球算定がより高かった、と推測されました。身長に関して、本論文の結果はひじょうに説得力があります。それは、いくつかの以前の形態学的研究では、縄文人は弥生時代や古墳時代の人々など、大陸部アジア東部から移住してきた人々よりも低身長だった、と示唆されたからです。
THCの縄文と大陸部の祖先系統間でひじょうに異なっていた他の形質に関しては、正のD値のある形質が栄養状態に関連しているのに対して、負のD値は感染症への抵抗性に関連しているようでした。これらの表現型の特徴は、それぞれの生計に遺伝的に適応していたようです。縄文人が、その狩猟採集生活様式において高水準の中性脂肪と血糖を維持する必要があったかもしれないのに対して、大陸部アジア東部人口集団は、農耕生活様式における感染症への抵抗性を高める必要があったかもしれません。より詳しい説明は以下の考察の項目で提供されます。
2021年の研究では、身長のPSは日本の各都道府県の人口集団の平均身長と相関しており、中国の漢人と遺伝的に密接に関連している人口集団は、現代日本における地域的な人口集団間の身長についてより小さなPSを有している、と示唆されました。この先行研究の調査結果と、大陸部祖先系統は遺伝的により高身長である、という本論文の調査結果を組み合わせると、日本列島の身長の地域差は、より低身長の遺伝的要素を有する縄文人と、より高身長の遺伝的要素を有するアジア東部人の祖先系統の割合に起因していた、と強く主張できます。
本論文は、日本列島の地域的な人口集団間の身長の差異に加えて、祖先系統の割合の地域差が中性脂肪/血糖および好酸球算定との関連で現代日本人の表現型で地域的な多様性に影響を及ぼした事例を報告します。本論文は、本土日本人集団における、中性脂肪および血糖と関連する5歳児での肥満率と、好酸球と関連する喘息悪化の発生率の地域差に焦点を当てます。好酸球は現在の人口集団において、喘息などアレルギー性炎症と強く関連しています。日本人集団における好酸球算定に関する以前のGWASによると、好酸球算定は喘息の危険性と有意な遺伝的相関を有しています。各都道府県についての平均JASと5歳児の肥満率(2021年度学校保健統計調査)との間の関係は図5Bに提示され、喘息悪化の発生率は図5Cに示されます。JASと上述の指標との間には有意な相関が見つかり、現代日本人の表現型におけるこれらの地域差は縄文祖先系統の割合の違いによりほぼ決まる、と示唆されます。
●考察
縄文人からのゲノム配列なしに、現代の日本人集団において縄文由来多様体を検出するための要約統計量として、AMIが開発されました。コンピュータ模擬実験では、供給源人口集団が数万年前に分岐した混合人口集団でさえも、AMIは祖先多様体を構成度で検出できる、と示されました。模擬実験において人口史を変えてさえも、AMIを用いて縄文由来多様体を検出できました。日本列島の人口集団の進化史にはやや議論の余地がありましたが(Cooke et al., 2021および関連記事)、その人口史が正しいとしても、AMIを用いてのこの手法は、縄文由来SNPの研究を可能とします。さらに、この手法は、供給源人口集団が比較的最近分岐した他の混合人口集団にも適用できます。現生人類の遺伝的多様性は、人口集団の混合事象により大きく影響を受けます(関連記事)。AMIは日本人だけではなく他の混合人口集団の人口史にとっても、強力な手法となるでしょう。
本論文は、この研究における合着模擬実験に基づくヨーデン指標を用いて、AMIの閾値を決定しましたが、各人の研究目的にしたがって閾値を設定できることに注意すべきです。偽陽性を減らしたいならば、閾値を厳密に設定でき、偽陰性を減らしたいならば、閾値を緩く設定できます。実際には、AMIの閾値は必ずしも、人口史を仮定する模擬実験に基づいて設定される必要はありません。現代日本人の地域比較では、日本の各都道府県の人口集団における全ゲノムの傾向を把握するため、できるだけ多くの縄文由来多様体を選択するよう閾値は緩く設定されました。しかし、現代日本人の縄文由来ハプロタイプによる縄文人のアレル頻度推定では、閾値は厳密に設定され、それは、縄文由来多様体の偽陽性が縄文由来ハプロタイプ頻度の誤った推定につながるかもしれないからです。
本論文は、その起源に基づいて現在の人口集団のハプロタイプを分類することによる、祖先人口集団についてのアレル頻度推定手法を提案します。本論文は、THC縄文および大陸部祖先系統から得られたアレル頻度を以前のGWASの結果と組み合わせることで、日本人の祖先人口集団が特徴的な表現型を示してきたと推測される、いくつかの形質を報告しました。具体的には、身長、中性脂肪、血糖、CRP、好酸球算定です。身長に関しては、形態学的分析は縄文人の低身長を示唆し、2021年の研究では、日本列島の地域的な人口集団では、中国の漢人と遺伝的に密接に関連している人口集団は身長についてより大きなPSを有していた、と分かりました。これら先行研究は、縄文人が大陸部祖先系統の人々よりも遺伝的に低身長だった、という本論文の調査結果を裏づけます。
中性脂肪と血糖について本論文は、大陸部祖先系統よりも縄文祖先系統でより高い水準を推測しました。日本列島の人口集団の食性は大きく変わったようで、縄文時代後期以後の大陸部アジア東部人による稲作の導入に伴って、農産物への依存度が高まりました。弥生時代には、作物からの炭水化物摂取量が増加し、それは虫歯の発症率上昇など、弥生時代の日本列島の人口集団に影響を及ぼしました。これらの先行研究に基づいて、栄養状態に関する縄文人の遺伝的特徴は、以下のように上手く説明できました。「倹約遺伝子仮説」を参照し、現代日本人の縄文人祖先は、稲作農耕の大陸部アジア東部人の祖先よりも食料採集での中性脂肪および血糖の維持がより困難だったかもしれないので、中性脂肪と血糖のより高水準の遺伝的要素が役立ったでしょう。
CRPと好酸球算定に関しては、大陸部祖先系統の方が縄文祖先系統よりもCRPと好酸球算定が多かった、と分かりました。CRPは、細菌感染に対する防御で重要な役割を果たすパターン認識分子です。好酸球算定は、蠕虫類感染への応答において重要な役割を果たす、さまざまな白血球細胞と免疫体系構成要素です。一般的に、農耕はより高い人口密度、定住化、近隣の人口集団との接触につながり、野営地外の移動を減少させ、毒性の真正細菌や蠕虫類の拡大およびこれら病原体へのより多くの曝露をもたらします。現代の日本人集団の大陸部アジア東部人の祖先は、稲作農耕を始めて日本列島へと移住し、縄文人の祖先と比較して真正細菌や蠕虫類など病原体への抵抗性を高める必要があり、CRPと好酸球算定を増加させる遺伝的要素を獲得しました。この見解は、考古学および進化学的研究により裏づけられます。日本列島の最初の骨格の結核は、弥生時代後期(2000年前頃)の青谷上寺地遺跡(鳥取県鳥取市青谷町)で確認されました。その研究では、日本列島における大陸部からの移民は結核を広めた、と論じられ、「一次結核症は(中略)先史時代の縄文人に深刻な被害と、その先住人口集団の急速な減少をもたらした」と述べられました。
蠕虫類感染症については、住血吸虫である日本住血吸虫(Schistosoma japonicum)のミトコンドリアDNA(mtDNA)の系統発生分析が、稲作農耕の起源地である長江中流および下流からアジア東部のさまざまな地域への、稲作農耕文化の拡大を伴う1万年前頃となる日本住血吸虫の拡散を示唆しました。1995年の研究では、多くの鞭虫の検出にも関わらず、三内丸山遺跡では土壌標本で回虫の卵が見つかりませんでした。したがって、2003年の研究では、回虫感染症は弥生時代以後に稲作の開始とともに発生した、と主張されました。大陸部からの移民が、縄文時代の狩猟採集民と比較して、感染症への耐性を示すアレルへの多遺伝子性選択を通じて農耕生計に遺伝的に適応していた、ということを考えると、本論文の結果はひじょうに説得力があります。
本論文では、祖先系統の割合における違いが現代日本人において肥満と喘息悪化の地域差に顕著な影響を及ぼすことも分かりました。これらの地域的な表現型の差異を、縄文人と大陸部の祖先間で有意な違いを示した中性脂肪や血糖や好酸球算定と組み合わせると、あり得るシナリオは以下の通りです。縄文時代の狩猟採集民にとって、中性脂肪と血糖の水準上昇が飢餓への耐性に重要だったのに対して、大陸部アジア東部農耕民にとって、CRPと好酸球算定の増加は感染症への防御にとって重要でした。大陸部アジア東部農耕民は縄文時代後期と弥生時代に、稲作農耕技術を用いて日本列島へと移住し、在来の縄文狩猟採集民との大規模な交雑をもたらしました。縄文人の高い祖先系統の割合を有する現在の日本列島の地域的な人口集団は、より高い中性脂肪と血糖の遺伝的要素を保持しており、肥満の危険性がより高くなります。対照的に、大陸部アジア東部人の高い祖先系統の割合を有する地域的な人口集団は、好酸球算定を増加させる遺伝的要素を有しており、喘息悪化の危険性がより高くなります。現代日本人における肥満と喘息の発症率の地域的な段階的変化は、大陸部アジア東部人の祖先系統の割合における地域差に起因していました。
本論文は全体的に、ゲノム規模のアレル頻度と縄文人および大陸部の祖先の平均2βfを有する調査結果に基づいて、以下の3点を結論づけることができます。(1)縄文人と大陸部アジア東部人のいくつかの表現型はゲノム規模では高度に分岐していました。(2)いくつかの表現型の違いは、縄文人と大陸部アジア東部人のそれぞれの生計への遺伝的適応の結果だったかもしれません。(3)縄文人と大陸部アジア東部人の混合割合の地域差は、現在の日本列島の人口集団の表現型の段階的変化を形成しました。現代の日本人個体群における他の形質の将来のGWASを縄文祖先系統の割合のアレル頻度と統合することにより、発掘された骨格の形態では現れない表現型の特徴が明らかになるでしょう。おそらく、身長や肥満率や喘息悪化の事例のように、混合割合の違いに起因する、現代日本人の表現型におけるさらなる地域的な段階的変化の発見も可能です。
縄文時代後期から現在までの日本列島における人口集団の形成過程に関して、本論文は図6に示されるモデルを提案します。縄文時代後期から晩期にかけて、縄文時代狩猟採集民が本土日本に定住していました。縄文時代狩猟採集民は比較的低身長の人口集団で、飢餓への耐性のためのより高水準の中性脂肪と血糖など、狩猟採集生活様式に適応した遺伝的要素を有していました。縄文人の人口規模と人口密度は地域により異なっており、東北と九州では比較的大きく、近畿と四国では比較的小さかった、と示されています。以下は本論文の図6です。
同時期に、稲作農耕人口集団が大陸部アジア東部に暮らしており、比較的高身長で、その生計に遺伝的に対応しており、病原体への防御のためより多いCRPと好酸球算定を有していました。縄文時代晩期に、大陸部アジア東部人が稲作農耕技術を用いて九州北部に到来し、その後で本土日本の全地域で縄文人と混合しました。弥生時代には、移民の人口規模は、縄文時代末には人口が少なかった近畿と四国で比較的多かった、と推測されます。近畿と四国では、稲作農耕は他の地域より比較的速く始まったようです。縄文時代晩期から弥生時代の人口規模の地域差は、現代の日本列島における地域間の縄文人と大陸部アジア東部人の混合割合を変えました。混合の地域差は、日本人の遺伝子型と表現型の地理的な段階的変化をもたらしました。以下は本論文の要約図です。
●この研究の限界
一般的に、遺伝子型と表現型のデータの組み合わせを用いて、PSによる表現型の予測精度を評価し、PSの解析手順として最適なp値閾値が設定されます。しかし本論文は、組み合わされた日本人集団の遺伝子型/表現型のデータセットを有していません。したがって、この研究で計算された平均2βfに基づく標的となる形質の予測精度を評価できません。図5Aは、3つの異なるp値閾値について平均2βf分析結果を示しており、どのp値がこの研究で各形質にとって最良の予測性能を有するのか、不明です。
●私見
以上、本論文についてざっと見てきました。本論文は、現代の日本人集団における遺伝的構成の地域差を、縄文人と縄文時代晩期以降に大陸部アジア東部から到来した稲作農耕民との混合割合の違いと評価し、さらにはこの現代日本人集団の主要な2祖先集団の生計への適応と関連した、表現型の違いへの遺伝的影響を推測します。現代日本人集団における縄文人の遺伝的影響の地域差の大規模な調査など、本論文は今後の日本人起源論で参照されるべき重要なデータと見解を提示しており、たいへん注目されます。
また、当然ではありますが、ゲノムが解析された古代人は当時存在した人口のごく一部にすぎず、実際の人口集団の遺伝的多様性を充分には把握できません。したがって、本論文で提示された手法は、祖先人口集団から現代の人口集団への遺伝的影響を詳しく調べるうえで有効となるでしょう。本論文の手法は、現代の人口集団の複数の祖先人口集団間の分岐が過去数万年以内と比較的新しい場合でもかなり有効と考えられる点でもたいへん注目され、今後の研究の進展が期待されます。
本論文は、現代日本人集団における縄文人の遺伝的影響の地域差の要因として、縄文時代晩期の人口密度を指摘します。縄文時代後期~晩期には西日本の人口密度は低く、それが近畿と四国の現代人集団における縄文人の遺伝的影響の相対的な低さにつながっているのではないか、というわけです。しかし、古墳時代の四国と近畿の個体のじっさいのゲノム解析結果から、この説明には疑問が残ります。香川県高松市の高松茶臼山古墳の被葬者(茶臼山3号)のゲノムにおける縄文人的構成要素の割合は東京の現代日本人(JPT)よりもやや高く(関連記事)、和歌山県田辺市の磯間岩陰遺跡の古墳時代の2個体については、そのゲノムにおける縄文人的構成要素の割合は52.9~56.4%および42.4~51.6%と推定されており、JPTよりもかなり高いことになります(関連記事)。
近畿と四国の現代人集団における縄文人の遺伝的影響の低さは、古墳時代から飛鳥時代にかけての朝鮮半島からの渡来民、および奈良時代以降の歴史的過程も考慮しなければならないかもしれません。また、縄文時代晩期や弥生時代に朝鮮半島から日本列島へと到来した人々と、古墳時代以降に朝鮮半島から日本列島へと到来した人々では、遺伝的構成に違いがあるかもしれません(Cooke et al., 2021)。そうした可能性も考慮して、日本人の形成過程を検証しなければならないでしょう。
また本論文では、図6および要約図を見ると、日本列島の縄文時代後期には、日本列島にはゲノムが完全に縄文人的構成要素で占められている人口集団が、朝鮮半島にはゲノムが完全に大陸部アジア東部祖先系統で占められている集団が存在し、縄文時代後期以降に朝鮮半島から日本列島への人口移動があり、現代日本人集団が形成されていった、と想定されているようです。確かに、縄文時代の日本列島の人々は、時空間的に広範囲にわたって遺伝的に均質だった可能性が高そうです(関連記事)。
しかし、朝鮮半島ではゲノムがほぼ縄文人的構成要素で占められている新石器時代の個体や、ゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の個体も複数確認されています(関連記事)。さらに、朝鮮半島南岸では、三国時代の伽耶でもゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の個体が確認されていることから、新石器時代から三国時代まで、ゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の集団が存続していた、という可能性も指摘されています(関連記事)。ただ、この間の朝鮮半島南岸の人類のゲノム解析結果が公表されていないようなので、ゲノムにおける縄文人的構成要素の割合が新石器時代から三国時代まで存続したのか、断定はできないと思います。つまり、朝鮮半島南岸の個体群において、新石器時代以降に一度はゲノムにおける縄文人的構成要素がほぼ駆逐され、古墳時代の日本列島から改めてもたらされた可能性も考えられる、というわけです。
その可能性はさておき、朝鮮半島南岸の新石器時代個体群のゲノムにおけるJPTよりも高い縄文人的構成要素の割合を考えると、現代日本人集団のゲノムにおける縄文人的構成要素の全てが縄文時代後期~晩期の日本列島の個体群に由来するとは断定できず、縄文時代晩期もしくは弥生時代以降に朝鮮半島からもたらされた割合が一定以上ある可能性は低くないように思います。そうすると、たとえば現代日本人集団について、青銅器時代西遼河人口集団(92%)と縄文人(8%)の2方向混合としてモデル化できる、と推測した研究もありますが(関連記事)、縄文時代後期~晩期の日本列島の個体群に由来する割合が5%未満の可能性も考えられるわけで、仮にそうだとしたら、縄文時代と現代との間で日本列島の人類集団では遺伝的にほぼ全面的な置換が起きたことになります。まあ、現代日本人集団のゲノムにおける縄文人的構成要素の割合が平均して8%程度だとしても、全面的な置換に近い、と言えそうですが。
弥生時代の日本列島の人類集団については、現時点での知見(関連記事)からは、本論文で云うところの大陸部アジア東部的構成要素と縄文人的構成要素の割合に個体間で大きな違いがある、と言えそうです。おそらくこの推測は、今後古代ゲノム研究が進展しても覆らないでしょう。あるいは、弥生時代は日本列島の人類史上で最も遺伝的異質性の高い時代だったかもしれません。上述の磯間岩陰遺跡の古墳時代の2個体のゲノム解析から、この傾向は古墳時代にもある程度続いていた可能性が低くなさそうで、地域差も含めて現代日本人集団の基本的な遺伝的構成の確立は、少なくとも平安時代まで視野に入れる必要があり、さらに言えば、中世後期に安定した村落(惣村)が成立していくこととも深く関わっているのではないか、と現時点では予測しています。
参考文献:
Cooke H. et al.(2021): Ancient genomics reveals tripartite origins of Japanese populations. Science Advances, 7, 38, eabh2419.
https://doi.org/10.1126/sciadv.abh2419
関連記事
Gakuhari T. et al.(2020): Ancient Jomon genome sequence analysis sheds light on migration patterns of early East Asian populations. Communications Biology, 3, 437.
https://doi.org/10.1038/s42003-020-01162-2
関連記事
Kanzawa-Kiriyama H. et al.(2019): Late Jomon male and female genome sequences from the Funadomari site in Hokkaido, Japan. Anthropological Science, 127, 2, 83–108.
https://doi.org/10.1537/ase.190415
関連記事
Watanabe Y, Isshiki M, and Ohashi J.(2021): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics, 66, 4, 431–437.
https://doi.org/10.1038/s10038-020-00847-0
関連記事
Watanabe Y, and Ohashi J.(2023): Modern Japanese ancestry-derived variants reveal the formation process of the current Japanese regional gradations. iScience, 26, 3, 106130.
https://doi.org/10.1016/j.isci.2023.106130
追記(2022年2月22日)
本論文の日本語解説記事が公表されました。
●要約
現代日本人には2つの主要な祖先集団があり、それは在来の縄文狩猟採集民と大陸部のアジア東部農耕民です。現在の日本人集団の形成過程を判断するため、この研究は要約統計量である祖先系統標識指標(ancestry marker index、略してAMI)を用いて、祖先の人口集団に由来する多様体についての検出手法を開発しました。本論文はAMIを現代日本人集団の標本に適用し、縄文時代の人々【以下、「縄文人」と表記します】に由来する可能性が高かった206648ヶ所の一塩基多型(SNP)を特定しました(縄文由来多様体)。日本全域から収集された現代日本人10842個体における縄文由来多様体の分析から、縄文人の混合割合は都道府県間で異なり、おそらくは先史時代の人口規模の違いに起因する、と明らかになりました。現代日本人の祖先人口集団におけるゲノム規模SNPのアレル(対立遺伝子)頻度の推定は、それぞれの生計に適応的な表現型の特徴を示唆しました。本論文はこれらの調査結果に基づいて、現在の日本列島の人口集団の遺伝子型と表現型の段階的変化配について形成モデルを提案します。
●研究史
現代の日本人集団は、3つの主要な人口集団で構成されています。それは、おもに北海道に住むアイヌと、おもに沖縄県に住む琉球人と、本州・四国・九州【およびそのごく近隣の島々】に住む本土日本人です。日本人集団の形成過程に関する今では確立した理論である二重構造モデルは、埴原和郎の形態学的知見(1991年)に基づいて提案されました。このモデルでは、日本人は、縄文時代(16500~2800年前頃)に日本列島に暮らしていた新石器時代【本論文は縄文時代を新石器時代に区分しますが、異論があるとは思います】狩猟採集民である縄文人と、弥生時代開始の頃(2800年前頃)にアジア東部大陸部から稲作農耕技術とともに日本列島に到来した移民との間の混合に由来する、と仮定されます(関連記事)。大陸からの移民の稲作農耕慣行はその後、日本全体に拡大し、古代日本社会に大きな変容をもたらしました。
二重構造モデルによると、日本列島本土と比較して、アイヌと琉球の人口集団は遺伝的に移民による影響が小さかったことになります。遺伝学的研究は二重構造だけではなく、日本列島の詳細な人口史も明らかにしました(関連記事)。縄文人遺骸から抽出された全ゲノム解析から、縄文人は他のアジア東部人と高度に区別され、アジア東部および北東部人の基底部系統を形成する、と示されました(関連記事)。縄文時代個体群と他のアジア東部人との間の遺伝的関係から、縄文人の祖先人口集団はアジア南東部からアジア東部へと沿岸経路を通ったかもしれない最初の波の移民の一つである、と示唆されます(Gakuhari et al., 2020、関連記事)。
縄文人は遺伝的にアイヌおよび琉球人口集団と密接に関連しており、本土日本人で見られるゲノム構成要素の10~20%が縄文人に由来することも明らかにされました(Kanzawa-Kiriyama et al., 2019、関連記事)。最近の研究では、中国の漢人と密接に関連している「アジア東部人」集団に加えて、「アジア北東部人」集団も現代日本人の祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)に寄与した、と分かりました(Cook et al., 2021、関連記事)。「アジア東部人」と「アジア北東部人」を含む大陸部人口集団からの縄文人の深い分岐が示されたので(Cook et al., 2021)、現代の本土日本人は基底部アジア東部系統(つまり縄文人)と大陸部アジア東部人に由来するゲノム構成要素を有する人口集団である、と結論づけることができます。本論文はCook et al., 2021により特定された2つの大陸部祖先人口集団を、区別が必要ではない限り、まとめて「大陸部アジア東部人」と呼びます。
二重構造モデルは、日本列島の人口集団の形成史に関する有力な仮説です。しかし、日本人集団における地域的差異の形成過程は、長きにわたって確立してきた二重構造モデルによりまだ完全には説明されていません。いくつかの研究は、形態学的特徴および古典的な遺伝学的指標の東西の勾配を指摘し、埴原和郎は、「日本の東西間の現在の違いは縄文時代と弥生時代に由来する可能性が高い」と述べながら、これらの研究を参照しました。最近、いくつかの研究は、ゲノム規模での日本列島の人口集団間のゲノムの地域的差異を論証してきました(Watanabe et al., 2021、関連記事)。
とくに、日本列島全体からの日本人標本の大規模な収集を用いて、東北と関東と九州の人口集団が遺伝的に琉球の人口集団とより密接に関連しているのに対して、近畿と四国の人口集団は大陸部アジア東部の人口集団とより密接に関連している、と先行研究では示されてきました(Watanabe et al., 2021)。日本人の表現型を定義する遺伝的要素にも、地域的な段階的変化があるようです。2021年の研究では、身長の多遺伝子得点(polygenic score、略してPS)が、中国の漢人とより密接に関連している本土日本人ではより高かった、と明らかにしました。
したがって、遺伝的および表現型の特徴における地域差が日本人には存在し、「中国の漢人との遺伝的関連性の程度」により定義されると推測されます。本論文は埴原和郎とその後の人類学者によるこれらの推測を、以下の仮説に要約できます。つまり、現代の本土日本人における遺伝的な地域差は、縄文時代後期から弥生時代にかけての縄文人と大陸部アジア東部からの移民の混合割合の地域的な地理的違いにより起きています。この仮説を検証するため、本論文は現代の日本列島の人口集団における「縄文由来多様体」に焦点を当てました。
2つの供給源人口集団の混合に由来する人口集団では、異なる供給源人口集団のハプロタイプ間の組換えが、混合事象後に必然的に起きました。結果として、2つの祖先人口集団に由来するハプロタイプは、混合人口集団の染色体に斑状に存在し、各祖先人口集団に由来するハプロタイプにおけるアレルは、相互と連鎖不平衡(linkage disequilibrium、略してLD)にあるもと予測されます。この研究は、祖先系統標識指標(ancestry marker index、略してAMI)という要約統計量を用いて手法を開発し、現代の本土日本人における縄文人に由来する祖先系統標識多様体(つまり、縄文由来多様体)を検出します。
AMIの重要な特徴は、縄文人の骨格標本から得られたゲノムを必要としないことです。AMIは、古代型人類【絶滅ホモ属、非現生人類ホモ属】と初期ユーラシア人の混合事象に由来すると推測された出アフリカ人口集団における特定のSNPを用いて、古代型人類に由来するハプロタイプの検出に使われた、S∗からの着想で開発されました。縄文人は他のアジア東部の人口集団と高度に区別されるので、日本人以外の現在のアジア東部人口集団で見られない固有の多様体を有していた、と予測されます。したがって、現代の本土日本人も縄文人に由来する特定の多様体を有している可能性が高そうです。AMIは、日本人に固有の多様体間のLDに基づいて、縄文由来多様体を検出します。
本論文は、日本人集団のゲノムデータからの縄文由来多様体の抽出に成功しました。本論文は、縄文祖先系統の程度および遺伝的指標の代理として縄文由来多様体を用いて包括的分析を行ない、骨格遺骸の形態学的特徴からは明らかではなかった、現代日本人の祖先系(縄文人祖先系統と大陸部アジア東部祖先系統の混合)の多遺伝子性特徴を推定します。これにより、遺伝的および表現型の地域的な段階的変化が日本人で起きた機序を解明できるようになります。本論文は、そうした調査結果に基づいて、日本列島における現在の地域的な人口集団の形成についてモデルを提案します。
●祖先系統に由来する多様体を検出するための要約統計量である祖先系統標識指標の開発
まず、古代型祖先系統の特定に最も広く用いられている統計の一つであるS∗は縄文由来ゲノム構成要素の検出にも使える、と考えられました。しかし、合着(合祖)模擬実験から、現代日本人の人口史の仮定下では不可能だった、と明らかになりました。S∗は混合に由来する多様体が完全なLD(決定係数であるr²=1)で存在するゲノム構成要素ではより高い値を取り、そうしたゲノム構成要素は「混合に由来するゲノム構成要素」として検出されます。しかし、複数の縄文由来多様体が相互と完全なLDにある縄文由来ゲノム構成要素は、模擬実験ではほとんど生成されませんでした。そうした構成要素は、2つの人口集団間の分岐後の期間が、現生人類(Homo sapiens)と古代型人類【絶滅ホモ属、非現生人類ホモ属】の場合のように長ければ、豊富でした。
結論として、他のアジアの人口集団からの縄文人の分岐後の期間(つまり、数万年前)が、現生人類と古代型人類の分岐後の期間(つまり、数十万年前)よりずっと短かったので、S∗は縄文由来多様体の検出に適していませんでした。したがって、この研究は新たな要約統計量であるAMIを開発し、縄文由来の多様体(1型)を日本人固有の多様体の他の型、つまり大陸部アジア東部人の多様体(2型)と【縄文人と弥生時代以降に大陸部アジア東部から到来した集団との】混合後の日本人系統における新たな多様体(3型)から区別しました(図1)。以下は本論文の図1です。
AMIは、現代日本人の祖先人口集団の一部である縄文人が、他の大陸部アジア東部人口集団と遺伝的に高度に区分され、現代日本人は他のアジア東部人口集団では観察されない縄文系統(1型)で蓄積された固有の多様体を継承してきた、という発想に基づいて開発されました。第一段階は、縄文人と非縄文人の祖先系統の分岐後に非縄文人祖先系統において出現した多様体を削除するため、現代日本人に固有の多様体を抽出することでした。次の段階で、AMIが計算され、縄文由来多様体が日本人固有の多様体の他の型から区別されました。
縄文由来多様体(1型)以外の日本人交友の多様体には2種類あります。一方の多様体(2型)は大陸部アジア東部人に由来し、大陸部アジア東部人系統で出現し、混合を通じて日本人系統に移ったものの、アジア東部人口集団では最終的には失われました。もう一方は新規多様体(3型)で、混合後日本人系統でのみ出現しました(図1)。これら日本人固有の多様体のうち、縄文由来多様体(1型)は、同じハプロタイプに蓄積されるか、あるいは相互にLDにある、と考えられます。換言すると、1型の多様体は2型および3型と比較してLDにおいてより多くの多様体の組み合わせを有する、と予測されます。
AMIを計算するため、まず日本人固有の多様体の組み合わせ間でLD係数r²が計算されました。AMIは、r²が1000塩基対ごとの特定の多様体の密度により割った焦点の日本人固有の多様体について切断値を超過する多様体の数です。AMIを計算すると、より多くの日本人固有の多様体を伴うLDにおける多様体は、縄文由来多様体(1型)として区別されるでしょう。AMIの有用性を確認するため、縄文人と大陸部アジア東部人の混合を仮定する合着(合祖)模擬実験が実行されました。100万塩基対模擬実験では、日本人固有の多様体(1型と2型と3型)は各系統から抽出され、AMIが各日本人固有の多様体について計算されました。AMIの分布から、縄文由来多様体(1型)は他の日本人固有の多様体(2型および3型)よりもAMI値が大きい、と示されました(図2A)。以下は本論文の図2です。
受信者操作特性(Receiver operating characteristic、略してROC)分析では、縄文由来多様体(1型)はAMIにより他の日本人固有の多様体(2型および3型)と区別できる、と示されました。カットオフ値の指標となるユーデンインデックスは28.0374であった。切断値の測定であるヨーデン(Youden)指標は28.0374でした。0から0.8までr²閾値を変化させることによるROC分析が実行され、曲線下面積(Area Under the Curve、略してAUC)値が計算され、r²における違いに起因する検出能力の違いが調べられました。1型は0で検出できず、0.01と0.2の間の検出能力にほぼちがいはなく、検出能力はr²が0.2を超過すると低下する、と分かりました。縄文人と他の大陸部アジア東部人の分岐時間や、有効人口規模や、現在の日本人集団における縄文祖先系統の割合を変えることにより、さらに模擬実験が実行され、さまざまな人口史へのAMIの堅牢性が確認されました。ヨーデン指標の値は仮定された人口史に依存して異なりますが、縄文由来多様体は正確に検出できました。
●実際のデータにおける縄文多様体の検出
両アレルのSNPにのみ焦点が当てられ、縄文由来多様体が検出されました。韓国個人ゲノム計画(Korean Personal Genome Project、略してKPGP)の韓国人87個体(関連記事)と、1000人ゲノム計画(1000 Genome Project、略して1 KG)の世界規模の26人口集団のデータセットを用いて、約170万のSNPが本土日本人に固有と分かりました(1 KG JPT、JPTとは東京の日本人)。これら170万のSNPのうち、AMI閾値を超える208648が縄文由来多様体とみなされました。縄文由来多様体はゲノム全体に分布していました。
縄文由来多様体の検出精度を調べるため、縄文時代の2個体、つまり北海道の礼文島の船泊遺跡の3800年前頃の個体(Kanzawa-Kiriyama et al., 2019、F23)および愛知県田原市の伊川津貝塚遺跡の2500年前頃の個体(Gakuhari et al., 2020、IK002)と、本土日本人104個体について、縄文由来多様体に基づいて縄文アレル得点(Jomon allele score、略してJAS)が計算されました。縄文由来多様体がAMIにより適切に検出されたならば、IK002もしくはF23のJASは本土日本人よりも高いと予測されます。JPT人口集団のうち、NA18976は主成分分析(principal component analysi、略してPCA)により大陸部アジア東部人の方と遺伝的に近い、と明らかになり、JASはより低いと予測されました。JASの分布は補足データの補足図9に示されます。
NA18976を除く本土日本人103個体の平均JASは0.0164でした。予測されたように、NA18976のJASは他の本土日本人個体よりもずっと低い最低(0.00269)でした。IK002とF23のJASはそれぞれ0.0523と0.0555で、縄文由来多様体が現代の本土日本人個体群よりも縄文人の方でより頻繁に見つかりました。これらは、AMIが縄文時代の人口集団に由来するSNPを検出できる、と示唆します。JASは縄文時代のIK002とF23の両個体についてさえ、約5%にすぎないことに注意せねばなりません。これは、現代日本人個体群のAMI分析から得られた縄文固有多様体の数が、単一の縄文時代個体の全ゲノム配列から得られたものの数十倍だったことを示唆します。
●JASの縄文由来多様体を用いての本土日本人における地域・都道府県別の地域的な遺伝的違いの検出
本土日本人における地域的差異についての本論文の仮説を検証するため、地域人口集団の遺伝学的分析(Watanabe et al., 2021)で以前に用いられた日本人10842個体の3917の縄文由来多様体の補完された遺伝子型から、各地理的地域と都道府県について平均JASが計算されました。明治時代以後(1868年以後)の日本人の移住により大きく影響を受けた北海道の標本を除去し、合計10412点の標本がその後の分析に用いられました。北海道を除く各都府県の標本は10地域に区分されました。それは、東北と関東と北陸と中部と東海と近畿と中国と四国と九州と沖縄で、1979年の研究と一致します。詳細な地理的区分は以下の補足図1に示されます。
これら10地理的地域のJASは、図3Aと補足表3に示されます。JASは沖縄において最高で(0.0255)、続いて東北(0.0189)と関東(0.018)で、最低は近畿(0.0163)で、それに続くのが四国(0.016)でした。都道府県規模では、本土日本の平均JASは、最北端および最南端に位置する都道府県で高くなる傾向にありました(図3B)。JASは東北地方の青森県(0.0192)と岩手県(0.0195)と福島県(0.0187)と秋田県(0.0186)、および九州地方の鹿児島県(0.0186)でとくに高かった、と示されました。興味深いことに、島根県のJAS(0.0184)は東北地方や鹿児島県のJASとほぼ同じで、沖縄や九州の個体群と出雲の個体群との遺伝的類似性(関連記事)と一致します。これらの県の日本人個体群は、他の都府県の個体群よりも多くの縄文由来ゲノム構成要素を有している、と考えられます。
より低いJASの都府県は近畿地方と四国地方に位置し、和歌山県(0.0157)と高知県(0.016)と徳島県(0.0161)と三重県(0.0161)が含まれます。これらの人口集団は大陸部アジア東部人に由来するゲノム構成要素をより多く有している、と考えられます。各都府県のJASと、各都道府県の常染色体の183708のSNPのアレル頻度による先行研究のPCAから得られた主成分1(principal component 1 、略してPC1)値は、図3Cに示されます。JASはPC1と強く相関しました。その地理的分布は、AMIによる縄文人由来多様体の検出について、より厳密な切断値(AMIが100超)によっても変わりませんでした。以下は本論文の図3です。
JASの地域差は縄文時代における人口規模の地域的違いに関連していた、と推測されました。したがって、JASと縄文時代の人口規模に関連する3指標との間の相関が調べられました。その3指標とは、日本の文化庁の埋蔵文化財関係統計資料から得られた遺跡数、縄文時代後期の遺跡数から推定された人口規模、常用対数(弥生時代の遺跡数を縄文時代後期の遺跡数遺跡数で割った数)です。JASと各地域の人口規模との間の正の相関と、JASと縄文時代後期から弥生時代への人口成長率との間の負の相関から、縄文時代におけるより小さな人口規模と、現代の本土日本人におけるより低いJAS(つまり、大陸部アジア東部からの市民のゲノム構成要素のより高い寄与)が示唆されます。
さらに、2つの異なるモデルaとbの構築により炭化米遺骸の放射性炭素年代測定に基づくベイズ技術を用いて稲作農耕の到来年代を推定した、先行研究が参照されました。その研究では、稲作農耕が九州北部に到達した後、近畿と四国に九州南部よりも早く到達した、と示唆されており、これは近畿と四国におけるJASの低水準と一致します。各地域におけるJASと稲作農耕の到来年代との間の関係から、JASがより低いと、稲作農耕の到来がより早かった、と示唆されました。要するに、地域的な現代日本人集団間の遺伝的な段階的変化は、おもに縄文人の混合割合の違いにより起きており、恐らくは縄文時代末期から弥生時代にかけての各地域における人口規模の違いに起因する、と結論づけられます。
●縄文由来ハプロタイプによるアレル頻度推定は縄文と大陸部アジア東部祖先系統の表現型の特徴を明らかにします
縄文時代個体群のゲノムを用いずに、大陸部人口集団との混合に先行する、現代日本人の祖先である縄文人におけるゲノム規模SNPのアレル頻度を推定する手法が考案されました。焦点となるSNPの周辺の現代日本人のハプロタイプは、縄文由来多様体の存在に応じて、「縄文由来ハプロタイプ」と「大陸部ハプロタイプ」に分類できます。焦点となるSNPにおける縄文人のアレル頻度は、縄文由来ハプロタイプ内の各アレルの割合により推定できます。現代日本人の大陸部祖先系統のアレル頻度は、大陸部ハプロタイプ内の各アレルの割合です。
現代日本人413個体のゲノムを用いて(Tokyo Healthy Control、略してTHCデータセット)、現代日本人の縄文および大陸部祖先系統(「THC」縄文祖先系統と「THC大陸部祖先系統」)における6481773のSNPにこの研究で開発された手法が適用され、アレル頻度が推定されました。THC祖先系統のアレル頻度は、以前に報告された(Kanzawa-Kiriyama et al., 2019、Gakuhari et al., 2020、Cooke et al., 2021)古代人(縄文時代11個体と古墳時代3個体)のゲノムとTHCの現代日本人および北京の漢人(CHB)集団のゲノムを用いて検証されました(図4)。本土日本で発掘された1400~1300年前頃となる古墳時代の個体群は、現代日本人個体群と類似した縄文祖先系統の割合を有しています(Cooke et al., 2021)。
まず、ヨルバ人を外群として仮定した対でのf3が、THC縄文祖先系統の割合のアレル頻度が実際の縄文時代個体群のアレル頻度と類似しているのかどうか、という検証に用いられました(図4)。先行研究の各縄文時代個体とのTHC縄文祖先系統のf3値は、古墳時代と現代日本人と現代漢人の個体群のf3値より高い(f3が0.04超)、と示されました。THC縄文祖先系統と縄文時代個体群について計算されたf3値は、縄文時代個体群の組み合わせのf3値と同等でした(図4)。これらの結果から、THC縄文祖先系統は実際の縄文時代個体群に遺伝的に近く、現代日本人で見られる縄文由来ハプロタイプを用いての縄文人のアレル頻度推定に成功できた、と示唆されます。これらの結果は、本論文で抽出された現代日本人における縄文由来多様体が縄文人に由来する、という強い確信も提供します。以下は本論文の図4です。
日本人の祖先人口集団の表現型の特徴を推定するため、以前のゲノム規模関連研究(genome-wide association study、略してGWAS)結果が、THCの現代日本人と縄文人および大陸部の祖先系統のゲノム規模SNPのアレル頻度と組み合わされました。各人口集団のアレル頻度について、平均2βf値が計算されました。2βf値は、GWASのp値が設定された閾値(0.01と0.001と0.0001)より低い各SNPについて、有効アレル頻度の2倍に有効規模を乗じて計算され、ゲノム規模のSNPに対する平均2βfにより、その形質について特定の人口集団における平均的な表現型を評価できるようになります。平均2βf値は焦点となる人口集団内の平均的な多遺伝子得点(polygenic score、略してPS)に相当します。
以前の量的形質遺伝子座(quantitative trait locus、略してQTL、特定の表現型と統計学的に関連するゲノムの領域)GWASにおける60の形質について、平均2βf値が計算されました。まず、現代THC日本人に焦点が当てられ、現代日本人における60すべての形質についての平均2βf値は、大陸部祖先系統に近かった、と示されました。混合人口集団における祖先系統の割合から得られた人口集団頻度の偏差は、混合事象後の正の自然選択の兆候である、と知られています。THCの現代日本人の平均2βf値は、日本の人口集団における大陸部祖先系統の高い割合(80~90%)を反映しており、縄文祖先系統の表現型が自然選択に起因して現在の日本人において優勢になった可能性は低いようです。
次に、縄文と大陸部の祖先系統間のとくに大きな違いがある形質を特定するため、模擬実験から得られた帰無分布に基づいてD統計が計算されました。Dの絶対値がより大きいほど、縄文と大陸部の祖先系統間の表現型の違いがより有意になる、と推測できます。平均2βfがTHC大陸部祖先系統よりもTHC縄文祖先系統でより大きい場合、Dは正の値です。各形質のD値はGWASのp値閾値に応じて変わり、図5Aと補足表5に示されます。以下は本論文の図5です。
極端なD値を示した形質は、GWASのp値閾値に応じてわずかに異なりました。これは、p値閾値が厳密に設定された場合、比較的小さな有効規模のSNPの多遺伝子効果が除去され、より大きな有効規模の数点のSNPが強調されるかもしれないからです。たとえば、厳密なp値閾値を設定すると(0.001超と0.0001超)最高のD値を示す中性脂肪(形質識別番号はTG)については、TGが有意に増加する11番染色体上のZPR1遺伝子の非翻訳領域(UTR)3′末端の遺伝子座(rs964184)のC(シトシン)/G(グアニン)があります。THC縄文祖先系統におけるG(グアニン)アレル頻度は94%で、THC現代日本(28%)および大陸部(18%)の祖先系統のアレル頻度や、1 KGの現代の人口集団のアレル頻度よりも顕著に高くなっています。具体的には、アフリカ(AFR)では22%、ヨーロッパ(EUR)では16%、アジア南部(SAS)では23%、アジア東部(EAS)では24%、アメリカ大陸(AMR)では28%です。
次に、極端なD値が得られた以下の形質に焦点が当てられました(図5A)。それは、正のD値については中性脂肪(形質識別番号はTG)と血糖(形質識別番号はBS)、負のD値については身長(形質識別番号はheight)とC反応性タンパク(形質識別番号はCRP)と好酸球算定(形質識別番号はEosino)です。これらのD値から、縄文祖先系統では、遺伝的にはより低身長で、中性脂肪と血糖の水準がより高水準だったのに対して、大陸部祖先系統では、遺伝的に身長がより高く、CRPと好酸球算定がより高かった、と推測されました。身長に関して、本論文の結果はひじょうに説得力があります。それは、いくつかの以前の形態学的研究では、縄文人は弥生時代や古墳時代の人々など、大陸部アジア東部から移住してきた人々よりも低身長だった、と示唆されたからです。
THCの縄文と大陸部の祖先系統間でひじょうに異なっていた他の形質に関しては、正のD値のある形質が栄養状態に関連しているのに対して、負のD値は感染症への抵抗性に関連しているようでした。これらの表現型の特徴は、それぞれの生計に遺伝的に適応していたようです。縄文人が、その狩猟採集生活様式において高水準の中性脂肪と血糖を維持する必要があったかもしれないのに対して、大陸部アジア東部人口集団は、農耕生活様式における感染症への抵抗性を高める必要があったかもしれません。より詳しい説明は以下の考察の項目で提供されます。
2021年の研究では、身長のPSは日本の各都道府県の人口集団の平均身長と相関しており、中国の漢人と遺伝的に密接に関連している人口集団は、現代日本における地域的な人口集団間の身長についてより小さなPSを有している、と示唆されました。この先行研究の調査結果と、大陸部祖先系統は遺伝的により高身長である、という本論文の調査結果を組み合わせると、日本列島の身長の地域差は、より低身長の遺伝的要素を有する縄文人と、より高身長の遺伝的要素を有するアジア東部人の祖先系統の割合に起因していた、と強く主張できます。
本論文は、日本列島の地域的な人口集団間の身長の差異に加えて、祖先系統の割合の地域差が中性脂肪/血糖および好酸球算定との関連で現代日本人の表現型で地域的な多様性に影響を及ぼした事例を報告します。本論文は、本土日本人集団における、中性脂肪および血糖と関連する5歳児での肥満率と、好酸球と関連する喘息悪化の発生率の地域差に焦点を当てます。好酸球は現在の人口集団において、喘息などアレルギー性炎症と強く関連しています。日本人集団における好酸球算定に関する以前のGWASによると、好酸球算定は喘息の危険性と有意な遺伝的相関を有しています。各都道府県についての平均JASと5歳児の肥満率(2021年度学校保健統計調査)との間の関係は図5Bに提示され、喘息悪化の発生率は図5Cに示されます。JASと上述の指標との間には有意な相関が見つかり、現代日本人の表現型におけるこれらの地域差は縄文祖先系統の割合の違いによりほぼ決まる、と示唆されます。
●考察
縄文人からのゲノム配列なしに、現代の日本人集団において縄文由来多様体を検出するための要約統計量として、AMIが開発されました。コンピュータ模擬実験では、供給源人口集団が数万年前に分岐した混合人口集団でさえも、AMIは祖先多様体を構成度で検出できる、と示されました。模擬実験において人口史を変えてさえも、AMIを用いて縄文由来多様体を検出できました。日本列島の人口集団の進化史にはやや議論の余地がありましたが(Cooke et al., 2021および関連記事)、その人口史が正しいとしても、AMIを用いてのこの手法は、縄文由来SNPの研究を可能とします。さらに、この手法は、供給源人口集団が比較的最近分岐した他の混合人口集団にも適用できます。現生人類の遺伝的多様性は、人口集団の混合事象により大きく影響を受けます(関連記事)。AMIは日本人だけではなく他の混合人口集団の人口史にとっても、強力な手法となるでしょう。
本論文は、この研究における合着模擬実験に基づくヨーデン指標を用いて、AMIの閾値を決定しましたが、各人の研究目的にしたがって閾値を設定できることに注意すべきです。偽陽性を減らしたいならば、閾値を厳密に設定でき、偽陰性を減らしたいならば、閾値を緩く設定できます。実際には、AMIの閾値は必ずしも、人口史を仮定する模擬実験に基づいて設定される必要はありません。現代日本人の地域比較では、日本の各都道府県の人口集団における全ゲノムの傾向を把握するため、できるだけ多くの縄文由来多様体を選択するよう閾値は緩く設定されました。しかし、現代日本人の縄文由来ハプロタイプによる縄文人のアレル頻度推定では、閾値は厳密に設定され、それは、縄文由来多様体の偽陽性が縄文由来ハプロタイプ頻度の誤った推定につながるかもしれないからです。
本論文は、その起源に基づいて現在の人口集団のハプロタイプを分類することによる、祖先人口集団についてのアレル頻度推定手法を提案します。本論文は、THC縄文および大陸部祖先系統から得られたアレル頻度を以前のGWASの結果と組み合わせることで、日本人の祖先人口集団が特徴的な表現型を示してきたと推測される、いくつかの形質を報告しました。具体的には、身長、中性脂肪、血糖、CRP、好酸球算定です。身長に関しては、形態学的分析は縄文人の低身長を示唆し、2021年の研究では、日本列島の地域的な人口集団では、中国の漢人と遺伝的に密接に関連している人口集団は身長についてより大きなPSを有していた、と分かりました。これら先行研究は、縄文人が大陸部祖先系統の人々よりも遺伝的に低身長だった、という本論文の調査結果を裏づけます。
中性脂肪と血糖について本論文は、大陸部祖先系統よりも縄文祖先系統でより高い水準を推測しました。日本列島の人口集団の食性は大きく変わったようで、縄文時代後期以後の大陸部アジア東部人による稲作の導入に伴って、農産物への依存度が高まりました。弥生時代には、作物からの炭水化物摂取量が増加し、それは虫歯の発症率上昇など、弥生時代の日本列島の人口集団に影響を及ぼしました。これらの先行研究に基づいて、栄養状態に関する縄文人の遺伝的特徴は、以下のように上手く説明できました。「倹約遺伝子仮説」を参照し、現代日本人の縄文人祖先は、稲作農耕の大陸部アジア東部人の祖先よりも食料採集での中性脂肪および血糖の維持がより困難だったかもしれないので、中性脂肪と血糖のより高水準の遺伝的要素が役立ったでしょう。
CRPと好酸球算定に関しては、大陸部祖先系統の方が縄文祖先系統よりもCRPと好酸球算定が多かった、と分かりました。CRPは、細菌感染に対する防御で重要な役割を果たすパターン認識分子です。好酸球算定は、蠕虫類感染への応答において重要な役割を果たす、さまざまな白血球細胞と免疫体系構成要素です。一般的に、農耕はより高い人口密度、定住化、近隣の人口集団との接触につながり、野営地外の移動を減少させ、毒性の真正細菌や蠕虫類の拡大およびこれら病原体へのより多くの曝露をもたらします。現代の日本人集団の大陸部アジア東部人の祖先は、稲作農耕を始めて日本列島へと移住し、縄文人の祖先と比較して真正細菌や蠕虫類など病原体への抵抗性を高める必要があり、CRPと好酸球算定を増加させる遺伝的要素を獲得しました。この見解は、考古学および進化学的研究により裏づけられます。日本列島の最初の骨格の結核は、弥生時代後期(2000年前頃)の青谷上寺地遺跡(鳥取県鳥取市青谷町)で確認されました。その研究では、日本列島における大陸部からの移民は結核を広めた、と論じられ、「一次結核症は(中略)先史時代の縄文人に深刻な被害と、その先住人口集団の急速な減少をもたらした」と述べられました。
蠕虫類感染症については、住血吸虫である日本住血吸虫(Schistosoma japonicum)のミトコンドリアDNA(mtDNA)の系統発生分析が、稲作農耕の起源地である長江中流および下流からアジア東部のさまざまな地域への、稲作農耕文化の拡大を伴う1万年前頃となる日本住血吸虫の拡散を示唆しました。1995年の研究では、多くの鞭虫の検出にも関わらず、三内丸山遺跡では土壌標本で回虫の卵が見つかりませんでした。したがって、2003年の研究では、回虫感染症は弥生時代以後に稲作の開始とともに発生した、と主張されました。大陸部からの移民が、縄文時代の狩猟採集民と比較して、感染症への耐性を示すアレルへの多遺伝子性選択を通じて農耕生計に遺伝的に適応していた、ということを考えると、本論文の結果はひじょうに説得力があります。
本論文では、祖先系統の割合における違いが現代日本人において肥満と喘息悪化の地域差に顕著な影響を及ぼすことも分かりました。これらの地域的な表現型の差異を、縄文人と大陸部の祖先間で有意な違いを示した中性脂肪や血糖や好酸球算定と組み合わせると、あり得るシナリオは以下の通りです。縄文時代の狩猟採集民にとって、中性脂肪と血糖の水準上昇が飢餓への耐性に重要だったのに対して、大陸部アジア東部農耕民にとって、CRPと好酸球算定の増加は感染症への防御にとって重要でした。大陸部アジア東部農耕民は縄文時代後期と弥生時代に、稲作農耕技術を用いて日本列島へと移住し、在来の縄文狩猟採集民との大規模な交雑をもたらしました。縄文人の高い祖先系統の割合を有する現在の日本列島の地域的な人口集団は、より高い中性脂肪と血糖の遺伝的要素を保持しており、肥満の危険性がより高くなります。対照的に、大陸部アジア東部人の高い祖先系統の割合を有する地域的な人口集団は、好酸球算定を増加させる遺伝的要素を有しており、喘息悪化の危険性がより高くなります。現代日本人における肥満と喘息の発症率の地域的な段階的変化は、大陸部アジア東部人の祖先系統の割合における地域差に起因していました。
本論文は全体的に、ゲノム規模のアレル頻度と縄文人および大陸部の祖先の平均2βfを有する調査結果に基づいて、以下の3点を結論づけることができます。(1)縄文人と大陸部アジア東部人のいくつかの表現型はゲノム規模では高度に分岐していました。(2)いくつかの表現型の違いは、縄文人と大陸部アジア東部人のそれぞれの生計への遺伝的適応の結果だったかもしれません。(3)縄文人と大陸部アジア東部人の混合割合の地域差は、現在の日本列島の人口集団の表現型の段階的変化を形成しました。現代の日本人個体群における他の形質の将来のGWASを縄文祖先系統の割合のアレル頻度と統合することにより、発掘された骨格の形態では現れない表現型の特徴が明らかになるでしょう。おそらく、身長や肥満率や喘息悪化の事例のように、混合割合の違いに起因する、現代日本人の表現型におけるさらなる地域的な段階的変化の発見も可能です。
縄文時代後期から現在までの日本列島における人口集団の形成過程に関して、本論文は図6に示されるモデルを提案します。縄文時代後期から晩期にかけて、縄文時代狩猟採集民が本土日本に定住していました。縄文時代狩猟採集民は比較的低身長の人口集団で、飢餓への耐性のためのより高水準の中性脂肪と血糖など、狩猟採集生活様式に適応した遺伝的要素を有していました。縄文人の人口規模と人口密度は地域により異なっており、東北と九州では比較的大きく、近畿と四国では比較的小さかった、と示されています。以下は本論文の図6です。
同時期に、稲作農耕人口集団が大陸部アジア東部に暮らしており、比較的高身長で、その生計に遺伝的に対応しており、病原体への防御のためより多いCRPと好酸球算定を有していました。縄文時代晩期に、大陸部アジア東部人が稲作農耕技術を用いて九州北部に到来し、その後で本土日本の全地域で縄文人と混合しました。弥生時代には、移民の人口規模は、縄文時代末には人口が少なかった近畿と四国で比較的多かった、と推測されます。近畿と四国では、稲作農耕は他の地域より比較的速く始まったようです。縄文時代晩期から弥生時代の人口規模の地域差は、現代の日本列島における地域間の縄文人と大陸部アジア東部人の混合割合を変えました。混合の地域差は、日本人の遺伝子型と表現型の地理的な段階的変化をもたらしました。以下は本論文の要約図です。
●この研究の限界
一般的に、遺伝子型と表現型のデータの組み合わせを用いて、PSによる表現型の予測精度を評価し、PSの解析手順として最適なp値閾値が設定されます。しかし本論文は、組み合わされた日本人集団の遺伝子型/表現型のデータセットを有していません。したがって、この研究で計算された平均2βfに基づく標的となる形質の予測精度を評価できません。図5Aは、3つの異なるp値閾値について平均2βf分析結果を示しており、どのp値がこの研究で各形質にとって最良の予測性能を有するのか、不明です。
●私見
以上、本論文についてざっと見てきました。本論文は、現代の日本人集団における遺伝的構成の地域差を、縄文人と縄文時代晩期以降に大陸部アジア東部から到来した稲作農耕民との混合割合の違いと評価し、さらにはこの現代日本人集団の主要な2祖先集団の生計への適応と関連した、表現型の違いへの遺伝的影響を推測します。現代日本人集団における縄文人の遺伝的影響の地域差の大規模な調査など、本論文は今後の日本人起源論で参照されるべき重要なデータと見解を提示しており、たいへん注目されます。
また、当然ではありますが、ゲノムが解析された古代人は当時存在した人口のごく一部にすぎず、実際の人口集団の遺伝的多様性を充分には把握できません。したがって、本論文で提示された手法は、祖先人口集団から現代の人口集団への遺伝的影響を詳しく調べるうえで有効となるでしょう。本論文の手法は、現代の人口集団の複数の祖先人口集団間の分岐が過去数万年以内と比較的新しい場合でもかなり有効と考えられる点でもたいへん注目され、今後の研究の進展が期待されます。
本論文は、現代日本人集団における縄文人の遺伝的影響の地域差の要因として、縄文時代晩期の人口密度を指摘します。縄文時代後期~晩期には西日本の人口密度は低く、それが近畿と四国の現代人集団における縄文人の遺伝的影響の相対的な低さにつながっているのではないか、というわけです。しかし、古墳時代の四国と近畿の個体のじっさいのゲノム解析結果から、この説明には疑問が残ります。香川県高松市の高松茶臼山古墳の被葬者(茶臼山3号)のゲノムにおける縄文人的構成要素の割合は東京の現代日本人(JPT)よりもやや高く(関連記事)、和歌山県田辺市の磯間岩陰遺跡の古墳時代の2個体については、そのゲノムにおける縄文人的構成要素の割合は52.9~56.4%および42.4~51.6%と推定されており、JPTよりもかなり高いことになります(関連記事)。
近畿と四国の現代人集団における縄文人の遺伝的影響の低さは、古墳時代から飛鳥時代にかけての朝鮮半島からの渡来民、および奈良時代以降の歴史的過程も考慮しなければならないかもしれません。また、縄文時代晩期や弥生時代に朝鮮半島から日本列島へと到来した人々と、古墳時代以降に朝鮮半島から日本列島へと到来した人々では、遺伝的構成に違いがあるかもしれません(Cooke et al., 2021)。そうした可能性も考慮して、日本人の形成過程を検証しなければならないでしょう。
また本論文では、図6および要約図を見ると、日本列島の縄文時代後期には、日本列島にはゲノムが完全に縄文人的構成要素で占められている人口集団が、朝鮮半島にはゲノムが完全に大陸部アジア東部祖先系統で占められている集団が存在し、縄文時代後期以降に朝鮮半島から日本列島への人口移動があり、現代日本人集団が形成されていった、と想定されているようです。確かに、縄文時代の日本列島の人々は、時空間的に広範囲にわたって遺伝的に均質だった可能性が高そうです(関連記事)。
しかし、朝鮮半島ではゲノムがほぼ縄文人的構成要素で占められている新石器時代の個体や、ゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の個体も複数確認されています(関連記事)。さらに、朝鮮半島南岸では、三国時代の伽耶でもゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の個体が確認されていることから、新石器時代から三国時代まで、ゲノムにおける縄文人的構成要素の割合が現代日本人と同等以上の集団が存続していた、という可能性も指摘されています(関連記事)。ただ、この間の朝鮮半島南岸の人類のゲノム解析結果が公表されていないようなので、ゲノムにおける縄文人的構成要素の割合が新石器時代から三国時代まで存続したのか、断定はできないと思います。つまり、朝鮮半島南岸の個体群において、新石器時代以降に一度はゲノムにおける縄文人的構成要素がほぼ駆逐され、古墳時代の日本列島から改めてもたらされた可能性も考えられる、というわけです。
その可能性はさておき、朝鮮半島南岸の新石器時代個体群のゲノムにおけるJPTよりも高い縄文人的構成要素の割合を考えると、現代日本人集団のゲノムにおける縄文人的構成要素の全てが縄文時代後期~晩期の日本列島の個体群に由来するとは断定できず、縄文時代晩期もしくは弥生時代以降に朝鮮半島からもたらされた割合が一定以上ある可能性は低くないように思います。そうすると、たとえば現代日本人集団について、青銅器時代西遼河人口集団(92%)と縄文人(8%)の2方向混合としてモデル化できる、と推測した研究もありますが(関連記事)、縄文時代後期~晩期の日本列島の個体群に由来する割合が5%未満の可能性も考えられるわけで、仮にそうだとしたら、縄文時代と現代との間で日本列島の人類集団では遺伝的にほぼ全面的な置換が起きたことになります。まあ、現代日本人集団のゲノムにおける縄文人的構成要素の割合が平均して8%程度だとしても、全面的な置換に近い、と言えそうですが。
弥生時代の日本列島の人類集団については、現時点での知見(関連記事)からは、本論文で云うところの大陸部アジア東部的構成要素と縄文人的構成要素の割合に個体間で大きな違いがある、と言えそうです。おそらくこの推測は、今後古代ゲノム研究が進展しても覆らないでしょう。あるいは、弥生時代は日本列島の人類史上で最も遺伝的異質性の高い時代だったかもしれません。上述の磯間岩陰遺跡の古墳時代の2個体のゲノム解析から、この傾向は古墳時代にもある程度続いていた可能性が低くなさそうで、地域差も含めて現代日本人集団の基本的な遺伝的構成の確立は、少なくとも平安時代まで視野に入れる必要があり、さらに言えば、中世後期に安定した村落(惣村)が成立していくこととも深く関わっているのではないか、と現時点では予測しています。
参考文献:
Cooke H. et al.(2021): Ancient genomics reveals tripartite origins of Japanese populations. Science Advances, 7, 38, eabh2419.
https://doi.org/10.1126/sciadv.abh2419
関連記事
Gakuhari T. et al.(2020): Ancient Jomon genome sequence analysis sheds light on migration patterns of early East Asian populations. Communications Biology, 3, 437.
https://doi.org/10.1038/s42003-020-01162-2
関連記事
Kanzawa-Kiriyama H. et al.(2019): Late Jomon male and female genome sequences from the Funadomari site in Hokkaido, Japan. Anthropological Science, 127, 2, 83–108.
https://doi.org/10.1537/ase.190415
関連記事
Watanabe Y, Isshiki M, and Ohashi J.(2021): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics, 66, 4, 431–437.
https://doi.org/10.1038/s10038-020-00847-0
関連記事
Watanabe Y, and Ohashi J.(2023): Modern Japanese ancestry-derived variants reveal the formation process of the current Japanese regional gradations. iScience, 26, 3, 106130.
https://doi.org/10.1016/j.isci.2023.106130
この記事へのコメント
この論文の中で縄文人由来の比率が高いとされている地域に東北地方がありますが、現在の東北地方は日本の中では比較的高身長の地域です。
https://doi.org/10.1007/s00439-021-02281-4
比較的有名な話ですし、論文執筆者はそれら先行研究はさすがに把握していると思います。
指摘の通り、朝鮮南岸の初期青銅器時代人のゲノム解析が行われ発表されていれば、それを考慮した混血モデルの構築に至っていたと思います。
朝鮮南岸の初期青銅器時代人の実勢が不明な以上、今回はあくまで形式的に埴原の二重構造説をベースに再現した、と言ったところかもしれません。
磯間岩陰古墳個体の存在に関しては、本論文の主張するところの混血モデルの否定にはなり得ないと思います。
確かに、かなり縄文的な個体が紀伊半島山間部では残存していますが、畿内古墳人の人口比で考えるとごくわずかなもので、
既に畿内地域で圧倒的な人口と出生率を擁していた現代に繋がる近畿集団に吸収されるのは時間の問題だった、、というのが本論文から読み取れる妥当な解釈でしょうか。
古墳時代に形成された日本の人口に比較すれば、飛鳥・奈良期以降の朝鮮王朝の亡命民の数はたかが知れていると思われますので、あまり影響を与えることも無かったかと思います。
現段階でどのくらい必要なのかは分かりませんが、弥生〜古墳時代のゲノム標本数についてかなりの拡充が必要と思います。
特に、今回縄文度の高かった東北東日本と出雲と南九州の弥生〜古墳時代ゲノム標本の蓄積が重要になると思います。