都道府県単位の日本人の遺伝的構造
都道府県単位の日本人の遺伝的構造に関する研究(Watanabe et al., 2021)が報道され、話題になっているようです。日本語の解説記事もあります。この研究はオンライン版での先行公開となります。本論文では、日本人の遺伝的構造を解明するため、47都道府県単位と、さらに大きな9地域区分(北海道・東北・関東・中部・近畿・中国・四国・九州・沖縄)単位で遺伝的データが分析されました。この区分は、以下の本論文の図1で示されます。
日本列島には、アイヌと主に沖縄の琉球人という二つの小集団と、その他の大多数を占める「本土」日本人という大集団が存在します。日本人の人口史については、変容・置換・交雑という3モデルが提示されており、現在有力なのは、交雑モデルの一つである「二重構造モデル」です。このモデルでは、現代日本人は先住民である「縄文人(縄文文化関連個体群)」とアジア東部大陸部からの移民との混合により形成された、と想定されます。頭蓋形態に関する以前の研究では、アイヌと琉球人が「本土」日本人より「縄文人」に近く、東北地方の人々は形態的にアイヌに近い、と示唆されています。遺伝学的にも、アイヌと琉球人は「本土」日本人よりも「縄文人」の遺伝的影響を強く受けており、とくにアイヌではその影響がひじょうに高い、と推測されています(関連記事)。
これまでの遺伝学的研究で、「本土」日本人と沖縄県民との間の遺伝的差異は示されていますが、「本土」日本人の都道府県間の遺伝的差異はよく理解されていません。以前の研究で、主成分分析から東北地方の人々が沖縄県民に近く、「縄文人」の遺伝的影響が強い、と示唆されています。しかし、東北地方の全県の人々が遺伝的に沖縄県民に近いのか不明で、さらに四国・中国地方の人々は対象とされていませんでした。本論文では、47都道府県全ての11069人のゲノム規模一塩基多型データが分析され、都道府県水準での日本人の遺伝的構造が明らかにされます。これは、ヤフー株式会社が提供するゲノム解析サービス「HealthData Lab」の顧客11069名の138688ヶ所の常染色体一塩基多型遺伝子型データに基づいています。その地域的内訳は、本論文の表1で示されています。
まず、個体水準で主成分分析が行なわれ、琉球人(おもに沖縄県民)と「本土」日本人(おもに沖縄県以外の46都道府県民)が遺伝的に明瞭に分かれる、と確認されました。なお、本論文で用いられたデータにアイヌは含まれていないと考えられます。常染色体上の138688ヶ所の一塩基多型遺伝子型データから各個体の主成分得点が求められ、プロットされました。次に、47都道府県のそれぞれから50名ずつ無作為抽出されて各一塩基多型のアレル(対立遺伝子)頻度が計算され、中華人民共和国の北京の漢人も含めてペアワイズにf2統計量(2集団間の遺伝距離を測る尺度の一つで、一塩基多型データに対するf2統計量は、一塩基多型ごとにあれる頻度の集団間差の2乗を計算し、それらの平均値として与えられます)を求めてクラスタ分析(多数の変数、つまり多次元データからデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つで、グループ分けが階層的になされる階層的手法と、特定のクラスター数に分類する非階層的手法があり、本論文では階層的手法の一つであるウォード法が用いられました)が行なわれました。
日本人11069人と103人の漢人を対象とした主成分分析では、漢人に近い個体を除くと、日本人は沖縄県民を中心とする「琉球クラスタ」と本土日本人を中心とする「本土日本クラスタ」に大きく二分されました(図1)。本土日本クラスタ内では、東北の個体群が沖縄県民と、近畿および四国の個体群が漢人と比較的近い、と明らかになりました。以下、日本人と漢人を対象とした主成分分析結果を示した本論文の図2です。
ADMIXTURE分析(K=2からK=5まで)では、系統の割合が沖縄県民と他の都道府県民との間でかなり異なっていました。K=2では(図3)、青色成分が沖縄県民の系統の大半を占めています。沖縄県を除く都道府県では、青色成分の割合が近畿と四国で比較的低く、東北・関東・九州で比較的高い、と明らかになりました。以下、K=2の場合のADMIXTURE分析結果を示した本論文の図3です。
都道府県単位のクラスタ分析では、沖縄県民が他の全都道府県民と大きく異なり、沖縄県民を除く都道府県民は大きく3クレード(単系統群)に区分されました。クレード1は東北の全県、クレード2は四国と近畿の全府県、クレード3は中国と九州の全県を含みます。したがって、これら5地域(東北・四国・近畿・中国・九州)は比較的遺伝的には均質と考えられます。f2統計に基づくと、九州、とくに鹿児島県民が遺伝的には沖縄県民に最も近い、と明らかになりました。
47都道府県単位での主成分分析では、同じ地域の都道府県が近くに位置づけられました(図5)。PC1軸では、沖縄県が他の都道府県から離れており、東北と九州の諸県は沖縄県と比較的近くに位置します。沖縄から最も遠いのは、近畿と四国の諸府県です。PC2軸は緯度および軽度と強く相関しており、各都道府県の地理的位置が反映されていることを示します。以下、47都道府県単位での主成分分析結果を示した本論文の図5です。
主成分分析結果を示す上記の図2は、近畿と四国の人々が他の都道県民よりも遺伝的に漢人に近いことを示唆します。これを確認するためf2統計が行なわれ、近畿と四国の人々が他のほとんどの都道県民よりもかなり漢人に近い、と明らかになりました。本論文の分析では、47都道府県民のうち、漢人と遺伝的に最も近いのは奈良県民です。
これらの分析結果を踏まえると、以前の研究と同様に、日本列島の現代人集団は遺伝的に沖縄と本土日本に区分される、と改めて確認されました。ただ、上述のように本論文ではアイヌは含まれないと考えられるので、アイヌを含めると二分ではなく三分されるでしょう。上述のように、以前の研究で本土日本人よりも琉球人の方が遺伝的には縄文人と近い、と示されていました。つまり、本土日本人は琉球人よりも、アジア東部大陸部からの(おそらくは弥生時代以降の)移民に遺伝的に近いことになります。これは、上記の図3で示されたK=2のADMIXTUREにおいて、青を縄文人由来、橙を弥生時代以降の移民に由来すると仮定した場合に確認されます。
アジア東部大陸部からの弥生時代以降の移民は、遺伝的に漢人に近いと予測されます。上記の図5で示された主成分分析のPC1軸で沖縄から最も遠い近畿と四国の府県は、他のほとんどの都道県よりも漢人に近い、と明らかになりました。図5のPC1軸は、縄文人とアジア東部大陸部からの弥生時代以降の移民という二つの祖先集団との遺伝的類似性を反映しているようです。遺伝的に、東北と九州の個体群は他地方よりも縄文人に近く、一方で近畿と四国の個体群はアジア東部大陸部からの弥生時代以降の移民に近いようです。アイヌは北海道の在来集団ですが、現代の北海道民のほとんどは明治時代以降の本土日本からの移民の子孫です。したがって、アイヌは遺伝的に本土日本人よりも琉球人の方と類似していますが、現代の北海道民は琉球人と類似していません。縄文人系統の地域差が、現代日本人集団の遺伝的構造の主因かもしれません。
主成分分析では、地理的位置が本土日本人の遺伝的構造に関わる主因の一つであることも明らかになりました。上記の図5のPC2軸と緯度もしくは経度との有意な相関は、隣接する都道府県間の移動によるものと考えられます。この結果は予測できましたが、ゲノム規模の一塩基多型遺伝子型データを用いて都道府県水準で大規模な分析を行なった本論で初めて示されました。
本論文は、四国の住民が本土日本人の中では比較的漢人に近いことを始めて示しました。上記の図2では、四国の人々はわずかしか漢人クラスタと本土日本人クラスタとの間に位置づけられないので、四国の現代人は、中国人や朝鮮人とあまり混合していない可能性があります。したがって、アジア東部大陸部からの弥生時代以降の移民の遺伝的構成は四国でよく保存されている、と考えられます。アジア東部大陸部からの移民により導入された水稲耕作は九州北部で始まったので、この移民はまず九州北部に到来した可能性が高そうです。もしそうならば、アジア東部大陸部から四国への移住には、中国や九州を経由して瀬戸内海を渡る必要があります。それにも関わらず、四国は中国や九州よりも遺伝的に漢人に近く、弥生時代以降の渡来系統の程度がアジア東部大陸部からの移民の移動経路と必ずしも一致しない、と示唆されます。四国の人々のゲノムに関する将来の研究では、弥生時代以降におけるアジア東部大陸部からの移民の遺伝的背景が解明されるかもしれません。しかし、近畿の現代人と漢人との遺伝的類似性に関しては、図2の2集団間で位置づけられた個体群のように、最近の混合に由来するかもしれません。
上記の図5で示される主成分分析では、東北だけではなく九州も沖縄県に近くなっています。これは図2の主成分分析により支持され、九州の一部個体が本土日本クラスタと沖縄クラスタの間に位置づけられます。その一因は、九州と沖縄の地理的近さで、最近になって九州に沖縄県から移住した人々や、沖縄県出身の両親がいるからです。九州の各県では鹿児島県が沖縄県に最も近くなっています。これは、鹿児島県に属する奄美群島が、かつて沖縄本島に存在した琉球王国の支配下にあったからと考えられます。九州と沖縄の遺伝的近縁性は、上述のように地理的近さが一因と考えられますが、九州北部の3県(福岡・佐賀・長崎)も沖縄に遺伝的に近くなっています。上述のように、アジア東部大陸部からの弥生時代以降の移民は九州北部にまず到来したと考えられますが、九州北部の現代人よりも四国や近畿の現代人の方が遺伝的には漢人と近くなっています。この結果は、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかったことを示唆しますが、これは将来解決されるべき問題です。
また、日本人のさまざまな疾患に関連する多型を特定するため、遺伝的関連研究が行なわれてきました。偽陽性を回避するため、症例と対照の遺伝的背景はできるだけ一貫している必要があります。ゲノム規模関連研究では、ゲノム拡張係数もしくは主成分分析スコアの使用により、集団階層化による偽陽性は回避できるかもしれません。しかし、原因となる一塩基多型が被験者の遺伝的不均質に寄与している場合、こうした調整が偽陰性を引き起こすかもしれません。これらの問題に完全に対処することは困難ですが、本論文の結果は、患者と対照群は、上述の各クレード(クレード1~3および沖縄)内の都道府県から募集する必要がある、と示唆します。
まとめると、本土日本人は遺伝的に不均一で、これは、各地域で縄文人とアジア東部大陸部からの弥生時代以降の移民との間の混合の程度と、近隣の都道府県間の限定的な移住によりもたらされた可能性があります。
以上、本論文についてざっと見てきました。本論文は都道府県単位での日本人の遺伝的構造を示しており、ひじょうに有益だと思います。ただ、日本列島の現代人集団の遺伝的構造の地域差がどのように形成されてきたのか解明するには、やはり日本列島全域での通時的な古代ゲノムデータが必要となります。その意味で、現代日本人、さらにはその地域差の形成過程を、本論文から過剰に読み取ってはならない、とは思います。あくまでも、本論文はそうした問題に関して重要な基礎的情報を提供した、と考えるべきでしょう。
本論文が提示する現代日本人の遺伝的構造の地域差は興味深く、今後の研究でより詳細に解明されていく、と期待されます。本論文では、日本列島の現代人のうち本土集団と琉球集団が取り上げられています。どちらも、日本人起源論で以前から提示されている「二重構造モデル」で説明されます。上述のように、縄文人とアジア東部大陸部からの弥生時代以降の移民との混合により、日本列島の現代人集団は形成された、というわけです。ただ、本論文で取り上げられていないアイヌ集団に関しては、上述のように縄文人の遺伝的影響が本土集団および琉球集団よりもずっと高く、本土集団との混合が前近代より進行していたとはいえ(関連記事)、アジア東部大陸部からの弥生時代以降の移民の遺伝的影響は本土集団および琉球集団よりもはるかに低いでしょう。
このアジア東部大陸部からの弥生時代以降の移民と遺伝的構成が最も類似していると推測されるのは、現時点で確認されている古代人では新石器時代黄河流域集団となります(関連記事)。このモデルでは、新石器時代黄河流域集団は出アフリカ現生人類(Homo sapiens)集団の中で位置づけられます。出アフリカ現生人類は、ユーラシア東部系統と西部系統に分岐し、ユーラシア東部系統は南方系統と北方系統に分岐します。ユーラシア東部南方系統に位置づけられるのは、現代人ではパプア人やオーストラリア先住民やアンダマン諸島人、古代人ではアジア南東部狩猟採集民のホアビン文化(Hòabìnhian)集団です。一方、ユーラシア東部北方系統からはアジア東部系統が分岐し、アジア東部系統はさらに南方系統と北方系統に分岐します。アジア東部北方系統は新石器時代黄河流域集団、アジア東部南方系統は新石器時代の福建省や台湾の集団(おそらくは長江流域新石器時代集団も)に代表され、オーストロネシア語族現代人の主要な祖先集団(祖型オーストロネシア語族集団)です(関連記事)。
現代において、日本列島本土集団や漢人やチベット人などアジア東部現代人集団の主要な遺伝的祖先はアジア東部北方系統ですが、漢人は北部から南部への遺伝的勾配で特徴づけられ、それはアジア東部北方系統とアジア東部南方系統との混合により形成された、と推測されます。チベット人はアジア東部北方系統とユーラシア東部南方系統との、日本列島本土集団はアジア東部北方系統と縄文人との混合により形成されましたが、いずれもアジア東部北方系統の遺伝的影響の方がずっと高くなっています(80%以上)。縄文人は、ユーラシア東部南方系統(45%)とアジア東部南方系統(55%)との混合と推定されています。
本論文では、日本列島の現代人集団のうち本土集団と琉球集団は、先住の縄文人とアジア東部大陸部からの弥生時代以降の移民の混合と指摘されていますが、後者は基本的に新石器時代黄河流域集団に代表されるアジア東部北方系統と考えられます。ただ、稲作の北上に伴って黄河流域でも後期新石器時代にはアジア東部南方系統の割合の増加が指摘されているように(関連記事)、アジア東部大陸部から日本列島への弥生時代以降の移民も、アジア東部北方系統を基本としつつ、アジア東部南方系統の遺伝的影響を受けている、と推測されます。
本論文の結果を踏まえると、沖縄県民ではアジア東部北方系統の遺伝的影響が他の都道府県民(本土集団)よりも低く、本土集団でも地域差がある、と言えそうです。本論文が指摘するように、アジア東部大陸部からの弥生時代以降の移民はまず九州北部に到来したと考えられるのに、その遺伝的影響は九州よりも近畿と四国で高くなっています。本論文はこれに関して、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかった可能性を示唆します。ただ、ヤマト政権成立後に、アジア東部北方系統の遺伝的構成の人々が朝鮮半島から日本列島に到来し(いわゆる渡来人)、畿内に優先的に居住したことを反映している可能性も考えられます。弥生時代だけではなく、古墳時代以降の混合も地域差を形成したかもしれない、というわけです。四国に関しては、近畿との歴史的なつながりを反映しているかもしれません。また関東の現代人がクレードを形成しなかったことについては、近代以降の各地からの移住の影響が大きいかもしれません。これらの問題の解明には、やはり広範囲で通時的な古代ゲノムデータが必要で、今後の研究の進展が期待されます。
参考文献:
Watanabe Y, Isshiki M, and Ohashi J.(2021): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics, 66, 4, 431–437.
https://doi.org/10.1038/s10038-020-00847-0
日本列島には、アイヌと主に沖縄の琉球人という二つの小集団と、その他の大多数を占める「本土」日本人という大集団が存在します。日本人の人口史については、変容・置換・交雑という3モデルが提示されており、現在有力なのは、交雑モデルの一つである「二重構造モデル」です。このモデルでは、現代日本人は先住民である「縄文人(縄文文化関連個体群)」とアジア東部大陸部からの移民との混合により形成された、と想定されます。頭蓋形態に関する以前の研究では、アイヌと琉球人が「本土」日本人より「縄文人」に近く、東北地方の人々は形態的にアイヌに近い、と示唆されています。遺伝学的にも、アイヌと琉球人は「本土」日本人よりも「縄文人」の遺伝的影響を強く受けており、とくにアイヌではその影響がひじょうに高い、と推測されています(関連記事)。
これまでの遺伝学的研究で、「本土」日本人と沖縄県民との間の遺伝的差異は示されていますが、「本土」日本人の都道府県間の遺伝的差異はよく理解されていません。以前の研究で、主成分分析から東北地方の人々が沖縄県民に近く、「縄文人」の遺伝的影響が強い、と示唆されています。しかし、東北地方の全県の人々が遺伝的に沖縄県民に近いのか不明で、さらに四国・中国地方の人々は対象とされていませんでした。本論文では、47都道府県全ての11069人のゲノム規模一塩基多型データが分析され、都道府県水準での日本人の遺伝的構造が明らかにされます。これは、ヤフー株式会社が提供するゲノム解析サービス「HealthData Lab」の顧客11069名の138688ヶ所の常染色体一塩基多型遺伝子型データに基づいています。その地域的内訳は、本論文の表1で示されています。
まず、個体水準で主成分分析が行なわれ、琉球人(おもに沖縄県民)と「本土」日本人(おもに沖縄県以外の46都道府県民)が遺伝的に明瞭に分かれる、と確認されました。なお、本論文で用いられたデータにアイヌは含まれていないと考えられます。常染色体上の138688ヶ所の一塩基多型遺伝子型データから各個体の主成分得点が求められ、プロットされました。次に、47都道府県のそれぞれから50名ずつ無作為抽出されて各一塩基多型のアレル(対立遺伝子)頻度が計算され、中華人民共和国の北京の漢人も含めてペアワイズにf2統計量(2集団間の遺伝距離を測る尺度の一つで、一塩基多型データに対するf2統計量は、一塩基多型ごとにあれる頻度の集団間差の2乗を計算し、それらの平均値として与えられます)を求めてクラスタ分析(多数の変数、つまり多次元データからデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つで、グループ分けが階層的になされる階層的手法と、特定のクラスター数に分類する非階層的手法があり、本論文では階層的手法の一つであるウォード法が用いられました)が行なわれました。
日本人11069人と103人の漢人を対象とした主成分分析では、漢人に近い個体を除くと、日本人は沖縄県民を中心とする「琉球クラスタ」と本土日本人を中心とする「本土日本クラスタ」に大きく二分されました(図1)。本土日本クラスタ内では、東北の個体群が沖縄県民と、近畿および四国の個体群が漢人と比較的近い、と明らかになりました。以下、日本人と漢人を対象とした主成分分析結果を示した本論文の図2です。
ADMIXTURE分析(K=2からK=5まで)では、系統の割合が沖縄県民と他の都道府県民との間でかなり異なっていました。K=2では(図3)、青色成分が沖縄県民の系統の大半を占めています。沖縄県を除く都道府県では、青色成分の割合が近畿と四国で比較的低く、東北・関東・九州で比較的高い、と明らかになりました。以下、K=2の場合のADMIXTURE分析結果を示した本論文の図3です。
都道府県単位のクラスタ分析では、沖縄県民が他の全都道府県民と大きく異なり、沖縄県民を除く都道府県民は大きく3クレード(単系統群)に区分されました。クレード1は東北の全県、クレード2は四国と近畿の全府県、クレード3は中国と九州の全県を含みます。したがって、これら5地域(東北・四国・近畿・中国・九州)は比較的遺伝的には均質と考えられます。f2統計に基づくと、九州、とくに鹿児島県民が遺伝的には沖縄県民に最も近い、と明らかになりました。
47都道府県単位での主成分分析では、同じ地域の都道府県が近くに位置づけられました(図5)。PC1軸では、沖縄県が他の都道府県から離れており、東北と九州の諸県は沖縄県と比較的近くに位置します。沖縄から最も遠いのは、近畿と四国の諸府県です。PC2軸は緯度および軽度と強く相関しており、各都道府県の地理的位置が反映されていることを示します。以下、47都道府県単位での主成分分析結果を示した本論文の図5です。
主成分分析結果を示す上記の図2は、近畿と四国の人々が他の都道県民よりも遺伝的に漢人に近いことを示唆します。これを確認するためf2統計が行なわれ、近畿と四国の人々が他のほとんどの都道県民よりもかなり漢人に近い、と明らかになりました。本論文の分析では、47都道府県民のうち、漢人と遺伝的に最も近いのは奈良県民です。
これらの分析結果を踏まえると、以前の研究と同様に、日本列島の現代人集団は遺伝的に沖縄と本土日本に区分される、と改めて確認されました。ただ、上述のように本論文ではアイヌは含まれないと考えられるので、アイヌを含めると二分ではなく三分されるでしょう。上述のように、以前の研究で本土日本人よりも琉球人の方が遺伝的には縄文人と近い、と示されていました。つまり、本土日本人は琉球人よりも、アジア東部大陸部からの(おそらくは弥生時代以降の)移民に遺伝的に近いことになります。これは、上記の図3で示されたK=2のADMIXTUREにおいて、青を縄文人由来、橙を弥生時代以降の移民に由来すると仮定した場合に確認されます。
アジア東部大陸部からの弥生時代以降の移民は、遺伝的に漢人に近いと予測されます。上記の図5で示された主成分分析のPC1軸で沖縄から最も遠い近畿と四国の府県は、他のほとんどの都道県よりも漢人に近い、と明らかになりました。図5のPC1軸は、縄文人とアジア東部大陸部からの弥生時代以降の移民という二つの祖先集団との遺伝的類似性を反映しているようです。遺伝的に、東北と九州の個体群は他地方よりも縄文人に近く、一方で近畿と四国の個体群はアジア東部大陸部からの弥生時代以降の移民に近いようです。アイヌは北海道の在来集団ですが、現代の北海道民のほとんどは明治時代以降の本土日本からの移民の子孫です。したがって、アイヌは遺伝的に本土日本人よりも琉球人の方と類似していますが、現代の北海道民は琉球人と類似していません。縄文人系統の地域差が、現代日本人集団の遺伝的構造の主因かもしれません。
主成分分析では、地理的位置が本土日本人の遺伝的構造に関わる主因の一つであることも明らかになりました。上記の図5のPC2軸と緯度もしくは経度との有意な相関は、隣接する都道府県間の移動によるものと考えられます。この結果は予測できましたが、ゲノム規模の一塩基多型遺伝子型データを用いて都道府県水準で大規模な分析を行なった本論で初めて示されました。
本論文は、四国の住民が本土日本人の中では比較的漢人に近いことを始めて示しました。上記の図2では、四国の人々はわずかしか漢人クラスタと本土日本人クラスタとの間に位置づけられないので、四国の現代人は、中国人や朝鮮人とあまり混合していない可能性があります。したがって、アジア東部大陸部からの弥生時代以降の移民の遺伝的構成は四国でよく保存されている、と考えられます。アジア東部大陸部からの移民により導入された水稲耕作は九州北部で始まったので、この移民はまず九州北部に到来した可能性が高そうです。もしそうならば、アジア東部大陸部から四国への移住には、中国や九州を経由して瀬戸内海を渡る必要があります。それにも関わらず、四国は中国や九州よりも遺伝的に漢人に近く、弥生時代以降の渡来系統の程度がアジア東部大陸部からの移民の移動経路と必ずしも一致しない、と示唆されます。四国の人々のゲノムに関する将来の研究では、弥生時代以降におけるアジア東部大陸部からの移民の遺伝的背景が解明されるかもしれません。しかし、近畿の現代人と漢人との遺伝的類似性に関しては、図2の2集団間で位置づけられた個体群のように、最近の混合に由来するかもしれません。
上記の図5で示される主成分分析では、東北だけではなく九州も沖縄県に近くなっています。これは図2の主成分分析により支持され、九州の一部個体が本土日本クラスタと沖縄クラスタの間に位置づけられます。その一因は、九州と沖縄の地理的近さで、最近になって九州に沖縄県から移住した人々や、沖縄県出身の両親がいるからです。九州の各県では鹿児島県が沖縄県に最も近くなっています。これは、鹿児島県に属する奄美群島が、かつて沖縄本島に存在した琉球王国の支配下にあったからと考えられます。九州と沖縄の遺伝的近縁性は、上述のように地理的近さが一因と考えられますが、九州北部の3県(福岡・佐賀・長崎)も沖縄に遺伝的に近くなっています。上述のように、アジア東部大陸部からの弥生時代以降の移民は九州北部にまず到来したと考えられますが、九州北部の現代人よりも四国や近畿の現代人の方が遺伝的には漢人と近くなっています。この結果は、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかったことを示唆しますが、これは将来解決されるべき問題です。
また、日本人のさまざまな疾患に関連する多型を特定するため、遺伝的関連研究が行なわれてきました。偽陽性を回避するため、症例と対照の遺伝的背景はできるだけ一貫している必要があります。ゲノム規模関連研究では、ゲノム拡張係数もしくは主成分分析スコアの使用により、集団階層化による偽陽性は回避できるかもしれません。しかし、原因となる一塩基多型が被験者の遺伝的不均質に寄与している場合、こうした調整が偽陰性を引き起こすかもしれません。これらの問題に完全に対処することは困難ですが、本論文の結果は、患者と対照群は、上述の各クレード(クレード1~3および沖縄)内の都道府県から募集する必要がある、と示唆します。
まとめると、本土日本人は遺伝的に不均一で、これは、各地域で縄文人とアジア東部大陸部からの弥生時代以降の移民との間の混合の程度と、近隣の都道府県間の限定的な移住によりもたらされた可能性があります。
以上、本論文についてざっと見てきました。本論文は都道府県単位での日本人の遺伝的構造を示しており、ひじょうに有益だと思います。ただ、日本列島の現代人集団の遺伝的構造の地域差がどのように形成されてきたのか解明するには、やはり日本列島全域での通時的な古代ゲノムデータが必要となります。その意味で、現代日本人、さらにはその地域差の形成過程を、本論文から過剰に読み取ってはならない、とは思います。あくまでも、本論文はそうした問題に関して重要な基礎的情報を提供した、と考えるべきでしょう。
本論文が提示する現代日本人の遺伝的構造の地域差は興味深く、今後の研究でより詳細に解明されていく、と期待されます。本論文では、日本列島の現代人のうち本土集団と琉球集団が取り上げられています。どちらも、日本人起源論で以前から提示されている「二重構造モデル」で説明されます。上述のように、縄文人とアジア東部大陸部からの弥生時代以降の移民との混合により、日本列島の現代人集団は形成された、というわけです。ただ、本論文で取り上げられていないアイヌ集団に関しては、上述のように縄文人の遺伝的影響が本土集団および琉球集団よりもずっと高く、本土集団との混合が前近代より進行していたとはいえ(関連記事)、アジア東部大陸部からの弥生時代以降の移民の遺伝的影響は本土集団および琉球集団よりもはるかに低いでしょう。
このアジア東部大陸部からの弥生時代以降の移民と遺伝的構成が最も類似していると推測されるのは、現時点で確認されている古代人では新石器時代黄河流域集団となります(関連記事)。このモデルでは、新石器時代黄河流域集団は出アフリカ現生人類(Homo sapiens)集団の中で位置づけられます。出アフリカ現生人類は、ユーラシア東部系統と西部系統に分岐し、ユーラシア東部系統は南方系統と北方系統に分岐します。ユーラシア東部南方系統に位置づけられるのは、現代人ではパプア人やオーストラリア先住民やアンダマン諸島人、古代人ではアジア南東部狩猟採集民のホアビン文化(Hòabìnhian)集団です。一方、ユーラシア東部北方系統からはアジア東部系統が分岐し、アジア東部系統はさらに南方系統と北方系統に分岐します。アジア東部北方系統は新石器時代黄河流域集団、アジア東部南方系統は新石器時代の福建省や台湾の集団(おそらくは長江流域新石器時代集団も)に代表され、オーストロネシア語族現代人の主要な祖先集団(祖型オーストロネシア語族集団)です(関連記事)。
現代において、日本列島本土集団や漢人やチベット人などアジア東部現代人集団の主要な遺伝的祖先はアジア東部北方系統ですが、漢人は北部から南部への遺伝的勾配で特徴づけられ、それはアジア東部北方系統とアジア東部南方系統との混合により形成された、と推測されます。チベット人はアジア東部北方系統とユーラシア東部南方系統との、日本列島本土集団はアジア東部北方系統と縄文人との混合により形成されましたが、いずれもアジア東部北方系統の遺伝的影響の方がずっと高くなっています(80%以上)。縄文人は、ユーラシア東部南方系統(45%)とアジア東部南方系統(55%)との混合と推定されています。
本論文では、日本列島の現代人集団のうち本土集団と琉球集団は、先住の縄文人とアジア東部大陸部からの弥生時代以降の移民の混合と指摘されていますが、後者は基本的に新石器時代黄河流域集団に代表されるアジア東部北方系統と考えられます。ただ、稲作の北上に伴って黄河流域でも後期新石器時代にはアジア東部南方系統の割合の増加が指摘されているように(関連記事)、アジア東部大陸部から日本列島への弥生時代以降の移民も、アジア東部北方系統を基本としつつ、アジア東部南方系統の遺伝的影響を受けている、と推測されます。
本論文の結果を踏まえると、沖縄県民ではアジア東部北方系統の遺伝的影響が他の都道府県民(本土集団)よりも低く、本土集団でも地域差がある、と言えそうです。本論文が指摘するように、アジア東部大陸部からの弥生時代以降の移民はまず九州北部に到来したと考えられるのに、その遺伝的影響は九州よりも近畿と四国で高くなっています。本論文はこれに関して、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかった可能性を示唆します。ただ、ヤマト政権成立後に、アジア東部北方系統の遺伝的構成の人々が朝鮮半島から日本列島に到来し(いわゆる渡来人)、畿内に優先的に居住したことを反映している可能性も考えられます。弥生時代だけではなく、古墳時代以降の混合も地域差を形成したかもしれない、というわけです。四国に関しては、近畿との歴史的なつながりを反映しているかもしれません。また関東の現代人がクレードを形成しなかったことについては、近代以降の各地からの移住の影響が大きいかもしれません。これらの問題の解明には、やはり広範囲で通時的な古代ゲノムデータが必要で、今後の研究の進展が期待されます。
参考文献:
Watanabe Y, Isshiki M, and Ohashi J.(2021): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics, 66, 4, 431–437.
https://doi.org/10.1038/s10038-020-00847-0
この記事へのコメント
そこでは、後発組が九州から締め出されて東へ移住する流れが書かれています。途中中国地方でも締め出されて京都に落ち着いたという新羅からの移住者の話があります。
じゃ4国は?と言うと4国って言語的には関西弁言語圏で、おそらく近畿の住民が拡散したのじゃないか?と見ています。土佐弁とかは知りませんが、香川とかはもろ関西弁なまりです。
これが出雲は置いておいて中国だと全然違います。広島とか中部に近いって研究もあるようです。
中国九州はすでに先人の移住者が占めてしまっていたため空白地帯の近畿に集中したのじゃないか?と見ています。同様の現象がもっと後の時代に関東でも起こってますが、関東は、近代の移住のせいで単純に全国の遺伝子が集まってるように見えますね。
以前から面白いと見てましたが、釜山の人骨のDNAで、半島の文化がある程度歴史があるとすると、それらに対する後発の移住者は別の集団と言う枠組みができると見ています。
私の中で無文土器は文化的な継承であって遺伝的には別集団だろうと見ています。それらの集団が日本に移住して後発として九州から締め出されるのはありうると見ています。
無文土器の集団がそのまま来たわけじゃないってのは多分かなり異説だと思うので、今後どう展開されるか?なんとも言えませんけど、半島の南部集団が玉突き式に日本に移住したと見てて、それらの集団は半島全体で均一な集団だと見てないです。
日本語と朝鮮語の違いにも合致しますしね。
朝鮮半島から日本列島への渡来民の違いについては、朝鮮半島の人類集団の遺伝的構成は地域・年代でどの程度の違いがあるのか、という問題とも関わっており、本土日本人の起源論の解明で重要になるので、注目しています。
所謂園耕民ってやつが、縄文後期に来てたんじゃないか?って事になります。管理人さんが言った古い弥生人ですけど。管理人さんと違うのは、私はそれが四国の大陸寄りの原因だとは思ってないです。
四国の大陸寄りは弥生後だろうなと見ています。徳島は秦氏の拡大とかも言われていて、後からの移住も普通にあると思うんですよ。ただNに関してだけ特異なものがあるって点で、移住の歴史が古いかも?と見ています。
要するに、後の移住とは何の関係もない話ですけど。
弥生人の到来が早かったとか、そういうのはくだらないと思っています。ただ遺伝的に弥生人に近いものが移住してきたのは弥生前もあったかも?と見ています。
何故人骨に出ないんだ?については、西北九州弥生人が良い例で、当たり前に縄文人と混血した集団しか広がらなかったと見てるからです。
人骨的には変化のない弥生と縄文ですが、DNAはおそらくもっと早く弥生的な地域の遺伝子が入ってきてると見ています。
でも私は3段階モデルの正体は、弥生人が半島で一様に混血したためだと見ています。それで後から来た弥生後の集団と違った集団が来てるように見えるからです。
近畿へきた集団は、私は違った遺伝集団だったと見てるのですけどね。何が違うか?と言うと縄文混血成分がない。そうすると綺麗に大陸寄りになる現在の結果に整合性が取れます。
それが半島北部から来た無文土器集団は弥生人の中心の集団ではないって話になります。あくまで無文土器とセットにした稲作は文化伝播だと見ています。ある程度は混血したと思いますけどね。
釜山の縄文時代人やや中国北部成分が足りないから。
3段階モデルは園耕民を2段階の柱にしてますが、私は、園耕民は存在しても日本全体の集団に影響を与えたほどじゃないだろうと見ています。
斎藤氏が述べたもう1つの弥生後の流入の集団の遺伝子が弥生期と違って異質だったというのがそうかな?と思います。
それにこれらにどうしても欠かせないのが、O1B2の存在ですが、これが邪魔と言えば邪魔です。C1A1が縄文系じゃないとして入れてしまって、渤海民が邪魔です。文化的に中国東北部の櫛目文土器のN系の文化で、徳島のハプロからも漁業民じゃなくて雑穀民が移住縄文人と混血したと見ています。
旧石器からのホアビン文化集団じゃないと見てるのは、縄文時代の文化遺物が人骨と同じ場所から出てるからです。
ああそれならほぼ同じですね。私も言い方が悪かったと思います。古人骨で調べてほしいなら、徳島の縄文後期のハプロが知りたいってだけで、なんというか枝葉の話を膨らましてしまって誤解させてしまったと思います。
徳島でNOと過去されていたものがNの古い系統だと特定されたのを何かで読みました。じゃそれいつ来たんだ?が気になっただけで、徳島全体の事とは別なんですよ。
関係ない話するなよってところですが、古人骨DNAを調べられるならって話が出たのでつい書いてしまいました。
3段階モデルって愛知県の3000年前付近の縄文人の核DNAでほぼあかんと出てますよね。普通にこの時期でもガチ縄文系のクラスターに入っていました。
私も言いたいのは、後の時代に全体に影響を与えるほどじゃないが、こっそり一部縄文後期に半島系の混血が入り込んでる可能性が多分あるです。それがピンポイントにあたるんはまずないから徳島だと出ないかなと…。
県ごとで気なるが現代人じゃ良く分からないってのをぜひ見てい見たいです。
東北まで均一な集団に近畿関東の中心部が違う集団だってものです。
ただ正確には九州北部と瀬戸内周辺も含むのですけど。
厳密な意味では愛知からでてしまった3段階モデルはもう破綻しています。修正して西日本ではってものに変わる程度でしょうね…。ただ東北などは時代が古くてその点まだセーフかなと思います。
別に韓国で混血がなされなくても、北九州ですでに完成していたとすると現時点での論文の事実から3段階モデルは破綻する可能性を秘めています。だが、これ考えようによっては確かに3段階モデルのもう1つのパターンに近いを分かります。海の民以外に古墳後のもでるもあって、そっちだろうと見ています。九州北部や瀬戸内は違っていたけど、近畿はまさにそのとおりで、関東はあれ単純に歴史時代の移住でしょうね。
江戸、明治で関東が中心となったからその時人口の多い近畿圏がやっぱり移住者が多かったのかなと。鎌倉前の開拓期とは違うのじゃないか?と思います。
海の民モデルはつぶれたんじゃないかな?とは見ています。海の民は半島ですでに混血していた可能性ありです。
ただC1A1についてはまだ旧石器時代の石刃の日本への流入があるかもしれないとは思っています。アルタイからこっちまで来てしまったという事です。沖縄から例の古い人骨からM7Aが見つかっていて、あれはD系なんだろうなと思います。だったら半島九州へ石刃文化を持ってきた集団は誰?の候補でC1A1はまだ縄文人として捨てきれないなと。
2段階目は西日本だけなんですね。3段階目までに、東北まで埋まったもでると中央部の別集団って形です。
海の民はこのモデルで、古墳時代以降の大陸の技能集団、秦氏も多分その一族ですよね。こういったグループの流入と2つ分かれています。
北九州でほぼ日本人の混血率と変わらない集団が出たことで海の民、3段階モデルが怪しくなってるのは事実ですが、愛知県で否定した私は完全に間違っていました。
本当に失礼しました…。
後C1A1については、日本では下位系統しかないってのがおかしいんですよね。旧石器時代から来てたなら、何故見つからないのか?日本より圧倒的に頻度の低い渤海沿岸でポツンと古い系統が見つかったのに何故?と思います。他にもモンゴル中央アジアでも見つかってる様で古い系統か?は分かりません。
ただ管理人さんが求めるIUPの拡大集団に適した集団としてこれほどふさわしい集団はないと思います。
ただそこにC1A1が見つかるか?と言うと大きな疑問がある点として、仮に旧石器時代の移住者なら何故上位系統が中国にしか残ってないのか?
経路としては渤海から半島への経路がすぐ思いつきますが、分岐年代が新しすぎて、これならもっと古い上位系統が分岐してると思われます。もちろんこれらに対してカルデラ噴火による九州に偏った系統と言われてきました。
だがこれは、渤海周辺で上位系統が見つかる前の話で説得力がないと感じます。ただもちろん、何かしらの偶然が働いてそういう事もあるのかもしれませんけど。
次にアイヌで見つかったって事例を全く私は知りません。最近礼文島で出たものが他の地域とほぼずれが無いのが分かりました。南方系との混血なのに、その勾配が全くないようです。
なら弥生との混血である本土平均ではかなり出るC1A1が縄文が濃いアイヌに出ないのはおかしくないか?となります。
もちろん2つとも私が知らないだけで、上位系統出てるよ!アイヌも出てるよ!って事なら教えていただけるとありがたいのですけど。そうじゃないなら本当に訳が分からないなと思う部分です。
所謂創始者効果ってやつですかね。アメリカ先住民は、モデルが考えられてるのですが、ベルベル人とカメルーン人との関係見たいものじゃないかと。
レヴァント集団のアフリカの南下について、北アフリカでは母系が良く残って、カメルーンでは父系が良く残ってるとなっています。男性首長が移動する場合、元居た場所に2つのY染色体があったとき移動先は偏りやすいと言うのがあります。エニセイ語族は見事にQの方が多くて、ナデネ語族はC2が良く出ています。
この論理が移動の範囲が狭い日本だと使えない。仮に九州から入ったのであれば、北海道のC1A1率は低くなるかもしれませんね。縦には日本広いですから。