オホーツク文化人のゲノム解析とアイヌ集団の形成過程
オホーツク文化人のゲノム解析結果を報告した研究(Sato et al., 2021)が公表されました。古代ゲノム学は、過去の人口史の遺伝的特徴の片鱗を捉えることのできる強力な手法です。最近の古代ゲノム研究は多くのアジアの旧石器時代人と新石器時代人のゲノムを報告しており、ユーラシア東部におけるヒトの移住過程への新たな洞察を提供してきました(関連記事)。とくに、北京の南西56km にある田园(田園)洞窟(Tianyuan Cave)で発見された4万年前頃の男性個体(関連記事)と、シベリア南部中央のマリタ(Mal'ta)遺跡(関連記事)の少年個体(MA-1)と、シベリア北東部のヤナRHS(Yana Rhinoceros Horn Site)で発見された31600年前頃の2個体(関連記事)の古代ゲノム研究は、ユーラシア東部の初期人口史を理解するうえで重要です。
系統樹では、田園個体はパプア人およびユーラシア東部人口集団と一まとまりを形成しますが、MA-1とヤナRHSの2個体(ヤナUP)はユーラシア西部人口集団と遺伝的に密接です。詳細な経路はまだ議論の余地がありますが、これら古代人のゲノムは、ユーラシア東部への2回の過去の移住を示唆しています。一方は南方経路で、ユーラシア大陸南岸地域に沿って拡散し、もう一方の北方経路は、おそらくシベリアも含めてユーラシア中緯度の草原地帯を通って拡散しました。南方の移住の波は、アジア東部(本論文では、現在の中国と日本と朝鮮とモンゴルと台湾を含む地域として定義されます)および南東部の局所的人口集団に分化していったようです。北方の移住の波は南方の移住の波とおそらくはシベリアで混合し、チュクチ・カムチャッカ(チュクチ半島とカムチャッカ半島、図1a)の人口集団とアメリカ大陸先住民の起源となりました(関連記事)。さらに、新石器時代と青銅器時代以降の古代人ゲノムを分析したその後のいくつかの研究では、半島アジア大陸における新石器時代後の人口動態が明らかにされてきました(関連記事1および関連記事2)。
日本列島に関しては、完新世人口集団である「縄文人」のゲノムが報告されており(関連記事1および関連記事2)、南方移住の波系統からの深い分岐が示唆されています。しかし、新石器時代以後の日本列島の人口集団の遺伝的歴史は、この期間の古代ゲノムデータの不足ため、依然として不明です。いくつかの以前の研究では、現代日本列島の人口集団はアジア東部大陸部人口集団および/もしくはアジア北東部(本論文ではロシア極東に相当します)人口集団からの遺伝子流動の影響を受けたものの、その詳細な起源と移住の仮定は不明なままと示唆されています(関連記事)。したがって、そうした過去の移住の遺伝的特徴の解明も、日本列島周辺の人口史の理解の向上に重要です。考古学的証拠で示唆されているように、新石器時代後に日本列島に起きたように見える過去の主要な移住事象の一つは、先史時代オホーツク人による日本列島北部での定住です。
高度な海洋漁業と狩猟技術を有する先史時代狩猟採集文化であるオホーツク文化は、紀元後5世紀~13世紀まで、オホーツク海の南部沿岸地域に分布していました(図1a)。オホーツク文化の最も重要な特徴である海洋資源への依存は、以前の動物考古学および同位体研究により明らかになりました。じっさい、オホーツク文化の遺跡の分布は明らかに沿岸地域に限られています(図1a)。この特徴は、日本列島における先住の縄文文化(紀元前14000~紀元前300年頃)やその後の続縄文時代(紀元前3世紀~紀元後7世紀)や擦文時代(紀元後8~14世紀)とは大きく異なります(図1a)。
アジア北東部におけるオホーツク文化とその近隣古代文化との間の関係の観点では、オホーツク文化の遺跡から発掘された土器や鉄器や青銅器の一部が、ロシアのプリモルスキー(Primorski)地域で発展した、紀元後6~9世紀となるモヘ(Mohe、靺鞨)文化(図1a)遺跡で発見されたものと類似しています。さらに、オホーツク文化の遺跡から発掘されたセイウチの牙製の彫像や釣針は、オホーツク文化と紀元後5~17世紀となる古代コリャーク(Koryak)文化(図1a)との間の相互作用を示唆しており、それはセイウチが現在では北極海とベーリング海にしか分布していないからです。しかし、考古学的遺物のこれら文化間の共通性がヒトの移住と移住なしの交易のどちらに由来するのかは、不明なままです。
オホーツク文化人の起源は、考古学者と人類学者により長く議論されてきました。オホーツク文化人の骨格遺骸の形態学的研究は、アムール川流域周辺およびサハリン北部の現代人集団との類似性を示唆してきました。さらに、ミトコンドリアDNA(mtDNA)分析の結果は、形態学的証拠を裏づけます。mtDNAハプログループ(mtHg)Y1とG1bとN9bはアムール川下流人口集団間において高頻度で共有されており、オホーツク文化の骨格遺骸でよく検出され、オホーツク文化人のアムール川下流地域起源を示唆します。しかし、オホーツク文化人の包括的なゲノム規模データが欠けているため、最終的な結論にはまだ達していません。したがって、この研究の主な動機は、ゲノム規模データ分析に基づいてオホーツク文化人の遺伝的起源を理解することです。
考古学的証拠に基づくと、オホーツク文化は紀元後13世紀頃に消え、その原因は依然として不明です。これと関連して、オホーツク文化とその後のアイヌ文化との間の関係が調べられてきました。考古学者たちは、アイヌとフィン人とニブフ人とサーミ人などユーラシア北部の民族集団間で広く観察される宗教的慣行である熊崇拝もオホーツク文化人により共有されていた、と考えてきました。他方、そうした宗教的慣行の痕跡は、アイヌ文化期より前の縄文時代と続縄文時代の遺跡では発見されていません。アイヌ文化の熊崇拝はイオマンテで見られ、これは熊を犠牲にしてその精神をカムイ(アイヌ文化の神聖な存在)の世界に送る儀礼です。オホーツク文化では、ヒグマの安置された頭蓋骨がいくつかの住居遺跡で発見されており、熊崇拝と関連した宗教的慣行が示唆されます。
これは、オホーツク文化がアイヌ文化の形成に寄与したことを示唆します。いくつかの頭蓋学およびmtDNA研究は、アイヌとアジア北東部人口集団との間の遺伝的類似性を示唆してきました。頭蓋測定に基づく統計分析では、アジア北東部人がオホーツク海沿岸に居住するアイヌにわずかな遺伝的影響を残した、と示唆されました。アイヌ現代人のmtDNAとY染色体DNAの分析は、ニブフ人とアイヌとの間の母系および父系遺伝子プールの類似性を示唆します。これらの知見は、アジア北東部から(北海道を中心とする)日本列島北部への遺伝子流動の可能性として解釈されてきました。さらに、古代のmtDNAと頭蓋非計測的変異の研究は、オホーツク文化人とアムール川下流人口集団との間の密接な関係と、アムール川下流人口集団からアイヌへのオホーツク文化人経由の遺伝子流動を示唆しており、これはオホーツク文化人がアイヌ文化の確立に寄与した、との考古学的仮説を裏づけます。
しかし、これらの研究の形態学的もしくは遺伝学的指標は少なく、オホーツク文化人のアイヌへの遺伝的寄与について最終的な結論を提供できません。それは、こうした研究が統計的に人口集団の混合を評価できないからです。対照的に、統計的に人口集団の混合を評価できる現代人の最近のゲノム規模一塩基多型分析は、アムール川下流人口集団からアイヌへの遺伝子流動を検出していませんが、これはオホーツク文化人がアイヌに遺伝的に寄与したならば、予測されることです。したがって、さまざまな手法を用いた多くの研究がアイヌ集団の形成過程を解明する目的で行なわれてきましたが、オホーツク文化人がこの過程に遺伝的に寄与したのかどうかは不明なままです。
オホーツク文化人の形成過程と、アイヌへの遺伝的および文化的寄与を調べるため、国際的な学際的調査団が、北海道の礼文島の浜中2遺跡の発掘に着手しました(図1a)。2013年に、重度の骨肥厚症の成人女性のよく保存された骨格遺骸(NAT002)が、オホーツク文化期の最終段階となる貝塚の上部表面で回収されました(図1b・c)。NAT002の較正放射性炭素年代は紀元後1060~1155年(68.2%)と推定され、骨肥厚症は皮膚科学的観察なしの滑膜炎と痤瘡と膿疱症と骨肥厚症と骨炎(SAPHO)症候群と診断されました。
本論文は、NAT002の全ゲノム配列結果を報告し、オホーツク文化人の起源に関する問題と、アイヌ集団への遺伝的寄与に関する問題を解決します。本論文はNAT002のゲノムをアジア東部および北東部の現代の人口集団および最近報告されたアジア北東部古代人と比較します。この古代人には、朝鮮半島に近いロシアの沿岸地域の悪魔の門遺跡の7700年前頃の個体群(関連記事)や、プリモルスキー地域の新石器時代後個体群(関連記事)や、礼文島の浜中2遺跡に近い(図1a)船泊遺跡(関連記事)の縄文時代の女性個体(F23)が含まれます。また本論文は、NAT002の一部の骨で観察されたSAPHO症候群的骨肥厚症の遺伝的背景の特定も試みます。
NAT002のDNA保存状態は良好で、平均深度35.03倍のゲノム配列が得られました。これは埋葬と寒冷な環境と比較的新しい年代(紀元後11~12世紀)に起因すると考えられますNAT002はX染色体とY染色体にマップしたリード数の比から女性と推定され、これは形態学的およびアメロゲニン遺伝子に基づく以前の性別判定と一致します。以下は本論文の図1です。
●NAT002と隣接集団との間の遺伝的関係
アジア北東部人口集団に対するNAT002の遺伝的類似性を評価するため、49079ヶ所の一塩基多型で外群f3統計が計算されました。f3(ムブティ人;NAT002、X)では、NAT002は近隣地域のニブフ人とアイヌとウリチ人とF23に密接に関連しており、それに続いて密接なのが、イテリメン人(Itelmen)やコリャーク人(Koryak)を含むカムチャッカ半島人口集団、本州・四国・九州を中心とする日本列島「本土」人、オロチョン人(Oroqen)やダウール人(Daur)やホジェン人(Hezhen 、漢字表記では赫哲、一般にはNanai)を含むアムール川上流人口集団です(図2)。以下は本論文の図2です。
49079ヶ所の一塩基多型に基づく主成分分析(図3)も、NAT002が遺伝的にニブフ人およびウリチ人と密接であることを示唆し、以前の形態学的およびmtDNA研究を裏づけます。以下は本論文の図3です。
ADMIXTURE が2~10の系統構成要素(K=2~10)で実行されました(図4)。最小交差検証(CV)誤差はK=5の時に観察されました。NAT002は4つの遺伝的構成要素で混合された個体として表されました(図4)。緑色の構成要素(24.6%)は、広くアジア北東部人口集団で共有されています。青色の構成要素(15.8%)は、アジア東部人で広く共有されています。濃紺色の構成要素(33.2%)はF23とアイヌにおいてほぼ100%で観察されます。黄色の構成要素(26.4%)はイテリメン人およびコリャーク人に高い割合で共有されています。NAT002の構成要素の割合は、ニブフ人やウリチ人などアムール川下流人口集団と似ています。以下は本論文の図4です。
次に、NAT002とアジア北東部人との間の系統発生関係を推測するため、NAT002とF23とSGDP(サイモンズゲノム多様性計画)標本で観察される2556493ヶ所の多様体に基づくTreeMixが実行されました。NAT002とニブフ人とウリチ人は単系統性の一まとまりを形成し(図5a)、主成分分析およびADMIXTUREの結果と対応しています。2回の移住事象を想定した場合、遺伝子流動はF23からNAT002とニブフ人との間の共通祖先で観察されました(図5a)。
F23とウリチ人との間、およびNAT002とイテリメン人との間でも大規模な残余が観察され、それらの間の遺伝子流動が示唆されます(図5b)。ウリチ人と「縄文人」/アイヌとの間の遺伝的類似性は以前に報告されていました(関連記事)。さらに、NAT002とアジア北東部の前期新石器時代人の悪魔の門個体群との間の遺伝的類似性が、外群f3(ムブティ人;悪魔の門個体群、X)の計算により調べられました。検証人口集団間で、NAT002はニブフ人に次いで2番目位に高いf3値を示しました。この結果は古代人のゲノム間で共有された偏りの影響を受けた可能性がありますが、古代人のゲノム間の遺伝的類似性のそうした過大評価は、おもに配列の短さや死後の損傷の高頻度や比較された古代人2個体の不充分な深度に起因する可能性が高そうです。
悪魔の門個体群のゲノムにおける参照の偏りの程度は、低い網羅率のため比較的強くなるでしょう。しかし、NAT002ゲノムにおける参照の偏りは、本論文の遺伝子型コール閾値として用いられた、選別の水準0および1の現代日本人のゲノムの30倍の網羅率よりもさほど強くありませんでした。したがって、悪魔の門個体群とNAT002との間の観察された類似性は、大幅に過大評価される可能性は低そうです。f3(ムブティ人;悪魔の門個体群、NAT002)の高い値は、オホーツク文化人の起源がアムール川流域周辺にある、との仮説を裏づけます。他方、F23は低いf3値を示しており、日本列島北部からアムール川流域への「縄文人」系統の移住はおもに新石器時代後に起きた、と示唆され、ウリチ人における以前の混合年代を裏づけます。以下は本論文の図5です。
系統樹の接続形態を考慮すると(図5a)、f3(ムブティ人;NAT002、X)により示されるアムール川流域人口集団とNAT002との間の類似性は、密接な系統発生関係として解釈できます。これらの示唆された混合事象を確認するため、49079ヶ所の一塩基多型に基づくD(ムブティ人、X;ニブフ人、NAT002)検定が実行され、F23とアイヌとイテリメン人は有意な正の値を示しました(図6a)。古代人のゲノム間の共有された偏りのため、D(ムブティ人、F23;ニブフ人、NAT002)で観察された兆候の過大評価の可能性も考慮されねばなりませんが、F23とNAT002の参照の偏りは現代日本人の網羅率30倍のゲノムと比較してさほど強くないので、過大評価の程度はそれほど深刻ではないでしょう。混合兆候はD(ムブティ人、F23;アムール川流域集団、NAT002)とD(ムブティ人、イテリメン人;アムール川流域集団、NAT002)でも観察されました。この場合のアムール川流域人口集団とは、ウリチ人とオロチョン人とホジェン人とダウール人とシボ人(Xibo)です(図2)。これらの知見から、NAT002は3祖先的系統(アムール川流域集団、チュクチ・カムチャッカ集団、「縄文人」)間の混合個体だった、と示唆されます。
次にqpAdmモデルを用いて、NAT002と関連する過去の混合事象についてのこの仮説が検証されました。オロチョン人とイテリメン人とF23が、それぞれアムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の供給源人口集団の代表として用いられました。完全ランク付けモデルに対する提案された混合の尤度比検定(LRT)のP値は有意ではなく(P=0.14)、NAT002のゲノムはアムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の祖先系統(祖先系譜、祖先成分、ancestry)の混合として説明できます。アムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の推定された祖先系統は、それぞれ64.9±8.0%、21. 9±6.4%、13.2±4.3%です(図6c)。
アムール川流域集団とチュクチ・カムチャッカ集団からの推定される祖先系統の割合の比較的大きな標準誤差は、これら供給源人口集団間の密接な関係に起因するかもしれません。じっさい、ADMIXTURE分析(図4)で観察された黄色と赤色の構成要素は、チュクチ・カムチャッカ人口集団(イテリメン人とコリャーク人とエスキモーとチュクチ人)間で支配的ですが、ニブフ人やウリチ人やオロチョン人やホジェン人やダウール人やシボ人などアムール川流域人口集団でも広く観察されます。構成要素のこの共有は、アムール川流域人口集団とチュクチ・カムチャッカ人口集団との間の混合か、両者の間で部分的に共有される遺伝的浮動の結果のようです。さらに、入れ子モデルへのLRTでは、あらゆる2方向混合モデルがNAT002ゲノムを適切に説明できない、と示唆されます。以下は本論文の図6です。
●在来祖先系統と混合年代の推定
アムール川流域集団と「縄文人」とチュクチ・カムチャッカ集団の系統間の混合事象の順番を決定するため、NAT002ゲノムの在来祖先系統が推測されました。本論文の在来祖先系統推定は大陸内規模(つまり、アジア東部と北東部全参照人口集団)で行なわれましたが、NAT002ゲノムの大半は0.9以上の事後確率を有する3つの祖先的ハプロタイプの一つに分類できました。在来祖先系統の割合から計算された世界規模の祖先系統の割合は、アムール川流域集団が83.6%、チュクチ・カムチャッカ集団が10.0%、「縄文人」が6.4%です。
ADMIXTURE(図4)とqpAdm(図6c)の結果を考慮すると、「縄文人」とチュクチ・カムチャッカ集団の祖先系統の堀合は過小評価されているようで、おそらくは参照人口集団における「縄文人」とチュクチ・カムチャッカ個体の標本規模の小ささに起因します。「縄文人」は1個体(F23)のみで、チュクチ人やエスキモーなどチュクチ人口集団の5個体とともに、チュクチ・カムチャッカ参照人口集団におけるカムチャッカ人口集団の代表としてイテリメン人1個体のみが含まれています。
本論文は、3系統間の混合年代を推測するため、単純な波動移住モデルを想定しました。アムール川流域系統の移住年代はNAT002の22世代前と推定されました(図7)。1世代30年と仮定し、NAT002の放射性炭素年代(900年前頃)を考慮すると、アムール川流域関連祖先系統の移住は1600年前頃に起きました。これは、以前の考古学的証拠により示唆されるように、オホーツク文化の始まりと正確に対応していますが、本論文の混合年代は1個体のみの祖先系統の領域の長さに基づいています。
チュクチ・カムチャッカ系統と「縄文人」系統間の混合はNAT002の35世代前(1950年前頃)と推定され、縄文時代の後の続縄文時代(紀元前3~紀元後7世紀)と対応します。本論文が把握している限りでは、その期間のカムチャッカ半島から日本列島北部へのヒトの移住を示す考古学的証拠は提示されていませんが、以前の古代DNA研究は縄文時代標本と続縄文時代標本との間のmtHg特性の変化を報告しています。カムチャッカ半島人口集団においてひじょうに高頻度で観察されるmtHg-G1bは、続縄文時代の標本の15.0%で検出されますが、縄文時代標本では検出されません。さらに最近の研究では、千島列島南西部に位置する択捉島のタンコウォイェ1(Tankovoye 1)遺跡(図1a)の続縄文時代標本と、イテリメン人やコリャーク人などカムチャッカ半島現代人集団との間の遺伝的類似性が報告されました。これらの知見は、続縄文時代における千島列島を経由してのカムチャッカ半島から日本列島北部への移住の波を裏づけます。
本論文は、混合していないアイヌの10個体を参照「縄文人」に追加することにより、類似の混合年代測定を実行しました。この場合、NAT002における「縄文人」祖先系統の割合は増加し、アムール川流域祖先系統が64.4%、チュクチ・カムチャッカ祖先系統が9.8%、縄文人祖先系統が25.8%と推定されました。しかし、推定された混合年代は、アムール川流域関連祖先系統の移住についてはNAT002の17世代前(1410年前頃)、「縄文人」系統とカムチャッカ系統との間の混合についてはNAT002の37世代前(2010年前頃)と大きくは変わらず、本論文の混合年代は中程度の堅牢性を有する、と示唆されました。以下は本論文の図7です。
●アイヌ集団に対するオホーツク文化人の遺伝的寄与
アイヌ集団の形成過程は長く議論されてきました。しかし、アイヌと縄文時代個体群との間の遺伝的類似性は以前の研究で確認されてきましたが(関連記事)、新石器時代後の人口動態に関する決定的な結論には至っていません。F23と比較して主成分分析では、アイヌ個体群はわずかにアジア北東部人に影響を受けていると示唆されますが(図3)、ADMIXTURE分析の結果では、アイヌ個体群はほぼ単一の祖先系統で表される、と示唆されます。
したがって、縄文時代後のアジア北部人口集団からの遺伝的影響を確かめるため、D(ムブティ人、X;F23、アイヌ)検定が実行されました。その結果、アジア北部人口集団は有意に正の値を示しました。とくに、イテリメン人やコリャーク人などカムチャッカ半島人口集団と、ホジェン人やオロチョン人やシボ人やダウール人などアムール川流域人口集団は強い兆候を示しました。以前の研究では、アイヌとカムチャッカ半島人口集団との間の遺伝的類似性が報告されました。
アイヌ集団の形成過程をモデル化するため、qpGraphを用いて混合図が作成されました。まず、NAT002やF23やSGDP標本群を含む混合図が作成されました。アムール川流域系統と「縄文人」系統とカムチャッカ半島系統の間の混合事象の順序は、混合年代の結果にしたがって決定されました。図における最低のf4統計のZ得点は-2.1でした。次に、足場図(scaffold graph)にアイヌを追加することにより、アイヌ集団の形成過程が検証されました。アイヌは「縄文人」とオホーツク文化人と「本土」日本人の間の混合人口集団と仮定したモデルが、検証されたモデルの中で最適でした(図8a)。
しかし、オホーツク文化人からアイヌへの遺伝子流動を仮定しない別のモデルも許容されました(図8b)。最低のf4統計を考慮すると、オホーツク文化人からアイヌへの遺伝子流動を仮定する最初のモデル(図8a)が最も可能性の高いシナリオですが、混合図の枠組みでは2番目のモデル(図8b)を明示的に却下できませんでした。この二つのモデル間の顕著な違いの一つは、「本土」日本人からアイヌへの混合割合で、最初のモデルでは29%、二番目のモデルでは44%でした。以前の研究はmtHg頻度に基づいて、近世アイヌ集団における「縄文人」とオホーツク文化人と「本土」日本人の混合割合が推定されました(関連記事)。その研究では、アイヌへの「本土」日本人の遺伝的寄与は28.1%と推定され、本論文の最初のモデルと近くなっているので、最終的な結論には至りませんが、本論文の最初のモデルが最も可能性の高そうなシナリオとして支持されるようです。以下は本論文の図8です。
●HLA型とNAT002の骨肥厚症への遺伝的感受性
以前の研究では、HLA(ヒト白血球型抗原)B遺伝子、とくにHLA-B*27アレル(対立遺伝子)が、SAPHO症候群と強く関連している、と報告されました。したがって、以前の研究によりSAPHO症候群として推測されたNAT002の骨肥厚症への遺伝的感受性を調べるため、HLA-VBSeqとHLA EXPLORE を用いてNAT002のHLA型が決定されました。HLA-VBSeqでの型別における上位2つの平均深度はHLA-B*40:02:01(平均深度22.93倍)とHLA-B*40:06:01:01(平均深度12.57倍)で、NAT00がB*40:02:01とB*40:06:01:01の異型接合体だったことを示唆します。しかし、B*40:06:01アレル特有の配列はTARGTとHLA EXPLOREでは検出されませんでした。おそらく、HLA-VBSeqで識別されたB*40:06:01:01はHLA-C遺伝子座に由来するリードのミスマッピングで、それは、HLA-Bエクソン3におけるB*40:06:01特有の置換部位を含む100塩基対配列が、IMGT/HLAデータベースのリリース3.43.0におけるHLA-C配列とひじょうに高い同一性を示すからです。
他の古典的なHLA遺伝子も、HLA-VBSeqとTARGTとHLA EXPLOREで分類されました。HLA-VBSeqの結果から、NAT002はA*02:01:01(平均深度30.74倍)とC*15:02:01(平均深度33.33倍)とDQB1*05:03:01(平均深度35.07倍)の同型接合体で、DRB1*14:05:01(平均深度7.36倍)とDRB1*14:54:01(平均深度12.93倍)の異型接合体と示唆されました。しかしHLA-DRB1については、DRB1*14:05:01アレルはTARGTとHLA EXPLORE分析では検出されませんでした。これも、HLA-VBSeqのミスマッピングの結果と推測されます。
HLA 領域でNAT002の同型接合体と異型接合体を確認するため、NAT002配列データの別のアレル頻度が調べられました。HLA領域を含む約1000万塩基対におよぶ領域で、中間的な別のアレル頻度の明らかな欠如が観察され、ROH(runs of homozygosity)が示唆されました。ROHとは、両親からそれぞれ受け継いだと考えられる同じアレルのそろった状態が連続するゲノム領域(ホモ接合連続領域)で、長いROHを有する個体の両親は近縁関係にある、と推測されます。ROHは人口集団の規模と均一性を示せます。ROH区間の分布は、有効人口規模と、1個体内のハプロタイプの2コピー間の最終共通祖先の時間を反映しています。
6番染色体上でROHが観察される領域と他の領域との間の類似した配列深度を考えると、アレルの脱落である可能性は低そうです。HLA-DRA・DRB1・DRB5・DRB6を含むHLA-DR領域(参照ゲノムhs37d5では、HLA-DRB3・DRB4が含まれません)における比較的多い部位は、HLA-VBSeq分析でも示唆されているように、この領域におけるNAT002の異型接合体を示唆している可能性が高そうです。しかし、これらの部位の配列深度は他の部位よりも顕著に高く、この領域への配列のミスマッピングを示唆します。したがって最終的に、NAT002はA*02:01:01とB*40:02:01とC*15:02:01とDQB1*05:03:01の同型接合体と結論づけられますが、HLA遺伝子座で1個体が同型接合体であることは一般的に稀です。
本論文が把握している限りでは、SAPHO症候群とHLA-B*40アレルとの間の関連は充分には解明されていませんが、以前の研究では、SAPHO症候群の日本人患者6人のうち3人でHLA-B61(B*40:02やB*40:03やB*40:06などいくつかのHLA-B*40アレルを含む血清型)が検出されました。さらに、HLA-B*40アレルは、強直性脊椎炎や反応性関節炎や未分化脊椎関節症の危険性アレルの一つと報告されてきました。これらの疾患はSAPHO症候群と類似しており、骨肥厚症を伴う疾患でもあります。したがって、HLA型はNAT002における骨肥厚症への遺伝的感受性を部分的に説明できるかもしれません。ニブフ人ではHLA-B*40アレルが高頻度(1998年の研究では25.5%、現在のアレル頻度データベースでは31.2%)です。
NAT002とF23との間では、共有されるHLAアレルは観察されませんでした。F23では、A*24:02:01とB*15:01:01とC*03:03:01が同型接合体です。したがって、HLA遺伝子の観点では、同じ礼文島で発掘されたNAT002とF23との間の遺伝的関係を議論できません。しかし、NAT002とF23は両方、HLA 領域では同型接合体とみなされました。これは、おそらくNAT002とF23が小さな人口規模しか維持できなかったひじょうに小さな島で暮らしていた、という事実に起因するかもしれません。
●アジア東部/北東部人において高頻度で観察される形質の推定表現型
アジア東部/北東部人口集団と他の人口集団との間で顕著に異なる頻度を示す形質と関連するいくつかの一塩基多型について、NAT002の遺伝子型に基づいてNAT002の表現型が推測されました。NAT002は、耳垢の表現型を決定するABCC11遺伝子の一塩基多型(rs17822931)でAアレルの同型接合体を有しており、乾燥した耳垢だったと示唆されます。以前の研究では、オホーツク文化標本では乾燥した耳垢が高頻度(83.9%)と報告されました。
NAT002はADH1B遺伝子の一塩基多型(rs1229984)とALDH2遺伝子の一塩基多型(rs671)でGアレルの同型接合体を有しており、それぞれアルコールとアセトアルデヒドの代謝率と関連していて、アルコール耐性が示唆されます。アルコール不耐性のアレルは、アジア東部新石器時代農耕民に遺伝的影響を受けた人口集団において、シベリア人を含む他の人口集団よりも高頻度を示します。NAT002の推定されるアルコール耐性は、アジア東部農耕民よりもシベリアの狩猟採集民において高頻度で観察される表現型と関連しているようで、アジア北部人口集団とのNAT002の遺伝的類似性に対応しています。
●まとめ
北海道の礼文島の浜中2遺跡の先史時代オホーツク文化個体である、NAT002の高網羅率ゲノムが得られました。本論文の集団遺伝学的分析の結果から、NAT002と、ニブフ人やウリチ人などアムール川下流人口集団との間の密接な関係が示唆され、以前の形態学的およびmtDNA研究の結果を裏づけます。系統樹におけるNAT002への外部分枝の長さ(図5)は、現代のニブフ人およびウリチ人と同等で、死後損傷もしくは不充分な深度に起因する本論文の配列データの間違った遺伝子型呼び出しの小さな影響を示唆します。
NAT002のゲノムは、日本列島北部周辺の3系統(アムール川集団、「縄文人」、カムチャッカ半島集団)間の過去の混合事象を裏づけます。これらの混合事象で最古となるのは、「縄文人」系統とカムチャツカ系統との間だったようです。混合年代測定に基づくと、「縄文人」系統とカムチャツカ系統との間の混合は続縄文時代となる2000年前頃に起きた、と仮定されます。本論文が把握している限りでは、続縄文時代におけるカムチャッカ半島から日本列島北部への移住を示唆する考古学的証拠は報告されていませんが、本論文の結果は以前の遺伝学的研究と一致します。さらに、歯冠測定に基づく以前の形態学的研究も、続縄文時代におけるアジア大陸部から日本列島北部への移住を示唆していますが、移住の起源はカムチャッカ半島ではなくアムール川流域と推定されました。この混合事象を明らかにするには、続縄文時代標本のさらなるゲノム研究が必要です。
アムール川関連祖先系統の移動は、以前の考古学的証拠により示唆されたように、オホーツク文化の始まりに相当する1600年前頃に起きた可能性があります。本論文のゲノム研究は、アムール川流域からの移住の波が北海道におけるオホーツク文化開始の契機だった、との仮説を裏づけます。他方、アイヌ集団の形成過程へのオホーツク文化人の遺伝的寄与に関しては、最終的な結論には達しませんでした。
本論文の限界の一つは、オホーツク文化期の1個体(NAT002)のみに由来するゲノムデータに依存し、NAT002が先史時代のオホーツク文化人を代表できると仮定していることで、NAT002が他地域からの移住個体である可能性を完全には排除できません。炭素と窒素の同位体比からは、NAT002が同じ遺跡で発掘された先史時代オホーツク文化個体群の変異内に収まり、NAT002が礼文島のオホーツク文化の一般的な食習慣だった、と示唆されます。しかし、この事実はNAT002がこの地域で生まれたことを証明できません。以前の研究では、女性のコラーゲン代謝回転率が、思春期には0.060±0.040で、成長停止後は0.041±0.010だった、と報告されています。したがって、NAT002が移民だとしとても、移住後に充分な時間が経過した場合には、炭素と窒素の同位体比で移住前の食習慣が反映されないでしょう。
ストロンチウム同位体分析はNAT002の出生地を明らかにできるかもしれませんが、日本列島北部周辺のストロンチウム同位体の地理的分布図は利用できません。NAT002が先史時代オホーツク文化人を代表できるのかどうか調べる別の方法は、オホーツク文化個体の多くの標本を分析することです。したがって、複数のオホーツク文化標本を用いてのさらなるゲノム研究が、環オホーツク海地域周辺の人口史を明らかにするには必要です。さらに、本論文は特定の偏りのない混合年代測定において単一波動の移住モデルを想定しました。将来、オホーツク文化期のさまざまな時間区分の時点の複数個体のゲノムが、その詳細な移住様式(たとえば、単一、複数、継続)を明らかにできるかもしれません。環オホーツク海地域周辺の人口史についての提案に加えて、本論文は1000塩基対より長いDNA分子が特定の理想的な条件下でほぼ千年残存することも示唆しており、古代DNA研究への追加の洞察を提供できるかもしれません。
以上、本論文についてざっと見てきました。本論文は、オホーツク文化遺跡の1個体(NAT002)の高品質なゲノムデータを報告しており、たいへん意義深いと思います。本論文が指摘するように、NAT002がオホーツク文化集団を表しているとは断定できないものの、その可能性は高そうです。オホーツク文化集団は、続縄文時代集団とカムチャッカ半島集団との混合集団と、アムール川流域集団との混合により形成された、と推測されます。続縄文時代集団とカムチャッカ半島集団との混合は、考古学的裏づけはまだないようですが、mtDNA研究ではその可能性が示唆され、今後の古代ゲノム研究の進展が期待されます。続縄文時代集団とカムチャッカ半島集団との混合集団と、アムール川流域集団との混合は、オホーツク文化が始まった1600年前頃に起きたと推定されており、オホーツク文化が遺伝的に異なる集団間の混合により形成されたことを示唆します。もちろん本論文が指摘するように、こうした混合事象が1回だけではなく、複数回起きたり継続的だったりする可能性も考えられます。
オホーツク文化集団とアイヌ集団との遺伝的関係については、本論文では決定的な結論には至りませんでしたが、アイヌ集団の形成において、オホーツク文化集団が一定以上の遺伝的影響を残した可能性は高そうです。本論文で提示された最も可能性が高い混合モデルに従うと、遺伝的にほぼ「縄文人」の構成の擦文文化集団(69%)とオホーツク文化集団(31%)が混合し、この混合集団(71%)と「本土」日本人集団(29%)が混合したことにより、現代アイヌ集団が形成されました。江戸時代のアイヌ集団94標本のmtDNA分析によると、「本土」日本人型は28.1%を占めます(関連記事)。これは、江戸時代においてアイヌ集団と「本土」日本人集団との混合がすでにかなり進んでいたことを示唆します。
擦文文化集団が遺伝的にほぼ「縄文人」で、本論文のモデルが妥当だとすると、江戸時代アイヌ集団のゲノム構成は、単純計算で50%弱が擦文文化集団に由来することになります。以前の研究では、現代アイヌ集団のゲノムにおける「縄文人」構成要素の割合は66%と推定されていますが(関連記事)、その10~15%はオホーツク文化集団と「本土」日本人集団に由来するかもしれません。その意味でも、遺伝的にアイヌ集団を「縄文人」の単純な子孫と考えることはできず、「縄文人」以外の遺伝的影響はかなり大きかった、と考えるべきでしょう。
また、本論文でも改めて指摘されているように、アイヌ集団の重要な文化要素と考えられる熊崇拝の痕跡が、縄文時代と続縄文時代で見られないことも、オホーツク文化がアイヌ集団の形成に及ぼした重要な影響を示唆します。アジア北東部集団間の遺伝と文化の相関関係を検証した最近の研究でも、音楽でアイヌとコリャーク人とが比較的近いと示されており、アイヌ集団にアジア北東部集団が文化的影響を与えてきた、と示唆されます(関連記事)。アイヌは非縄文文化から多くの影響を受けて成立したのでしょう。
しかし、まだ擦文文化集団の古代ゲノム研究が進んでいないとはいえ、本論文の結果からは、擦文文化集団がアイヌ集団の最も重要な祖先となった可能性が高いと考えられ、文化的にも、オホーツク文化およびその後継のトビニタイ文化の消長からも、オホーツク文化集団に対する擦文文化集団の優位が示唆されます(関連記事)。その意味で、アイヌを遺伝的にも文化的にも単純に「縄文人」の子孫とは言えないとしても、アイヌは鎌倉時代に北海道に侵略してきた外来集団といった、現代日本社会の一部?で根強く支持されているかもしれない言説(関連記事)は的外れだと思います。
「縄文人」は、今ではアイヌなど一部の集団にしか遺伝的影響を残していないため、本論文の系統樹(図5a)で示されているように、アジア東部現代人集団との比較では特異な集団に位置づけられます。しかし、「縄文人」はユーラシア東部の人類集団間の複雑な相互作用により形成されたと考えられ、当時は「縄文人」のようにアジア東部現代人集団とは遺伝的に大きく異なる複数の集団が存在した、と考えられます(関連記事)。最近、「縄文人」に関する研究が大きく進展しており(関連記事)、今後は「縄文人」の時空間的にさらに広範囲の古代ゲノムデータが蓄積されていき、アイヌ集団との関係など日本列島も含めてユーラシア東部の人口史の解明が進むことを期待しています。
参考文献:
Sato T. et al.(2021): Whole-Genome Sequencing of a 900-Year-Old Human Skeleton Supports Two Past Migration Events from the Russian Far East to Northern Japan. Genome Biology and Evolution, 13, 9, evab192.
https://doi.org/10.1093/gbe/evab192
系統樹では、田園個体はパプア人およびユーラシア東部人口集団と一まとまりを形成しますが、MA-1とヤナRHSの2個体(ヤナUP)はユーラシア西部人口集団と遺伝的に密接です。詳細な経路はまだ議論の余地がありますが、これら古代人のゲノムは、ユーラシア東部への2回の過去の移住を示唆しています。一方は南方経路で、ユーラシア大陸南岸地域に沿って拡散し、もう一方の北方経路は、おそらくシベリアも含めてユーラシア中緯度の草原地帯を通って拡散しました。南方の移住の波は、アジア東部(本論文では、現在の中国と日本と朝鮮とモンゴルと台湾を含む地域として定義されます)および南東部の局所的人口集団に分化していったようです。北方の移住の波は南方の移住の波とおそらくはシベリアで混合し、チュクチ・カムチャッカ(チュクチ半島とカムチャッカ半島、図1a)の人口集団とアメリカ大陸先住民の起源となりました(関連記事)。さらに、新石器時代と青銅器時代以降の古代人ゲノムを分析したその後のいくつかの研究では、半島アジア大陸における新石器時代後の人口動態が明らかにされてきました(関連記事1および関連記事2)。
日本列島に関しては、完新世人口集団である「縄文人」のゲノムが報告されており(関連記事1および関連記事2)、南方移住の波系統からの深い分岐が示唆されています。しかし、新石器時代以後の日本列島の人口集団の遺伝的歴史は、この期間の古代ゲノムデータの不足ため、依然として不明です。いくつかの以前の研究では、現代日本列島の人口集団はアジア東部大陸部人口集団および/もしくはアジア北東部(本論文ではロシア極東に相当します)人口集団からの遺伝子流動の影響を受けたものの、その詳細な起源と移住の仮定は不明なままと示唆されています(関連記事)。したがって、そうした過去の移住の遺伝的特徴の解明も、日本列島周辺の人口史の理解の向上に重要です。考古学的証拠で示唆されているように、新石器時代後に日本列島に起きたように見える過去の主要な移住事象の一つは、先史時代オホーツク人による日本列島北部での定住です。
高度な海洋漁業と狩猟技術を有する先史時代狩猟採集文化であるオホーツク文化は、紀元後5世紀~13世紀まで、オホーツク海の南部沿岸地域に分布していました(図1a)。オホーツク文化の最も重要な特徴である海洋資源への依存は、以前の動物考古学および同位体研究により明らかになりました。じっさい、オホーツク文化の遺跡の分布は明らかに沿岸地域に限られています(図1a)。この特徴は、日本列島における先住の縄文文化(紀元前14000~紀元前300年頃)やその後の続縄文時代(紀元前3世紀~紀元後7世紀)や擦文時代(紀元後8~14世紀)とは大きく異なります(図1a)。
アジア北東部におけるオホーツク文化とその近隣古代文化との間の関係の観点では、オホーツク文化の遺跡から発掘された土器や鉄器や青銅器の一部が、ロシアのプリモルスキー(Primorski)地域で発展した、紀元後6~9世紀となるモヘ(Mohe、靺鞨)文化(図1a)遺跡で発見されたものと類似しています。さらに、オホーツク文化の遺跡から発掘されたセイウチの牙製の彫像や釣針は、オホーツク文化と紀元後5~17世紀となる古代コリャーク(Koryak)文化(図1a)との間の相互作用を示唆しており、それはセイウチが現在では北極海とベーリング海にしか分布していないからです。しかし、考古学的遺物のこれら文化間の共通性がヒトの移住と移住なしの交易のどちらに由来するのかは、不明なままです。
オホーツク文化人の起源は、考古学者と人類学者により長く議論されてきました。オホーツク文化人の骨格遺骸の形態学的研究は、アムール川流域周辺およびサハリン北部の現代人集団との類似性を示唆してきました。さらに、ミトコンドリアDNA(mtDNA)分析の結果は、形態学的証拠を裏づけます。mtDNAハプログループ(mtHg)Y1とG1bとN9bはアムール川下流人口集団間において高頻度で共有されており、オホーツク文化の骨格遺骸でよく検出され、オホーツク文化人のアムール川下流地域起源を示唆します。しかし、オホーツク文化人の包括的なゲノム規模データが欠けているため、最終的な結論にはまだ達していません。したがって、この研究の主な動機は、ゲノム規模データ分析に基づいてオホーツク文化人の遺伝的起源を理解することです。
考古学的証拠に基づくと、オホーツク文化は紀元後13世紀頃に消え、その原因は依然として不明です。これと関連して、オホーツク文化とその後のアイヌ文化との間の関係が調べられてきました。考古学者たちは、アイヌとフィン人とニブフ人とサーミ人などユーラシア北部の民族集団間で広く観察される宗教的慣行である熊崇拝もオホーツク文化人により共有されていた、と考えてきました。他方、そうした宗教的慣行の痕跡は、アイヌ文化期より前の縄文時代と続縄文時代の遺跡では発見されていません。アイヌ文化の熊崇拝はイオマンテで見られ、これは熊を犠牲にしてその精神をカムイ(アイヌ文化の神聖な存在)の世界に送る儀礼です。オホーツク文化では、ヒグマの安置された頭蓋骨がいくつかの住居遺跡で発見されており、熊崇拝と関連した宗教的慣行が示唆されます。
これは、オホーツク文化がアイヌ文化の形成に寄与したことを示唆します。いくつかの頭蓋学およびmtDNA研究は、アイヌとアジア北東部人口集団との間の遺伝的類似性を示唆してきました。頭蓋測定に基づく統計分析では、アジア北東部人がオホーツク海沿岸に居住するアイヌにわずかな遺伝的影響を残した、と示唆されました。アイヌ現代人のmtDNAとY染色体DNAの分析は、ニブフ人とアイヌとの間の母系および父系遺伝子プールの類似性を示唆します。これらの知見は、アジア北東部から(北海道を中心とする)日本列島北部への遺伝子流動の可能性として解釈されてきました。さらに、古代のmtDNAと頭蓋非計測的変異の研究は、オホーツク文化人とアムール川下流人口集団との間の密接な関係と、アムール川下流人口集団からアイヌへのオホーツク文化人経由の遺伝子流動を示唆しており、これはオホーツク文化人がアイヌ文化の確立に寄与した、との考古学的仮説を裏づけます。
しかし、これらの研究の形態学的もしくは遺伝学的指標は少なく、オホーツク文化人のアイヌへの遺伝的寄与について最終的な結論を提供できません。それは、こうした研究が統計的に人口集団の混合を評価できないからです。対照的に、統計的に人口集団の混合を評価できる現代人の最近のゲノム規模一塩基多型分析は、アムール川下流人口集団からアイヌへの遺伝子流動を検出していませんが、これはオホーツク文化人がアイヌに遺伝的に寄与したならば、予測されることです。したがって、さまざまな手法を用いた多くの研究がアイヌ集団の形成過程を解明する目的で行なわれてきましたが、オホーツク文化人がこの過程に遺伝的に寄与したのかどうかは不明なままです。
オホーツク文化人の形成過程と、アイヌへの遺伝的および文化的寄与を調べるため、国際的な学際的調査団が、北海道の礼文島の浜中2遺跡の発掘に着手しました(図1a)。2013年に、重度の骨肥厚症の成人女性のよく保存された骨格遺骸(NAT002)が、オホーツク文化期の最終段階となる貝塚の上部表面で回収されました(図1b・c)。NAT002の較正放射性炭素年代は紀元後1060~1155年(68.2%)と推定され、骨肥厚症は皮膚科学的観察なしの滑膜炎と痤瘡と膿疱症と骨肥厚症と骨炎(SAPHO)症候群と診断されました。
本論文は、NAT002の全ゲノム配列結果を報告し、オホーツク文化人の起源に関する問題と、アイヌ集団への遺伝的寄与に関する問題を解決します。本論文はNAT002のゲノムをアジア東部および北東部の現代の人口集団および最近報告されたアジア北東部古代人と比較します。この古代人には、朝鮮半島に近いロシアの沿岸地域の悪魔の門遺跡の7700年前頃の個体群(関連記事)や、プリモルスキー地域の新石器時代後個体群(関連記事)や、礼文島の浜中2遺跡に近い(図1a)船泊遺跡(関連記事)の縄文時代の女性個体(F23)が含まれます。また本論文は、NAT002の一部の骨で観察されたSAPHO症候群的骨肥厚症の遺伝的背景の特定も試みます。
NAT002のDNA保存状態は良好で、平均深度35.03倍のゲノム配列が得られました。これは埋葬と寒冷な環境と比較的新しい年代(紀元後11~12世紀)に起因すると考えられますNAT002はX染色体とY染色体にマップしたリード数の比から女性と推定され、これは形態学的およびアメロゲニン遺伝子に基づく以前の性別判定と一致します。以下は本論文の図1です。
●NAT002と隣接集団との間の遺伝的関係
アジア北東部人口集団に対するNAT002の遺伝的類似性を評価するため、49079ヶ所の一塩基多型で外群f3統計が計算されました。f3(ムブティ人;NAT002、X)では、NAT002は近隣地域のニブフ人とアイヌとウリチ人とF23に密接に関連しており、それに続いて密接なのが、イテリメン人(Itelmen)やコリャーク人(Koryak)を含むカムチャッカ半島人口集団、本州・四国・九州を中心とする日本列島「本土」人、オロチョン人(Oroqen)やダウール人(Daur)やホジェン人(Hezhen 、漢字表記では赫哲、一般にはNanai)を含むアムール川上流人口集団です(図2)。以下は本論文の図2です。
49079ヶ所の一塩基多型に基づく主成分分析(図3)も、NAT002が遺伝的にニブフ人およびウリチ人と密接であることを示唆し、以前の形態学的およびmtDNA研究を裏づけます。以下は本論文の図3です。
ADMIXTURE が2~10の系統構成要素(K=2~10)で実行されました(図4)。最小交差検証(CV)誤差はK=5の時に観察されました。NAT002は4つの遺伝的構成要素で混合された個体として表されました(図4)。緑色の構成要素(24.6%)は、広くアジア北東部人口集団で共有されています。青色の構成要素(15.8%)は、アジア東部人で広く共有されています。濃紺色の構成要素(33.2%)はF23とアイヌにおいてほぼ100%で観察されます。黄色の構成要素(26.4%)はイテリメン人およびコリャーク人に高い割合で共有されています。NAT002の構成要素の割合は、ニブフ人やウリチ人などアムール川下流人口集団と似ています。以下は本論文の図4です。
次に、NAT002とアジア北東部人との間の系統発生関係を推測するため、NAT002とF23とSGDP(サイモンズゲノム多様性計画)標本で観察される2556493ヶ所の多様体に基づくTreeMixが実行されました。NAT002とニブフ人とウリチ人は単系統性の一まとまりを形成し(図5a)、主成分分析およびADMIXTUREの結果と対応しています。2回の移住事象を想定した場合、遺伝子流動はF23からNAT002とニブフ人との間の共通祖先で観察されました(図5a)。
F23とウリチ人との間、およびNAT002とイテリメン人との間でも大規模な残余が観察され、それらの間の遺伝子流動が示唆されます(図5b)。ウリチ人と「縄文人」/アイヌとの間の遺伝的類似性は以前に報告されていました(関連記事)。さらに、NAT002とアジア北東部の前期新石器時代人の悪魔の門個体群との間の遺伝的類似性が、外群f3(ムブティ人;悪魔の門個体群、X)の計算により調べられました。検証人口集団間で、NAT002はニブフ人に次いで2番目位に高いf3値を示しました。この結果は古代人のゲノム間で共有された偏りの影響を受けた可能性がありますが、古代人のゲノム間の遺伝的類似性のそうした過大評価は、おもに配列の短さや死後の損傷の高頻度や比較された古代人2個体の不充分な深度に起因する可能性が高そうです。
悪魔の門個体群のゲノムにおける参照の偏りの程度は、低い網羅率のため比較的強くなるでしょう。しかし、NAT002ゲノムにおける参照の偏りは、本論文の遺伝子型コール閾値として用いられた、選別の水準0および1の現代日本人のゲノムの30倍の網羅率よりもさほど強くありませんでした。したがって、悪魔の門個体群とNAT002との間の観察された類似性は、大幅に過大評価される可能性は低そうです。f3(ムブティ人;悪魔の門個体群、NAT002)の高い値は、オホーツク文化人の起源がアムール川流域周辺にある、との仮説を裏づけます。他方、F23は低いf3値を示しており、日本列島北部からアムール川流域への「縄文人」系統の移住はおもに新石器時代後に起きた、と示唆され、ウリチ人における以前の混合年代を裏づけます。以下は本論文の図5です。
系統樹の接続形態を考慮すると(図5a)、f3(ムブティ人;NAT002、X)により示されるアムール川流域人口集団とNAT002との間の類似性は、密接な系統発生関係として解釈できます。これらの示唆された混合事象を確認するため、49079ヶ所の一塩基多型に基づくD(ムブティ人、X;ニブフ人、NAT002)検定が実行され、F23とアイヌとイテリメン人は有意な正の値を示しました(図6a)。古代人のゲノム間の共有された偏りのため、D(ムブティ人、F23;ニブフ人、NAT002)で観察された兆候の過大評価の可能性も考慮されねばなりませんが、F23とNAT002の参照の偏りは現代日本人の網羅率30倍のゲノムと比較してさほど強くないので、過大評価の程度はそれほど深刻ではないでしょう。混合兆候はD(ムブティ人、F23;アムール川流域集団、NAT002)とD(ムブティ人、イテリメン人;アムール川流域集団、NAT002)でも観察されました。この場合のアムール川流域人口集団とは、ウリチ人とオロチョン人とホジェン人とダウール人とシボ人(Xibo)です(図2)。これらの知見から、NAT002は3祖先的系統(アムール川流域集団、チュクチ・カムチャッカ集団、「縄文人」)間の混合個体だった、と示唆されます。
次にqpAdmモデルを用いて、NAT002と関連する過去の混合事象についてのこの仮説が検証されました。オロチョン人とイテリメン人とF23が、それぞれアムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の供給源人口集団の代表として用いられました。完全ランク付けモデルに対する提案された混合の尤度比検定(LRT)のP値は有意ではなく(P=0.14)、NAT002のゲノムはアムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の祖先系統(祖先系譜、祖先成分、ancestry)の混合として説明できます。アムール川流域集団とチュクチ・カムチャッカ集団と「縄文人」の推定された祖先系統は、それぞれ64.9±8.0%、21. 9±6.4%、13.2±4.3%です(図6c)。
アムール川流域集団とチュクチ・カムチャッカ集団からの推定される祖先系統の割合の比較的大きな標準誤差は、これら供給源人口集団間の密接な関係に起因するかもしれません。じっさい、ADMIXTURE分析(図4)で観察された黄色と赤色の構成要素は、チュクチ・カムチャッカ人口集団(イテリメン人とコリャーク人とエスキモーとチュクチ人)間で支配的ですが、ニブフ人やウリチ人やオロチョン人やホジェン人やダウール人やシボ人などアムール川流域人口集団でも広く観察されます。構成要素のこの共有は、アムール川流域人口集団とチュクチ・カムチャッカ人口集団との間の混合か、両者の間で部分的に共有される遺伝的浮動の結果のようです。さらに、入れ子モデルへのLRTでは、あらゆる2方向混合モデルがNAT002ゲノムを適切に説明できない、と示唆されます。以下は本論文の図6です。
●在来祖先系統と混合年代の推定
アムール川流域集団と「縄文人」とチュクチ・カムチャッカ集団の系統間の混合事象の順番を決定するため、NAT002ゲノムの在来祖先系統が推測されました。本論文の在来祖先系統推定は大陸内規模(つまり、アジア東部と北東部全参照人口集団)で行なわれましたが、NAT002ゲノムの大半は0.9以上の事後確率を有する3つの祖先的ハプロタイプの一つに分類できました。在来祖先系統の割合から計算された世界規模の祖先系統の割合は、アムール川流域集団が83.6%、チュクチ・カムチャッカ集団が10.0%、「縄文人」が6.4%です。
ADMIXTURE(図4)とqpAdm(図6c)の結果を考慮すると、「縄文人」とチュクチ・カムチャッカ集団の祖先系統の堀合は過小評価されているようで、おそらくは参照人口集団における「縄文人」とチュクチ・カムチャッカ個体の標本規模の小ささに起因します。「縄文人」は1個体(F23)のみで、チュクチ人やエスキモーなどチュクチ人口集団の5個体とともに、チュクチ・カムチャッカ参照人口集団におけるカムチャッカ人口集団の代表としてイテリメン人1個体のみが含まれています。
本論文は、3系統間の混合年代を推測するため、単純な波動移住モデルを想定しました。アムール川流域系統の移住年代はNAT002の22世代前と推定されました(図7)。1世代30年と仮定し、NAT002の放射性炭素年代(900年前頃)を考慮すると、アムール川流域関連祖先系統の移住は1600年前頃に起きました。これは、以前の考古学的証拠により示唆されるように、オホーツク文化の始まりと正確に対応していますが、本論文の混合年代は1個体のみの祖先系統の領域の長さに基づいています。
チュクチ・カムチャッカ系統と「縄文人」系統間の混合はNAT002の35世代前(1950年前頃)と推定され、縄文時代の後の続縄文時代(紀元前3~紀元後7世紀)と対応します。本論文が把握している限りでは、その期間のカムチャッカ半島から日本列島北部へのヒトの移住を示す考古学的証拠は提示されていませんが、以前の古代DNA研究は縄文時代標本と続縄文時代標本との間のmtHg特性の変化を報告しています。カムチャッカ半島人口集団においてひじょうに高頻度で観察されるmtHg-G1bは、続縄文時代の標本の15.0%で検出されますが、縄文時代標本では検出されません。さらに最近の研究では、千島列島南西部に位置する択捉島のタンコウォイェ1(Tankovoye 1)遺跡(図1a)の続縄文時代標本と、イテリメン人やコリャーク人などカムチャッカ半島現代人集団との間の遺伝的類似性が報告されました。これらの知見は、続縄文時代における千島列島を経由してのカムチャッカ半島から日本列島北部への移住の波を裏づけます。
本論文は、混合していないアイヌの10個体を参照「縄文人」に追加することにより、類似の混合年代測定を実行しました。この場合、NAT002における「縄文人」祖先系統の割合は増加し、アムール川流域祖先系統が64.4%、チュクチ・カムチャッカ祖先系統が9.8%、縄文人祖先系統が25.8%と推定されました。しかし、推定された混合年代は、アムール川流域関連祖先系統の移住についてはNAT002の17世代前(1410年前頃)、「縄文人」系統とカムチャッカ系統との間の混合についてはNAT002の37世代前(2010年前頃)と大きくは変わらず、本論文の混合年代は中程度の堅牢性を有する、と示唆されました。以下は本論文の図7です。
●アイヌ集団に対するオホーツク文化人の遺伝的寄与
アイヌ集団の形成過程は長く議論されてきました。しかし、アイヌと縄文時代個体群との間の遺伝的類似性は以前の研究で確認されてきましたが(関連記事)、新石器時代後の人口動態に関する決定的な結論には至っていません。F23と比較して主成分分析では、アイヌ個体群はわずかにアジア北東部人に影響を受けていると示唆されますが(図3)、ADMIXTURE分析の結果では、アイヌ個体群はほぼ単一の祖先系統で表される、と示唆されます。
したがって、縄文時代後のアジア北部人口集団からの遺伝的影響を確かめるため、D(ムブティ人、X;F23、アイヌ)検定が実行されました。その結果、アジア北部人口集団は有意に正の値を示しました。とくに、イテリメン人やコリャーク人などカムチャッカ半島人口集団と、ホジェン人やオロチョン人やシボ人やダウール人などアムール川流域人口集団は強い兆候を示しました。以前の研究では、アイヌとカムチャッカ半島人口集団との間の遺伝的類似性が報告されました。
アイヌ集団の形成過程をモデル化するため、qpGraphを用いて混合図が作成されました。まず、NAT002やF23やSGDP標本群を含む混合図が作成されました。アムール川流域系統と「縄文人」系統とカムチャッカ半島系統の間の混合事象の順序は、混合年代の結果にしたがって決定されました。図における最低のf4統計のZ得点は-2.1でした。次に、足場図(scaffold graph)にアイヌを追加することにより、アイヌ集団の形成過程が検証されました。アイヌは「縄文人」とオホーツク文化人と「本土」日本人の間の混合人口集団と仮定したモデルが、検証されたモデルの中で最適でした(図8a)。
しかし、オホーツク文化人からアイヌへの遺伝子流動を仮定しない別のモデルも許容されました(図8b)。最低のf4統計を考慮すると、オホーツク文化人からアイヌへの遺伝子流動を仮定する最初のモデル(図8a)が最も可能性の高いシナリオですが、混合図の枠組みでは2番目のモデル(図8b)を明示的に却下できませんでした。この二つのモデル間の顕著な違いの一つは、「本土」日本人からアイヌへの混合割合で、最初のモデルでは29%、二番目のモデルでは44%でした。以前の研究はmtHg頻度に基づいて、近世アイヌ集団における「縄文人」とオホーツク文化人と「本土」日本人の混合割合が推定されました(関連記事)。その研究では、アイヌへの「本土」日本人の遺伝的寄与は28.1%と推定され、本論文の最初のモデルと近くなっているので、最終的な結論には至りませんが、本論文の最初のモデルが最も可能性の高そうなシナリオとして支持されるようです。以下は本論文の図8です。
●HLA型とNAT002の骨肥厚症への遺伝的感受性
以前の研究では、HLA(ヒト白血球型抗原)B遺伝子、とくにHLA-B*27アレル(対立遺伝子)が、SAPHO症候群と強く関連している、と報告されました。したがって、以前の研究によりSAPHO症候群として推測されたNAT002の骨肥厚症への遺伝的感受性を調べるため、HLA-VBSeqとHLA EXPLORE を用いてNAT002のHLA型が決定されました。HLA-VBSeqでの型別における上位2つの平均深度はHLA-B*40:02:01(平均深度22.93倍)とHLA-B*40:06:01:01(平均深度12.57倍)で、NAT00がB*40:02:01とB*40:06:01:01の異型接合体だったことを示唆します。しかし、B*40:06:01アレル特有の配列はTARGTとHLA EXPLOREでは検出されませんでした。おそらく、HLA-VBSeqで識別されたB*40:06:01:01はHLA-C遺伝子座に由来するリードのミスマッピングで、それは、HLA-Bエクソン3におけるB*40:06:01特有の置換部位を含む100塩基対配列が、IMGT/HLAデータベースのリリース3.43.0におけるHLA-C配列とひじょうに高い同一性を示すからです。
他の古典的なHLA遺伝子も、HLA-VBSeqとTARGTとHLA EXPLOREで分類されました。HLA-VBSeqの結果から、NAT002はA*02:01:01(平均深度30.74倍)とC*15:02:01(平均深度33.33倍)とDQB1*05:03:01(平均深度35.07倍)の同型接合体で、DRB1*14:05:01(平均深度7.36倍)とDRB1*14:54:01(平均深度12.93倍)の異型接合体と示唆されました。しかしHLA-DRB1については、DRB1*14:05:01アレルはTARGTとHLA EXPLORE分析では検出されませんでした。これも、HLA-VBSeqのミスマッピングの結果と推測されます。
HLA 領域でNAT002の同型接合体と異型接合体を確認するため、NAT002配列データの別のアレル頻度が調べられました。HLA領域を含む約1000万塩基対におよぶ領域で、中間的な別のアレル頻度の明らかな欠如が観察され、ROH(runs of homozygosity)が示唆されました。ROHとは、両親からそれぞれ受け継いだと考えられる同じアレルのそろった状態が連続するゲノム領域(ホモ接合連続領域)で、長いROHを有する個体の両親は近縁関係にある、と推測されます。ROHは人口集団の規模と均一性を示せます。ROH区間の分布は、有効人口規模と、1個体内のハプロタイプの2コピー間の最終共通祖先の時間を反映しています。
6番染色体上でROHが観察される領域と他の領域との間の類似した配列深度を考えると、アレルの脱落である可能性は低そうです。HLA-DRA・DRB1・DRB5・DRB6を含むHLA-DR領域(参照ゲノムhs37d5では、HLA-DRB3・DRB4が含まれません)における比較的多い部位は、HLA-VBSeq分析でも示唆されているように、この領域におけるNAT002の異型接合体を示唆している可能性が高そうです。しかし、これらの部位の配列深度は他の部位よりも顕著に高く、この領域への配列のミスマッピングを示唆します。したがって最終的に、NAT002はA*02:01:01とB*40:02:01とC*15:02:01とDQB1*05:03:01の同型接合体と結論づけられますが、HLA遺伝子座で1個体が同型接合体であることは一般的に稀です。
本論文が把握している限りでは、SAPHO症候群とHLA-B*40アレルとの間の関連は充分には解明されていませんが、以前の研究では、SAPHO症候群の日本人患者6人のうち3人でHLA-B61(B*40:02やB*40:03やB*40:06などいくつかのHLA-B*40アレルを含む血清型)が検出されました。さらに、HLA-B*40アレルは、強直性脊椎炎や反応性関節炎や未分化脊椎関節症の危険性アレルの一つと報告されてきました。これらの疾患はSAPHO症候群と類似しており、骨肥厚症を伴う疾患でもあります。したがって、HLA型はNAT002における骨肥厚症への遺伝的感受性を部分的に説明できるかもしれません。ニブフ人ではHLA-B*40アレルが高頻度(1998年の研究では25.5%、現在のアレル頻度データベースでは31.2%)です。
NAT002とF23との間では、共有されるHLAアレルは観察されませんでした。F23では、A*24:02:01とB*15:01:01とC*03:03:01が同型接合体です。したがって、HLA遺伝子の観点では、同じ礼文島で発掘されたNAT002とF23との間の遺伝的関係を議論できません。しかし、NAT002とF23は両方、HLA 領域では同型接合体とみなされました。これは、おそらくNAT002とF23が小さな人口規模しか維持できなかったひじょうに小さな島で暮らしていた、という事実に起因するかもしれません。
●アジア東部/北東部人において高頻度で観察される形質の推定表現型
アジア東部/北東部人口集団と他の人口集団との間で顕著に異なる頻度を示す形質と関連するいくつかの一塩基多型について、NAT002の遺伝子型に基づいてNAT002の表現型が推測されました。NAT002は、耳垢の表現型を決定するABCC11遺伝子の一塩基多型(rs17822931)でAアレルの同型接合体を有しており、乾燥した耳垢だったと示唆されます。以前の研究では、オホーツク文化標本では乾燥した耳垢が高頻度(83.9%)と報告されました。
NAT002はADH1B遺伝子の一塩基多型(rs1229984)とALDH2遺伝子の一塩基多型(rs671)でGアレルの同型接合体を有しており、それぞれアルコールとアセトアルデヒドの代謝率と関連していて、アルコール耐性が示唆されます。アルコール不耐性のアレルは、アジア東部新石器時代農耕民に遺伝的影響を受けた人口集団において、シベリア人を含む他の人口集団よりも高頻度を示します。NAT002の推定されるアルコール耐性は、アジア東部農耕民よりもシベリアの狩猟採集民において高頻度で観察される表現型と関連しているようで、アジア北部人口集団とのNAT002の遺伝的類似性に対応しています。
●まとめ
北海道の礼文島の浜中2遺跡の先史時代オホーツク文化個体である、NAT002の高網羅率ゲノムが得られました。本論文の集団遺伝学的分析の結果から、NAT002と、ニブフ人やウリチ人などアムール川下流人口集団との間の密接な関係が示唆され、以前の形態学的およびmtDNA研究の結果を裏づけます。系統樹におけるNAT002への外部分枝の長さ(図5)は、現代のニブフ人およびウリチ人と同等で、死後損傷もしくは不充分な深度に起因する本論文の配列データの間違った遺伝子型呼び出しの小さな影響を示唆します。
NAT002のゲノムは、日本列島北部周辺の3系統(アムール川集団、「縄文人」、カムチャッカ半島集団)間の過去の混合事象を裏づけます。これらの混合事象で最古となるのは、「縄文人」系統とカムチャツカ系統との間だったようです。混合年代測定に基づくと、「縄文人」系統とカムチャツカ系統との間の混合は続縄文時代となる2000年前頃に起きた、と仮定されます。本論文が把握している限りでは、続縄文時代におけるカムチャッカ半島から日本列島北部への移住を示唆する考古学的証拠は報告されていませんが、本論文の結果は以前の遺伝学的研究と一致します。さらに、歯冠測定に基づく以前の形態学的研究も、続縄文時代におけるアジア大陸部から日本列島北部への移住を示唆していますが、移住の起源はカムチャッカ半島ではなくアムール川流域と推定されました。この混合事象を明らかにするには、続縄文時代標本のさらなるゲノム研究が必要です。
アムール川関連祖先系統の移動は、以前の考古学的証拠により示唆されたように、オホーツク文化の始まりに相当する1600年前頃に起きた可能性があります。本論文のゲノム研究は、アムール川流域からの移住の波が北海道におけるオホーツク文化開始の契機だった、との仮説を裏づけます。他方、アイヌ集団の形成過程へのオホーツク文化人の遺伝的寄与に関しては、最終的な結論には達しませんでした。
本論文の限界の一つは、オホーツク文化期の1個体(NAT002)のみに由来するゲノムデータに依存し、NAT002が先史時代のオホーツク文化人を代表できると仮定していることで、NAT002が他地域からの移住個体である可能性を完全には排除できません。炭素と窒素の同位体比からは、NAT002が同じ遺跡で発掘された先史時代オホーツク文化個体群の変異内に収まり、NAT002が礼文島のオホーツク文化の一般的な食習慣だった、と示唆されます。しかし、この事実はNAT002がこの地域で生まれたことを証明できません。以前の研究では、女性のコラーゲン代謝回転率が、思春期には0.060±0.040で、成長停止後は0.041±0.010だった、と報告されています。したがって、NAT002が移民だとしとても、移住後に充分な時間が経過した場合には、炭素と窒素の同位体比で移住前の食習慣が反映されないでしょう。
ストロンチウム同位体分析はNAT002の出生地を明らかにできるかもしれませんが、日本列島北部周辺のストロンチウム同位体の地理的分布図は利用できません。NAT002が先史時代オホーツク文化人を代表できるのかどうか調べる別の方法は、オホーツク文化個体の多くの標本を分析することです。したがって、複数のオホーツク文化標本を用いてのさらなるゲノム研究が、環オホーツク海地域周辺の人口史を明らかにするには必要です。さらに、本論文は特定の偏りのない混合年代測定において単一波動の移住モデルを想定しました。将来、オホーツク文化期のさまざまな時間区分の時点の複数個体のゲノムが、その詳細な移住様式(たとえば、単一、複数、継続)を明らかにできるかもしれません。環オホーツク海地域周辺の人口史についての提案に加えて、本論文は1000塩基対より長いDNA分子が特定の理想的な条件下でほぼ千年残存することも示唆しており、古代DNA研究への追加の洞察を提供できるかもしれません。
以上、本論文についてざっと見てきました。本論文は、オホーツク文化遺跡の1個体(NAT002)の高品質なゲノムデータを報告しており、たいへん意義深いと思います。本論文が指摘するように、NAT002がオホーツク文化集団を表しているとは断定できないものの、その可能性は高そうです。オホーツク文化集団は、続縄文時代集団とカムチャッカ半島集団との混合集団と、アムール川流域集団との混合により形成された、と推測されます。続縄文時代集団とカムチャッカ半島集団との混合は、考古学的裏づけはまだないようですが、mtDNA研究ではその可能性が示唆され、今後の古代ゲノム研究の進展が期待されます。続縄文時代集団とカムチャッカ半島集団との混合集団と、アムール川流域集団との混合は、オホーツク文化が始まった1600年前頃に起きたと推定されており、オホーツク文化が遺伝的に異なる集団間の混合により形成されたことを示唆します。もちろん本論文が指摘するように、こうした混合事象が1回だけではなく、複数回起きたり継続的だったりする可能性も考えられます。
オホーツク文化集団とアイヌ集団との遺伝的関係については、本論文では決定的な結論には至りませんでしたが、アイヌ集団の形成において、オホーツク文化集団が一定以上の遺伝的影響を残した可能性は高そうです。本論文で提示された最も可能性が高い混合モデルに従うと、遺伝的にほぼ「縄文人」の構成の擦文文化集団(69%)とオホーツク文化集団(31%)が混合し、この混合集団(71%)と「本土」日本人集団(29%)が混合したことにより、現代アイヌ集団が形成されました。江戸時代のアイヌ集団94標本のmtDNA分析によると、「本土」日本人型は28.1%を占めます(関連記事)。これは、江戸時代においてアイヌ集団と「本土」日本人集団との混合がすでにかなり進んでいたことを示唆します。
擦文文化集団が遺伝的にほぼ「縄文人」で、本論文のモデルが妥当だとすると、江戸時代アイヌ集団のゲノム構成は、単純計算で50%弱が擦文文化集団に由来することになります。以前の研究では、現代アイヌ集団のゲノムにおける「縄文人」構成要素の割合は66%と推定されていますが(関連記事)、その10~15%はオホーツク文化集団と「本土」日本人集団に由来するかもしれません。その意味でも、遺伝的にアイヌ集団を「縄文人」の単純な子孫と考えることはできず、「縄文人」以外の遺伝的影響はかなり大きかった、と考えるべきでしょう。
また、本論文でも改めて指摘されているように、アイヌ集団の重要な文化要素と考えられる熊崇拝の痕跡が、縄文時代と続縄文時代で見られないことも、オホーツク文化がアイヌ集団の形成に及ぼした重要な影響を示唆します。アジア北東部集団間の遺伝と文化の相関関係を検証した最近の研究でも、音楽でアイヌとコリャーク人とが比較的近いと示されており、アイヌ集団にアジア北東部集団が文化的影響を与えてきた、と示唆されます(関連記事)。アイヌは非縄文文化から多くの影響を受けて成立したのでしょう。
しかし、まだ擦文文化集団の古代ゲノム研究が進んでいないとはいえ、本論文の結果からは、擦文文化集団がアイヌ集団の最も重要な祖先となった可能性が高いと考えられ、文化的にも、オホーツク文化およびその後継のトビニタイ文化の消長からも、オホーツク文化集団に対する擦文文化集団の優位が示唆されます(関連記事)。その意味で、アイヌを遺伝的にも文化的にも単純に「縄文人」の子孫とは言えないとしても、アイヌは鎌倉時代に北海道に侵略してきた外来集団といった、現代日本社会の一部?で根強く支持されているかもしれない言説(関連記事)は的外れだと思います。
「縄文人」は、今ではアイヌなど一部の集団にしか遺伝的影響を残していないため、本論文の系統樹(図5a)で示されているように、アジア東部現代人集団との比較では特異な集団に位置づけられます。しかし、「縄文人」はユーラシア東部の人類集団間の複雑な相互作用により形成されたと考えられ、当時は「縄文人」のようにアジア東部現代人集団とは遺伝的に大きく異なる複数の集団が存在した、と考えられます(関連記事)。最近、「縄文人」に関する研究が大きく進展しており(関連記事)、今後は「縄文人」の時空間的にさらに広範囲の古代ゲノムデータが蓄積されていき、アイヌ集団との関係など日本列島も含めてユーラシア東部の人口史の解明が進むことを期待しています。
参考文献:
Sato T. et al.(2021): Whole-Genome Sequencing of a 900-Year-Old Human Skeleton Supports Two Past Migration Events from the Russian Far East to Northern Japan. Genome Biology and Evolution, 13, 9, evab192.
https://doi.org/10.1093/gbe/evab192
この記事へのコメント