初期オホーツク文化関連個体のゲノムデータ
初期オホーツク文化関連個体のゲノムデータを報告した研究(Sato et al., 2025)が公表されました。[]は本論文の参考文献の番号で、当ブログで過去に取り上げた研究のみを掲載しています。本論文は、浜中2遺跡で発見された、オホーツク文化初期となる5~6世紀頃の女性1個体(NAT004)のゲノムデータを報告し、そのゲノムがカムチャツカ半島集団的な遺伝的祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)と「縄文時代」の人類集団的な遺伝的祖先系統の混合で適切に説明でき、あるいはそれに加えてアムール川集団的な祖先系統の混合としてもモデル化できる可能性がある、と示しました。まだオホーツク文化関連個体のゲノムデータは少ないものの、アイヌ集団の成立過程との関連でも、オホーツク文化集団の遺伝学的研究は注目されます。なお、「縄文時代」との時代区分や「縄文人」との表記には問題があるでしょうが、煩雑になるので、以下では「縄文時代」と「縄文人」を「」では括りません。
以下の略称は、DNA(deoxyribonucleic acid、デオキシリボ核酸)、mtDNA(Mitochondrial DNA、ミトコンドリアDNA)、mtHg(mtDNA haplogroup、ミトコンドリアDNAハプログループ)、SNV(Single Nucleotide Variant、一塩基多様体)、PCA(principal component analysis、主成分分析)、ROH(runs of homozygosity、同型接合連続領域)、C(carbon、炭素)、RY(ratio of reads mapped to Y and X chromosomes、Y染色体とX染色体のマッピング読み取り比)、CI(confidence interval、信頼区間)です。本論文で取り上げられる主要な人類集団は、ニヴフ人(Nivkh)、イテリメン人(Itelman)、ウリチ人(Ulchi、Ulch)、オロチョン人(Oroqen)、ホジェン人(Hezhen 、漢字表記では赫哲、一般にはNanai)、ダウール人(Daur)、エスキモーのチャプリン人(Chaplin)とナウカン人(Naukan)とシレニック人(Sireniki)です。
●要約
先史時代のオホーツク文化は千年紀後半にオホーツク海の南部海岸地域に沿って分布していました。オホーツク後期の全ゲノム配列決定を実行した先行研究は、ロシア極東から日本北部への2回の移住の波を示唆しました。第1波は2000年前頃のカムチャツカ半島、第2波は1600年前頃のアムール川流域起源だった、と推定されています。これらの調査結果は、2000~1600年前頃の日本北部におけるカムチャッカ系統と縄文系統との間の混合した仮定的な人口集団の過去間存在を示唆していますが、直接的な証拠はまだ得られていませんでした。本論文は、日本北部から発掘されたオホーツク初期の1個体(NAT004)のゲノムデータを提示します。混合モデル化によって、NAT004のゲノムはカムチャッカ祖先系統と縄文祖先系統の混合としてモデル化できる、と明らかになり、以前に仮定された人口集団の存在の直接的裏づけを提供します。この結果は、日本北部の先史時代人口集団への新たな知見を提供し、その考古学的および人類学的歴史のより広範な理解に寄与します。
●研究史
先史時代の海洋適応型の狩猟採集文化であるオホーツク文化は、北海道の北部および東部や樺太や千島列島を含めて、オホーツク海の南部沿岸地域周辺で(図1)5~13世紀に発展しました。オホーツク文化の考古学的遺跡の分布は沿岸地域に局在しており、オホーツク文化の人々による海洋資源への依存を示唆しており、これは動物考古学および同位体研究によって裏づけられています。以下は本論文の図1です。
頭蓋形態と古代mtDNAに基づく先行研究では、オホーツク人はアムール川下流域起源だった、と示唆されました[10]。さらに、オホーツク文化の考古学的遺跡から発掘された土器や鉄器や青銅器の一部は、6~9世紀にアムール川流域で発展した靺鞨(Mohe)文化の遺跡の出土物と類似しています。さらに、日本北部【北海道】の礼文島の浜中2遺跡(図1)から発掘されたオホーツク後期の1個体(NAT002)の最近の全ゲノム解析では、NAT002の祖先系統の約60%はアムール川系統と関連していた、と推定され、オホーツク文化の人々の主要な起源はアムール川流域だった、と示唆されました[5]。アムール川関連祖先系統に加えて、混合モデル化はNAT002のゲノムにおける別の二つの祖先系統構成要素を検出し、それは縄文関連祖先系統とカムチャツカ関連祖先系統です。混合年代測定から、縄文関連祖先系統とカムチャツカ関連祖先系統の混合は、続縄文時代に相当する2000年前頃に起きた、と示唆されています。これは、1600年前頃となるアムール川流域からの推定される移住に先行します。
縄文人は日本列島の在来の新石器時代狩猟採集民で、アジア東部において独特な遺伝的特徴を示しました[12、13]。礼文島における縄文時代およびその後の続縄文時代と関連する考古学的遺跡の存在を考えると、アムール川流域から移住した人々が在来の縄文人と混合した、と考えられます。したがって、NAT002のゲノムにおける縄文関連祖先系統の存在はこの歴史的状況と一致します。しかし、カムチャツカ関連祖先系統は、考古学者にとって予期せぬ発見を表しています。この混合年代測定は、アムール川関連祖先系統の到来前に、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合を通じてすでに形成されていた、仮定的な人口集団の存在を示唆しています。しかし、その時点でのカムチャツカ半島からの移住の波の考古学的証拠は、これまで発見されていませんでした。上述の仮定的な人口集団の存在はNAT002のゲノムから間接的に推測されているだけで、その存在の直接的な証明には、縄文祖先系統とカムチャツカ祖先系統を有する個体の発見が必要です。さらに、アムール川関連祖先系統の以前に推定された混合年代は、具体的な証拠の欠如にも関わらず、単一波動の移住と仮定されていました。したがって、初期オホーツク文化個体群の祖先系統の割合がNAT002と類似しているのかどうかは、依然として不明です。
これらの問題に取り組むために、日本北部【北海道】の礼文島の浜中2遺跡(図1)で発掘された、十和田期の初期オホーツク文化個体(NAT004)のゲノム解析が実行されました。十和田期は、口縁部に隆起もしくは貫通円模様があることを特徴としており、樺太南部から北海道北部までの範囲の遺跡で発掘されてきました。NAT004の祖先系統は、縄文系統とカムチャツカ系統との間の混合から生じた、とモデル化でき、アムール川流域からの実質的な寄与はありません。
●NAT004配列データの基本統計とDNAの真正性
NAT004のゲノムについての基本的な情報は、補足表S1に要約されています。ショットガン末端組み合わせ配列決定とその後の品質管理の結果として、前後の読み取りはライブラリから合計で約20億得られました。これらのうち約8億6000万の重複する読み取りが併合されました。参照ゲノム(hs37d5)へのこれらの配列読み取りのマッピング(多少の違いを許容しつつ、ゲノム配列内の類似性が高い処理を同定する情報処理)率は、23.3%でした。重複読み取りの除去後に、平均深度0.98倍のゲノム配列データが得られました。古代DNAの典型的な脱アミノ化の特徴が観察されました。現代人のDNAの汚染率は、Schmutziを用いてmtDNAに基づくと0.02(95%CIでは0.01~0.03)、hapCon_ROH[17]を用いて常染色体に基づくと0.00(95%CIでは0.01~5.7 × 10⁻⁵)と推定されました。
NAT004の推定された内在性mtDNAハプロタイプはHaploGrep 2.0によって、現代人集団ではおもにニヴフ人で観察されるmtHg-D4m2aに割り当てられました。合計で172ヶ所のROHの塊が検出され、累積長は1744.93cMとなり、個体NAT004における強い近親交配が示唆されます。これは、礼文島が北海道島から取的に離れた比較的小さな陸地で(図1)、それによって先史時代には局所的な配偶集団の規模が限られていた可能性を考えると、妥当です。ry_compute.pyを用いて計算されたRY値は0.001(95%CIでは0.001~0.0011)で、NAT004が女性だったことを示唆しています。この結果は、形態学的観察と一致します。まとめると、これらの結果はNAT004の配列データの真正性を裏づけます。
●集団遺伝学的分析
外群f₃検定では、オホーツク文化初期の1個体であるNAT004には、とくに縄文人(船泊遺跡の女性個体F23)[6]やオホーツク文化後期の1個体(NAT002)[5]やニヴフ人やイテリメン人やウリチ人の個体群と強い遺伝的類似性があった、と示唆されました(図2)。f₃(ムブティ人;NAT004、F23)= 0.2499 ± 0.0031とf₃(ムブティ人;NAT004、NAT002)= 0.2459 ± 0.0028から、意外なことに、個体NAT004と最も強い遺伝的類似性を示す個体は、NAT004と同じオホーツク文化の1個体であるNAT002ではなく、縄文人の1個体であるF23でした。以下は本論文の図2です。
現代人集団と高網羅率の古代人2個体(F23とNAT002)のゲノムに基づくPCA(図3)では、NAT004はF23とよりもNAT002の方の近くに位置しており、NAT002と共有されている遺伝的特徴が示唆されるものの、微妙な差異が残っています。とくに、NAT004はNAT002よりもわずかに高い主成分2(PC2)得点を示します。このパターンから、NAT004はNAT002よりもやや少ないアムール川関連祖先系統を有している、と示唆されるかもしれません。同様のパターンは、分析が塩基転換(transversion、ピリミジン塩基とプリン塩基との間の置換)部位に限定された場合にも観察されました。すべてのSNV部位と塩基転換部位に基づくスピアマンの順位相関係数は、ひじょうに高いものでした(ρ = 0.997)。さらに、F23とNAT002とNAT004が、現代人集団の主成分に基づくPCAに投影され、NAT002とNAT004は一貫した相対的位置を維持しました。以下は本論文の図3です。
NAT002とNAT004との間の遺伝的差異に寄与した人口集団を調べるために、D(ムブティ人、X;NAT002、NAT004)が計算されました。検証された人口集団のうち、F23のみが有意に正の値(Z = 5.28)を示し、F23はNAT002とよりもNAT004の方と密接に関連していることが示唆されます。対照的に、すべての検証人口集団は、イテリメン人とF23を覗いて、有意な負の値(Z < -3.0)を示しました。同様のパターンは、分析が塩基転換部位に限定された場合に観察されました。すべてのSNV部位に基づくD(ムブティ人、X;NAT002、NAT004)と塩基転換部位に基づくD(ムブティ人、X;NAT002、NAT004)との間スピアマンの順位相関係数は、ひじょうに高度でした(ρ = 0.982)。これらのD検定の結果は強く偏っているようで、それは死後の脱アミノ化だけではなく、より重要なことに、低網羅率のNAT004のゲノムにおける参照の偏りに起因する可能性が高そうです。
そこで代わりに、この偏りにさほど敏感ではない、対での外群f₃検定が採用されました。f₃(ムブティ人、;NAT002、X)対f₃(ムブティ人、;NAT004、X)の対でのf₃図(図4)では、ニヴフ人とウリチ人とオロチョン人とダウール人とホジェン人を含めてアムール川人口集団が、回帰直線の下に位置する傾向にあります。対照的に、F23とイテリメン人は回帰直線のうえに位置する傾向にあります。これらの調査結果から、アムール川人口集団がNAT004とよりもNAT002の方とより密接に関連しているのに対して、F23とイテリメン人はNAT002とよりもNAT004の方と密接に関連している、と示唆されます。しかし、ニヴフ人とF23を除いて、他の人口集団はどれも回帰直線からの統計的に有意な逸脱を示しません。以下は本論文の図4です。
さらに、D(ムブティ人、X;F23、NAT004)とD(ムブティ人、X;F23、NAT004)が計算され、縄文時代後期からオホーツク文化初期もしくは後期にかけての遺伝的変化が評価されました。D統計では、NAT004はイテリメン人集団に強い影響を受けたものの、アムール川人口集団には強い影響を受けなかった(図5a)のに対して、NAT002はイテリメン人とアムール川人口集団の両方に強い影響を受けた(図5b)、と示唆されました。D(ムブティ人、X;F23、NAT004)は低網羅率のNAT004のゲノムのため参照の偏りにも影響を受けたかもしれませんが、結果は、NAT004がF23と比較してイテリメン人に強く影響を受けた、と示唆しています。この場合、低網羅率のNAT004のゲノムの参照の偏りから、D統計は負の方向に行くかもしれず、それは部分的には、ヒト参照ゲノムが明らかにアフリカ人に由来するからです。したがって、D統計は過大評価すべきではありません。以下は本論文の図5です。
対でのf₃検定では、同様の結果が得られました。f₃(ムブティ人;F23、X)対f₃(ムブティ人;NAT004、X)の図では、イテリメン人とエスキモー_チャプリン人とエスキモー_ナウカン人とエスキモー_シレニック人集団が回帰直線から有意に情報へと逸れており、カムチャツカ半島/チュコト(Chukotka)半島人口集団が縄文時代後期~オホーツク文化初期に日本北部【北海道】の人口集団に影響を及ぼしたのに対して、ニヴフ人やウリチ人やオロチョン人やホジェン人やダウール人は回帰直線から有意には逸れなかった、と示唆されます。f₃(ムブティ人;F23、X)対f₃(ムブティ人;NAT002、X)の図では、カムチャツカ半島/チュコト半島とアムール川の両人口集団が回帰直線から有意に逸れました。ニヴフ人ややオロチョン人やホジェン人やダウール人などアムール川人口集団の混合の兆候は、対でのf₃検定およびD検定の両方で、NAT004のゲノムにおいてカムチャツカ半島/チュコト半島人口集団よりも弱いものでした(図5a)。NAT004のこれらのゲノムの結果は、カムチャツカ半島/チュコト半島人口集団ではなくアムール川人口集団に強く英気を受けた、と推測されたNAT002とは明らかに異なるようです(図5b)。
オホーツク文化初期から後期のこの地域の人口集団における遺伝的変化をより詳しく評価するために、NAT004とNAT002について混合モデル化が実行されました(図6)。先行研究[5]と同様に、NAT002は縄文関連(F23によって表されます)とカムチャツカ関連(イテリメン人によって表されます)とアムール川関連(オロチョン人によって表されます)の混合個体として適切に説明されました。対照的に、NAT004は、アムール川関連祖先系統がない、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合個体として適切にモデル化されました。NAT004については3方向混合(縄文とカムチャツカとアムール川)混合モデルも許容されましたが、観察されたデータへの適合は、2方向(縄文とカムチャツカ)混合モデルと比較して、有意には改善されませんでした。塩基転換部位のみを用いてqpAdmモデルが実行されると、3方向と2方向の両モデルが却下され、これは多様体の数の減少から生じた偏差の増加に起因する可能性が高そうです。それにも関わらず、推定された祖先系統の割合はほぼ安定したままで、3方向モデルが2方向モデルよりも有意に良好な適合度を提供するわけではなかった、との結論は変わらないままでした。以下は本論文の図6です。
NAT002とNAT004についての混合モデル化の結果間の差異がゲノム網羅率には起因しなかった、と確証するために、NAT002の配列データが低解像度処理され、NAT004と同程度の網羅率の100点のデータセットが生成され、各低解像度処理されたデータセットで混合モデル化が実行されました。低解像度処理されたNAT002のデータセットはどれも、2方向混合モデルでは適切に説明されませんでした。対照的に、83点の適合度は3方向混合モデルで適切に説明されましたが、残りの17点は適切に説明されませんでした。この適合度の低いデータセットの数は、複数の検定に起因する偽陽性の予測数を上回りました。この超過は、低解像度処理に起因する精度低下と標本抽出の分散に起因する可能性が高そうです。それにも関わらず、入れ子モデルでの尤度比検定から、3方向モデルはどの2方向混合モデルと比較しても、すべての100点の低解像度処理されたNAT002のデータセットについて有意により良好ン適合度を提供した、と示唆されました。これらの調査結果から、NAT004の混合モデル化の結果は低網羅率の人為産物ではない、と示唆されます。むしろ、これらの調査結果から、NAT004のゲノムにおけるアムール川関連祖先系統の割合は、ゼロか、NAT002よりも有意に低かったのかどちらかである、と示唆されます。3方向モデルでは、アムール川祖先系統の割合は、NAT004では14.4%、NAT002では65.7%と推定されました(図6)。
NAT004の¹⁴C年代は紀元後409~600年(95.4%)で、これはこの地域におけるアムール川関連祖先系統の以前に推定された混合年代(1600年前頃)とひじょうに近くなります[5]。したがって、NAT004はアムール川流域からの移住の波の遺伝的影響の前に、日本北部【北海道】周辺に存在した人口集団の遺伝的特徴を反映しているかもしれません。さらに、NAT004の遺伝的特性は、縄文関連祖先系統とカムチャツカ関連祖先系統を有する混合個体として適切に説明でき、これはNAT002のゲノムを用いて以前に推測された[5]、アムール川流域からの移住の波に先行する仮定的な人口集団の遺伝的特性と一致します。じっさい、NAT002のゲノムはNAT004関連祖先系統とアムール川関連祖先系統との間の混合個体としても適切に説明されましたが(図5)、NAT004関連祖先系統のみでは説明されませんでした。さらに、NAT004のゲノムは縄文関連祖先系統のみでは適切に説明されませんでした。しかし、NAT002_モデルBにおけるNAT004関連祖先系統の割合(66.4%)は、NAT002_モデルAにおける縄文関連およびカムチャツカ関連祖先系統の混合の割合の合計(34.2%)よりずっと高くなっていました(図6)。この結果から、NAT004のゲノムはアムール川関連祖先系統を保持している、と示唆されます。じっさい、NAT004の3方向混合モデル(縄文関連祖先系統が45.8%、カムチャツカ関連祖先系統が39.7%、アムール川関連祖先系統が14.4%)も許容可能でしたが、このモデルは2方向混合モデル(縄文関連祖先系統が51.4%、カムチャツカ関連祖先系統が48.6%、)より有意に良好ではありませんでした。さらに、これらの可能性が真であるとしも、縄文関連祖先系統とカムチャツカ関連祖先系統で構成される人口集団がアムール川流域からの移住の前に存在しなければ、NAT004のような遺伝的特徴の個体群の存在を説明することは困難でしょう。
全体的に、本論文で得られた結果は、先行研究[5]で推測された移住の波の順序と一致しており、まず、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合が起き、その後でアムール川関連祖先系統との混合が続きました。しかし、混合年代測定では、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合はNAT004の25±8世代前だった、と推定され、これは1世代の時間を30年と仮定すると、2250±240年前に相当します。塩基転換部位のみを使用した場合、この混合事象は【NAT004の】31±8世代前に起きた、と推定され、すべてのSNV部位を用いて得られた推定値からの有意な違いを示しませんでした。これらの推定値は、NAT002のゲノムに基づく1950年前頃との以前に報告された混合年代[5]よりわずかに古いものの、すべてのSNV部位を用いてのNAT004の推定とNAT002の推定値との間の違いは、統計的に有意ではありません。NAT004のゲノム(すべてのSNV部位を用いる場合と塩基転換部位のみを用いる場合)に基づく2点の推定値と、NAT002のゲノムに基づく1点の推定値[5]の3点すべての推定値から、縄文系統とカムチャツカ系統との間の混合は縄文時代後期と続縄文時代初期に起きた、と示唆されます。
この研究の限界の一つは、オホーツク文化の初期の1個体(NAT004)のみと後期の1個体(NAT002)のみに由来するゲノムデータに依存しており、これらの個体が初期もしくは後期オホーツク文化集団の代表である、と仮定されていることです。しかし、これらの個体が別の地域からの移住個体(つまり、人口集団の外れ値)である可能性を、完全には除外できません。この問題を解決するには、多数のオホーツク文化標本を用いたさらなるゲノム研究が必要です。
●まとめ
NAT004のゲノムが提供する直接的な証拠は、依然にNAT002のゲノムから推測された、縄文関連祖先系統とカムチャツカ関連祖先系統で構成される仮定的な人口集団の存在を裏づけます。日本北部から発掘されたより多くの数の古代の個体群を対象とした将来の分析は、カムチャツカ関連半島/アムール川流域からの移住の年代と種類(単一の波動なのか、複数の波動なのか、連続的なのか)、および移住事象の前後の人口集団の遺伝的特徴を、より正確に判断できるかもしれません。
参考文献:
Sato T. et al.(2025): Genome of an early Okhotsk individual reveals ancient admixture between Jomon and Kamchatka lineages. Scientific Reports, 15, 37520.
https://doi.org/10.1038/s41598-025-21522-4
[5]Sato T. et al.(2021): Whole-Genome Sequencing of a 900-Year-Old Human Skeleton Supports Two Past Migration Events from the Russian Far East to Northern Japan. Genome Biology and Evolution, 13, 9, evab192.
https://doi.org/10.1093/gbe/evab192
関連記事
[6]Kanzawa-Kiriyama H. et al.(2019): Late Jomon male and female genome sequences from the Funadomari site in Hokkaido, Japan. Anthropological Science, 127, 2, 83–108.
https://doi.org/10.1537/ase.190415
関連記事
[10]Sato T. et al.(2009): Mitochondrial DNA haplogrouping of the Okhotsk people based on analysis of ancient DNA: an intermediate of gene flow from the continental Sakhalin people to the Ainu. Anthropological Science, 117, 3, 171–180.
https://doi.org/10.1537/ase.081202
関連記事
[12]Gakuhari T. et al.(2020): Ancient Jomon genome sequence analysis sheds light on migration patterns of early East Asian populations. Communications Biology, 3, 437.
https://doi.org/10.1038/s42003-020-01162-2
関連記事
[13]Kanzawa-Kiriyama H. et al.(2017): A partial nuclear genome of the Jomons who lived 3000 years ago in Fukushima, Japan. Journal of Human Genetics, 62, 2, 213–221.
https://doi.org/10.1038/jhg.2016.110
関連記事
[17]Posth C. et al.(2023): Palaeogenomics of Upper Palaeolithic to Neolithic European hunter-gatherers. Nature, 615, 7950, 117–126.
https://doi.org/10.1038/s41586-023-05726-0
関連記事
以下の略称は、DNA(deoxyribonucleic acid、デオキシリボ核酸)、mtDNA(Mitochondrial DNA、ミトコンドリアDNA)、mtHg(mtDNA haplogroup、ミトコンドリアDNAハプログループ)、SNV(Single Nucleotide Variant、一塩基多様体)、PCA(principal component analysis、主成分分析)、ROH(runs of homozygosity、同型接合連続領域)、C(carbon、炭素)、RY(ratio of reads mapped to Y and X chromosomes、Y染色体とX染色体のマッピング読み取り比)、CI(confidence interval、信頼区間)です。本論文で取り上げられる主要な人類集団は、ニヴフ人(Nivkh)、イテリメン人(Itelman)、ウリチ人(Ulchi、Ulch)、オロチョン人(Oroqen)、ホジェン人(Hezhen 、漢字表記では赫哲、一般にはNanai)、ダウール人(Daur)、エスキモーのチャプリン人(Chaplin)とナウカン人(Naukan)とシレニック人(Sireniki)です。
●要約
先史時代のオホーツク文化は千年紀後半にオホーツク海の南部海岸地域に沿って分布していました。オホーツク後期の全ゲノム配列決定を実行した先行研究は、ロシア極東から日本北部への2回の移住の波を示唆しました。第1波は2000年前頃のカムチャツカ半島、第2波は1600年前頃のアムール川流域起源だった、と推定されています。これらの調査結果は、2000~1600年前頃の日本北部におけるカムチャッカ系統と縄文系統との間の混合した仮定的な人口集団の過去間存在を示唆していますが、直接的な証拠はまだ得られていませんでした。本論文は、日本北部から発掘されたオホーツク初期の1個体(NAT004)のゲノムデータを提示します。混合モデル化によって、NAT004のゲノムはカムチャッカ祖先系統と縄文祖先系統の混合としてモデル化できる、と明らかになり、以前に仮定された人口集団の存在の直接的裏づけを提供します。この結果は、日本北部の先史時代人口集団への新たな知見を提供し、その考古学的および人類学的歴史のより広範な理解に寄与します。
●研究史
先史時代の海洋適応型の狩猟採集文化であるオホーツク文化は、北海道の北部および東部や樺太や千島列島を含めて、オホーツク海の南部沿岸地域周辺で(図1)5~13世紀に発展しました。オホーツク文化の考古学的遺跡の分布は沿岸地域に局在しており、オホーツク文化の人々による海洋資源への依存を示唆しており、これは動物考古学および同位体研究によって裏づけられています。以下は本論文の図1です。
頭蓋形態と古代mtDNAに基づく先行研究では、オホーツク人はアムール川下流域起源だった、と示唆されました[10]。さらに、オホーツク文化の考古学的遺跡から発掘された土器や鉄器や青銅器の一部は、6~9世紀にアムール川流域で発展した靺鞨(Mohe)文化の遺跡の出土物と類似しています。さらに、日本北部【北海道】の礼文島の浜中2遺跡(図1)から発掘されたオホーツク後期の1個体(NAT002)の最近の全ゲノム解析では、NAT002の祖先系統の約60%はアムール川系統と関連していた、と推定され、オホーツク文化の人々の主要な起源はアムール川流域だった、と示唆されました[5]。アムール川関連祖先系統に加えて、混合モデル化はNAT002のゲノムにおける別の二つの祖先系統構成要素を検出し、それは縄文関連祖先系統とカムチャツカ関連祖先系統です。混合年代測定から、縄文関連祖先系統とカムチャツカ関連祖先系統の混合は、続縄文時代に相当する2000年前頃に起きた、と示唆されています。これは、1600年前頃となるアムール川流域からの推定される移住に先行します。
縄文人は日本列島の在来の新石器時代狩猟採集民で、アジア東部において独特な遺伝的特徴を示しました[12、13]。礼文島における縄文時代およびその後の続縄文時代と関連する考古学的遺跡の存在を考えると、アムール川流域から移住した人々が在来の縄文人と混合した、と考えられます。したがって、NAT002のゲノムにおける縄文関連祖先系統の存在はこの歴史的状況と一致します。しかし、カムチャツカ関連祖先系統は、考古学者にとって予期せぬ発見を表しています。この混合年代測定は、アムール川関連祖先系統の到来前に、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合を通じてすでに形成されていた、仮定的な人口集団の存在を示唆しています。しかし、その時点でのカムチャツカ半島からの移住の波の考古学的証拠は、これまで発見されていませんでした。上述の仮定的な人口集団の存在はNAT002のゲノムから間接的に推測されているだけで、その存在の直接的な証明には、縄文祖先系統とカムチャツカ祖先系統を有する個体の発見が必要です。さらに、アムール川関連祖先系統の以前に推定された混合年代は、具体的な証拠の欠如にも関わらず、単一波動の移住と仮定されていました。したがって、初期オホーツク文化個体群の祖先系統の割合がNAT002と類似しているのかどうかは、依然として不明です。
これらの問題に取り組むために、日本北部【北海道】の礼文島の浜中2遺跡(図1)で発掘された、十和田期の初期オホーツク文化個体(NAT004)のゲノム解析が実行されました。十和田期は、口縁部に隆起もしくは貫通円模様があることを特徴としており、樺太南部から北海道北部までの範囲の遺跡で発掘されてきました。NAT004の祖先系統は、縄文系統とカムチャツカ系統との間の混合から生じた、とモデル化でき、アムール川流域からの実質的な寄与はありません。
●NAT004配列データの基本統計とDNAの真正性
NAT004のゲノムについての基本的な情報は、補足表S1に要約されています。ショットガン末端組み合わせ配列決定とその後の品質管理の結果として、前後の読み取りはライブラリから合計で約20億得られました。これらのうち約8億6000万の重複する読み取りが併合されました。参照ゲノム(hs37d5)へのこれらの配列読み取りのマッピング(多少の違いを許容しつつ、ゲノム配列内の類似性が高い処理を同定する情報処理)率は、23.3%でした。重複読み取りの除去後に、平均深度0.98倍のゲノム配列データが得られました。古代DNAの典型的な脱アミノ化の特徴が観察されました。現代人のDNAの汚染率は、Schmutziを用いてmtDNAに基づくと0.02(95%CIでは0.01~0.03)、hapCon_ROH[17]を用いて常染色体に基づくと0.00(95%CIでは0.01~5.7 × 10⁻⁵)と推定されました。
NAT004の推定された内在性mtDNAハプロタイプはHaploGrep 2.0によって、現代人集団ではおもにニヴフ人で観察されるmtHg-D4m2aに割り当てられました。合計で172ヶ所のROHの塊が検出され、累積長は1744.93cMとなり、個体NAT004における強い近親交配が示唆されます。これは、礼文島が北海道島から取的に離れた比較的小さな陸地で(図1)、それによって先史時代には局所的な配偶集団の規模が限られていた可能性を考えると、妥当です。ry_compute.pyを用いて計算されたRY値は0.001(95%CIでは0.001~0.0011)で、NAT004が女性だったことを示唆しています。この結果は、形態学的観察と一致します。まとめると、これらの結果はNAT004の配列データの真正性を裏づけます。
●集団遺伝学的分析
外群f₃検定では、オホーツク文化初期の1個体であるNAT004には、とくに縄文人(船泊遺跡の女性個体F23)[6]やオホーツク文化後期の1個体(NAT002)[5]やニヴフ人やイテリメン人やウリチ人の個体群と強い遺伝的類似性があった、と示唆されました(図2)。f₃(ムブティ人;NAT004、F23)= 0.2499 ± 0.0031とf₃(ムブティ人;NAT004、NAT002)= 0.2459 ± 0.0028から、意外なことに、個体NAT004と最も強い遺伝的類似性を示す個体は、NAT004と同じオホーツク文化の1個体であるNAT002ではなく、縄文人の1個体であるF23でした。以下は本論文の図2です。
現代人集団と高網羅率の古代人2個体(F23とNAT002)のゲノムに基づくPCA(図3)では、NAT004はF23とよりもNAT002の方の近くに位置しており、NAT002と共有されている遺伝的特徴が示唆されるものの、微妙な差異が残っています。とくに、NAT004はNAT002よりもわずかに高い主成分2(PC2)得点を示します。このパターンから、NAT004はNAT002よりもやや少ないアムール川関連祖先系統を有している、と示唆されるかもしれません。同様のパターンは、分析が塩基転換(transversion、ピリミジン塩基とプリン塩基との間の置換)部位に限定された場合にも観察されました。すべてのSNV部位と塩基転換部位に基づくスピアマンの順位相関係数は、ひじょうに高いものでした(ρ = 0.997)。さらに、F23とNAT002とNAT004が、現代人集団の主成分に基づくPCAに投影され、NAT002とNAT004は一貫した相対的位置を維持しました。以下は本論文の図3です。
NAT002とNAT004との間の遺伝的差異に寄与した人口集団を調べるために、D(ムブティ人、X;NAT002、NAT004)が計算されました。検証された人口集団のうち、F23のみが有意に正の値(Z = 5.28)を示し、F23はNAT002とよりもNAT004の方と密接に関連していることが示唆されます。対照的に、すべての検証人口集団は、イテリメン人とF23を覗いて、有意な負の値(Z < -3.0)を示しました。同様のパターンは、分析が塩基転換部位に限定された場合に観察されました。すべてのSNV部位に基づくD(ムブティ人、X;NAT002、NAT004)と塩基転換部位に基づくD(ムブティ人、X;NAT002、NAT004)との間スピアマンの順位相関係数は、ひじょうに高度でした(ρ = 0.982)。これらのD検定の結果は強く偏っているようで、それは死後の脱アミノ化だけではなく、より重要なことに、低網羅率のNAT004のゲノムにおける参照の偏りに起因する可能性が高そうです。
そこで代わりに、この偏りにさほど敏感ではない、対での外群f₃検定が採用されました。f₃(ムブティ人、;NAT002、X)対f₃(ムブティ人、;NAT004、X)の対でのf₃図(図4)では、ニヴフ人とウリチ人とオロチョン人とダウール人とホジェン人を含めてアムール川人口集団が、回帰直線の下に位置する傾向にあります。対照的に、F23とイテリメン人は回帰直線のうえに位置する傾向にあります。これらの調査結果から、アムール川人口集団がNAT004とよりもNAT002の方とより密接に関連しているのに対して、F23とイテリメン人はNAT002とよりもNAT004の方と密接に関連している、と示唆されます。しかし、ニヴフ人とF23を除いて、他の人口集団はどれも回帰直線からの統計的に有意な逸脱を示しません。以下は本論文の図4です。
さらに、D(ムブティ人、X;F23、NAT004)とD(ムブティ人、X;F23、NAT004)が計算され、縄文時代後期からオホーツク文化初期もしくは後期にかけての遺伝的変化が評価されました。D統計では、NAT004はイテリメン人集団に強い影響を受けたものの、アムール川人口集団には強い影響を受けなかった(図5a)のに対して、NAT002はイテリメン人とアムール川人口集団の両方に強い影響を受けた(図5b)、と示唆されました。D(ムブティ人、X;F23、NAT004)は低網羅率のNAT004のゲノムのため参照の偏りにも影響を受けたかもしれませんが、結果は、NAT004がF23と比較してイテリメン人に強く影響を受けた、と示唆しています。この場合、低網羅率のNAT004のゲノムの参照の偏りから、D統計は負の方向に行くかもしれず、それは部分的には、ヒト参照ゲノムが明らかにアフリカ人に由来するからです。したがって、D統計は過大評価すべきではありません。以下は本論文の図5です。
対でのf₃検定では、同様の結果が得られました。f₃(ムブティ人;F23、X)対f₃(ムブティ人;NAT004、X)の図では、イテリメン人とエスキモー_チャプリン人とエスキモー_ナウカン人とエスキモー_シレニック人集団が回帰直線から有意に情報へと逸れており、カムチャツカ半島/チュコト(Chukotka)半島人口集団が縄文時代後期~オホーツク文化初期に日本北部【北海道】の人口集団に影響を及ぼしたのに対して、ニヴフ人やウリチ人やオロチョン人やホジェン人やダウール人は回帰直線から有意には逸れなかった、と示唆されます。f₃(ムブティ人;F23、X)対f₃(ムブティ人;NAT002、X)の図では、カムチャツカ半島/チュコト半島とアムール川の両人口集団が回帰直線から有意に逸れました。ニヴフ人ややオロチョン人やホジェン人やダウール人などアムール川人口集団の混合の兆候は、対でのf₃検定およびD検定の両方で、NAT004のゲノムにおいてカムチャツカ半島/チュコト半島人口集団よりも弱いものでした(図5a)。NAT004のこれらのゲノムの結果は、カムチャツカ半島/チュコト半島人口集団ではなくアムール川人口集団に強く英気を受けた、と推測されたNAT002とは明らかに異なるようです(図5b)。
オホーツク文化初期から後期のこの地域の人口集団における遺伝的変化をより詳しく評価するために、NAT004とNAT002について混合モデル化が実行されました(図6)。先行研究[5]と同様に、NAT002は縄文関連(F23によって表されます)とカムチャツカ関連(イテリメン人によって表されます)とアムール川関連(オロチョン人によって表されます)の混合個体として適切に説明されました。対照的に、NAT004は、アムール川関連祖先系統がない、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合個体として適切にモデル化されました。NAT004については3方向混合(縄文とカムチャツカとアムール川)混合モデルも許容されましたが、観察されたデータへの適合は、2方向(縄文とカムチャツカ)混合モデルと比較して、有意には改善されませんでした。塩基転換部位のみを用いてqpAdmモデルが実行されると、3方向と2方向の両モデルが却下され、これは多様体の数の減少から生じた偏差の増加に起因する可能性が高そうです。それにも関わらず、推定された祖先系統の割合はほぼ安定したままで、3方向モデルが2方向モデルよりも有意に良好な適合度を提供するわけではなかった、との結論は変わらないままでした。以下は本論文の図6です。
NAT002とNAT004についての混合モデル化の結果間の差異がゲノム網羅率には起因しなかった、と確証するために、NAT002の配列データが低解像度処理され、NAT004と同程度の網羅率の100点のデータセットが生成され、各低解像度処理されたデータセットで混合モデル化が実行されました。低解像度処理されたNAT002のデータセットはどれも、2方向混合モデルでは適切に説明されませんでした。対照的に、83点の適合度は3方向混合モデルで適切に説明されましたが、残りの17点は適切に説明されませんでした。この適合度の低いデータセットの数は、複数の検定に起因する偽陽性の予測数を上回りました。この超過は、低解像度処理に起因する精度低下と標本抽出の分散に起因する可能性が高そうです。それにも関わらず、入れ子モデルでの尤度比検定から、3方向モデルはどの2方向混合モデルと比較しても、すべての100点の低解像度処理されたNAT002のデータセットについて有意により良好ン適合度を提供した、と示唆されました。これらの調査結果から、NAT004の混合モデル化の結果は低網羅率の人為産物ではない、と示唆されます。むしろ、これらの調査結果から、NAT004のゲノムにおけるアムール川関連祖先系統の割合は、ゼロか、NAT002よりも有意に低かったのかどちらかである、と示唆されます。3方向モデルでは、アムール川祖先系統の割合は、NAT004では14.4%、NAT002では65.7%と推定されました(図6)。
NAT004の¹⁴C年代は紀元後409~600年(95.4%)で、これはこの地域におけるアムール川関連祖先系統の以前に推定された混合年代(1600年前頃)とひじょうに近くなります[5]。したがって、NAT004はアムール川流域からの移住の波の遺伝的影響の前に、日本北部【北海道】周辺に存在した人口集団の遺伝的特徴を反映しているかもしれません。さらに、NAT004の遺伝的特性は、縄文関連祖先系統とカムチャツカ関連祖先系統を有する混合個体として適切に説明でき、これはNAT002のゲノムを用いて以前に推測された[5]、アムール川流域からの移住の波に先行する仮定的な人口集団の遺伝的特性と一致します。じっさい、NAT002のゲノムはNAT004関連祖先系統とアムール川関連祖先系統との間の混合個体としても適切に説明されましたが(図5)、NAT004関連祖先系統のみでは説明されませんでした。さらに、NAT004のゲノムは縄文関連祖先系統のみでは適切に説明されませんでした。しかし、NAT002_モデルBにおけるNAT004関連祖先系統の割合(66.4%)は、NAT002_モデルAにおける縄文関連およびカムチャツカ関連祖先系統の混合の割合の合計(34.2%)よりずっと高くなっていました(図6)。この結果から、NAT004のゲノムはアムール川関連祖先系統を保持している、と示唆されます。じっさい、NAT004の3方向混合モデル(縄文関連祖先系統が45.8%、カムチャツカ関連祖先系統が39.7%、アムール川関連祖先系統が14.4%)も許容可能でしたが、このモデルは2方向混合モデル(縄文関連祖先系統が51.4%、カムチャツカ関連祖先系統が48.6%、)より有意に良好ではありませんでした。さらに、これらの可能性が真であるとしも、縄文関連祖先系統とカムチャツカ関連祖先系統で構成される人口集団がアムール川流域からの移住の前に存在しなければ、NAT004のような遺伝的特徴の個体群の存在を説明することは困難でしょう。
全体的に、本論文で得られた結果は、先行研究[5]で推測された移住の波の順序と一致しており、まず、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合が起き、その後でアムール川関連祖先系統との混合が続きました。しかし、混合年代測定では、縄文関連祖先系統とカムチャツカ関連祖先系統との間の混合はNAT004の25±8世代前だった、と推定され、これは1世代の時間を30年と仮定すると、2250±240年前に相当します。塩基転換部位のみを使用した場合、この混合事象は【NAT004の】31±8世代前に起きた、と推定され、すべてのSNV部位を用いて得られた推定値からの有意な違いを示しませんでした。これらの推定値は、NAT002のゲノムに基づく1950年前頃との以前に報告された混合年代[5]よりわずかに古いものの、すべてのSNV部位を用いてのNAT004の推定とNAT002の推定値との間の違いは、統計的に有意ではありません。NAT004のゲノム(すべてのSNV部位を用いる場合と塩基転換部位のみを用いる場合)に基づく2点の推定値と、NAT002のゲノムに基づく1点の推定値[5]の3点すべての推定値から、縄文系統とカムチャツカ系統との間の混合は縄文時代後期と続縄文時代初期に起きた、と示唆されます。
この研究の限界の一つは、オホーツク文化の初期の1個体(NAT004)のみと後期の1個体(NAT002)のみに由来するゲノムデータに依存しており、これらの個体が初期もしくは後期オホーツク文化集団の代表である、と仮定されていることです。しかし、これらの個体が別の地域からの移住個体(つまり、人口集団の外れ値)である可能性を、完全には除外できません。この問題を解決するには、多数のオホーツク文化標本を用いたさらなるゲノム研究が必要です。
●まとめ
NAT004のゲノムが提供する直接的な証拠は、依然にNAT002のゲノムから推測された、縄文関連祖先系統とカムチャツカ関連祖先系統で構成される仮定的な人口集団の存在を裏づけます。日本北部から発掘されたより多くの数の古代の個体群を対象とした将来の分析は、カムチャツカ関連半島/アムール川流域からの移住の年代と種類(単一の波動なのか、複数の波動なのか、連続的なのか)、および移住事象の前後の人口集団の遺伝的特徴を、より正確に判断できるかもしれません。
参考文献:
Sato T. et al.(2025): Genome of an early Okhotsk individual reveals ancient admixture between Jomon and Kamchatka lineages. Scientific Reports, 15, 37520.
https://doi.org/10.1038/s41598-025-21522-4
[5]Sato T. et al.(2021): Whole-Genome Sequencing of a 900-Year-Old Human Skeleton Supports Two Past Migration Events from the Russian Far East to Northern Japan. Genome Biology and Evolution, 13, 9, evab192.
https://doi.org/10.1093/gbe/evab192
関連記事
[6]Kanzawa-Kiriyama H. et al.(2019): Late Jomon male and female genome sequences from the Funadomari site in Hokkaido, Japan. Anthropological Science, 127, 2, 83–108.
https://doi.org/10.1537/ase.190415
関連記事
[10]Sato T. et al.(2009): Mitochondrial DNA haplogrouping of the Okhotsk people based on analysis of ancient DNA: an intermediate of gene flow from the continental Sakhalin people to the Ainu. Anthropological Science, 117, 3, 171–180.
https://doi.org/10.1537/ase.081202
関連記事
[12]Gakuhari T. et al.(2020): Ancient Jomon genome sequence analysis sheds light on migration patterns of early East Asian populations. Communications Biology, 3, 437.
https://doi.org/10.1038/s42003-020-01162-2
関連記事
[13]Kanzawa-Kiriyama H. et al.(2017): A partial nuclear genome of the Jomons who lived 3000 years ago in Fukushima, Japan. Journal of Human Genetics, 62, 2, 213–221.
https://doi.org/10.1038/jhg.2016.110
関連記事
[17]Posth C. et al.(2023): Palaeogenomics of Upper Palaeolithic to Neolithic European hunter-gatherers. Nature, 615, 7950, 117–126.
https://doi.org/10.1038/s41586-023-05726-0
関連記事






この記事へのコメント