アジア北東部集団間の遺伝と文化の相関関係

 アジア北東部集団間の遺伝と文化の相関関係に関する研究(Matsumae et al., 2021)が公表されました。日本語の解説記事と筆頭著者の解説記事もあります。現生人類(Homo sapiens)の歴史には、大規模な移住や他の移動の事例が多数あります。これらの過程は、現代人の遺伝的および文化的多様性を形成しました。現生人類は他種と比較して相対的に均質ですが、さまざまな地理的規模で観察できる遺伝的変異には微妙な人口集団水準の違いがあります。さらに、全ての既知の社会には言語と音楽があるように、現生人類の行動には普遍的特徴がありますが、その文化的多様性は後代です。たとえば、現代人は7000以上の相互理解できない言語を話すか書き、民族・言語集団ごとに多くの異なる音楽様式が存在する傾向にあります。

 これまでの研究では長く、歴史的および考古学的データと現在の生物学的および文化的多様性のパターンとの組み合わせによる、世界的な移動と多様化の歴史の再構築に関心が抱かれてきました。ダーウィンまでさかのぼると、多くの研究者は、文化的進化史は生物学的進化史を反映する傾向にある、と主張してきました。しかし、文化的特徴とゲノムが伝わる方法の違いは、遺伝的および文化的変異がさまざまな歴史的過程により説明される可能性を意味します。20世紀後半以降の集団遺伝学および文化的進化の両方における大きな進歩により、今では遺伝的および文化的データの照合により容易にこれらの見解を検証できるようになりました。

 言語の文化的進化は、過去の人口史(遺伝的変異から統計的に推測される遺伝的歴史)を理解するためにとくに有益だと証明されてきました(関連記事)。古典的手法は、言語間の相同(同語源)な単語のセットを特定し、分析することです。この語彙的手法により、オーストロネシア語族やインド・ヨーロッパ語族など、単一の語族内の進化系統と関係の再構築が可能となります。しかし、語彙的手法は通常、複数の語族には適用できません。なぜならば、複数の語族は確実に信頼できる同語源を共有していないからです。同語源の分析限界年代は、系統的兆候が一般的に失われてから1万年間とされています。別の手法は、文中の品詞の相対的順序もしくは鼻腔子音の存在など、文法と音韻の特徴の分布を研究することです。言語の構造的データは、語族の系統的兆候を保存するには進化が速すぎる傾向にあり、語彙と構造の歴史は部分的に、たとえばクレオール言語の出現のように、独立しているかもしれません。しかし、言語構造の地理的分布は多くの場合、個々の時間の深さを超えた語族全体の進化における、接触により起きる類似点を示します。

 しかし、言語は深い歴史の代理として役立てる多くの複雑な文化的特徴の一つにすぎません。音楽は言語よりもさらに深い文化史を保存しているかもしれない、と提案されてきました。リズムやピッチや歌唱様式など標準化された音楽分類体系は、遺伝的および言語的違いの比較のため、人口集団間の音楽的多様性のパターンを定量化するのに使用できます。オーストロネシア語族話者である台湾先住民間では、これらの分析により、音楽とミトコンドリアDNA(mtDNA)と語彙の間の有意な相関が明らかになり、音楽が人口史を保存している可能性が示唆されました。しかし、これらの関係が語族の水準を超えているのかどうかは不明です。

 本論文はこの間隙に対処するため、アジア北東部およびその周辺の人口集団に焦点を当てます(図1)。アジア北東部は、遺伝的および文化的多様性が高水準なので、有益な検証地域を提供します。その中には、小規模な語族もしくは孤立語があり、たとえば、ツングース語族(エヴェン語・エヴェンキ語)、チュクト・カムチャツカ語族(チュクチ語・コリヤーク語)、エスキモー・アリュート語族(西グリーンランドイヌイット語)、ユカギール語族(ユカギール語)、アイヌ語、ニブフ語族(ニブフ語)、朝鮮語、日本語、テュルク語族(ヤクート語)、モンゴル語族(ブリヤート語)、フィン・ウラル語族(セルクプ語、ガナサン語)などです。重要なのは、世界の大半の遺伝的および言語的データが公開されている一方で、アジア北東部は音楽的データが公開されている唯一の地域で、音楽と遺伝と言語の多様性の直接的な一致比較が可能である、ということです。以下は本論文の図1です。
画像

 本論文はこれらの一致比較を用いて、さまざまな形式の文化的データが語族の限界を超えた水準で人口史を反映している程度について、競合する仮説を検証します。具体的には、文化的進化のパターンが遺伝的進化のパターン(人口史)と有意に相関しているのかどうか検証し、もし相関しているならば、個々の語族内の言語(空間的自己相関)と共有された継承との間の最近の接触の影響を制御したうえで、音楽もしくは言語(語彙か文法か音韻)のどちらが遺伝的多様性のパターンと最高の相関を示すのか、検証することを目的とします。


●分析結果

 アジア北東部および周辺部の、ゲノム規模一塩基多型と文法と音韻と音楽のデータが利用可能な、11語族・孤立語の14集団が選択されました。各調査の類似性は、分岐ネットワークにより図示されました(図2)。語彙データでは、全体的に星型の構造のネットワーク形態が得られました(図2C)例外は、互いに関連し、近接して際立っている3組で、ともにツングース語族のエヴェン人とエヴェンキ人、ともにチュクト・カムチャツカ語族のチュクチ人とコリヤーク人、ともにウラル語族のセルクプ人とガナサン人です。この距離分析の結果は、語彙資料は語族内の関係を検出できるものの、語族間の歴史的関係を解決できない、という事実と一致します。以下は本論文の図2です。
画像

 文法と音韻と遺伝と音楽の距離分析により、さらに多くの情報が得られる構造が明らかになるかもしれません。言語構造は語族関係を識別しないという主張と一致して、距離分析からのクラスタ化は一般的に語族と一致せず、例外は遺伝と音韻におけるチュクト・カムチャツカ語族のチュクチ人とコリヤーク人です。クラスタ化のほとんどは代わりに、語族間の関係を示します。たとえば、朝鮮語と日本語は、文法と一塩基多型と音楽に基づくとネットワークで近隣となりますが、音韻では異なります。ブリヤート人とヤクート人は、一塩基多型と文法と音韻では密接に関係していますが、音楽では違います。音楽に基づくネットワークは、音楽構成要素のクラスタ化分析に基づいて、アイヌの音楽の独自性と極地付近の音楽からのアジア東部の音楽の区別を示す以前の研究と一致します。ニブフ人は各要素で異なるパターンを示します。たとえば、ニブフ人は他の人口集団よりも朝鮮人と日本人とブリヤート人の方と遺伝的に密接で、距離行列では次に全人口集団でアイヌと2番目に高い類似性を示し、系統樹での位置を反映しています。しかし、音楽と文法と音韻は、ニブフ人ではこれらの関係に従っていません。

 まとめると、これらの結果から、人口史も語彙を除く文化的特徴も、語族に沿った単純な垂直系統により進化したわけではない、と示唆されます。むしろ、チュクト・カムチャツカ語族の可能性を除けば、それぞれが独立した軌跡をたどったかもしれません。これは、単一的な系統発生という考えに疑問を提起する一方で、特徴の一部は相互に関連しており、それは水平および垂直伝達の先史時代の迷路をたどったから、という可能性を残します。換言すると、特徴は依然として相互に関連しているかもしれず、それは、特徴が同じ(複数かもしれない)時期と場所に存在し、そこでは人々が接触し、および/もしくは遺伝的に関連していたからです。

 そうした関連が現在でも検出可能なのかどうか明らかにするため、データの主成分もしくは座標に対して冗長性解析(Redundancy Analysis、略してRDA)が実行されました。RDAは説明変数で説明できる応答変数の変動を要約し、直接的な関連を見つけます。RDA分析は並べ替え検定で有意な2つの関連を明らかにします(図3)。つまり、文法的類似性は遺伝的類似性を予測し、遺伝的類似性は文法的類似性を予測します。両者の関連は、同じ起源の単語により識別できるように、現在の語族の形成前にさかのぼる深い時間の対応を反映している可能性がある一方で、社会間の空間的な近接性や接触が、比較的最近で浅い関連の類似のパターンにつながっている可能性もあります。以下は本論文の図3です。
画像

 この問題を解決するため、データの兆候を説明する以下の3通りの想定が評価されました。(1)最近の接触です。関連は最近および現在の接触を反映しているので、現在のデータの空間的な自己相関により説明可能です。つまり、現在相互に密接な社会は、類似の文法と人口史を有する傾向にあります。(2)この関連が共通祖先を反映している想定です。この関連は残りの語族内の垂直系統から生じ、本論文の標本ではその語族には複数(ツングース語族とチュクト・カムチャツカ語族とウラル語族)が含まれます。(3)深い時間に対応している想定です。この関連は、既知の語族内の最近の接触もしくは系統発生的継承では説明できない、文法と遺伝との間の浅くない対応を反映しています。

 これら3仮説を区別するため、空間的な近接性と継承を潜在的交絡要因として扱い、その影響を制御するために部分的RDAが実行されました。赤道から離れた社会と言語はより大きな空間的範囲を示す傾向にあるので、各社会の領域は点ではなく範囲で表現され、これらの範囲内から無作為の空間位置が標本抽出されました。部分的RDAは、最近の接触に反して強い証拠を明らかにします。空間的近接性では文法と遺伝の関連を説明できません。空間的自己相関を制御すると(1000個の無作為標本で人々の位置の不確実性を考慮)、観測された説明の分散は依然として、無作為な並び替えよりも大きくなります。

 部分的RDAにおいて言語の最近の接触と系統発生的継承の両方を制御すると、依然として文法と遺伝の関連は他の関係よりも強い証拠を示します(図4)。本論文の分析では、同等の強さで他の関連は見られません。いくつかの弱い兆候(たとえば、文法と音楽と音韻)はありますが、空間的自己相関と系統の両方を制御すると、これらは全て消えます(図4)。これは、そうしたあらゆるパターンが、最近の接触および語族特有の一連の継承に由来する可能性が高いことを示唆します。以下は本論文の図4です。
画像

 わずか14集団の小規模な標本を前提として、3種の感度分析を通じて文法と遺伝の関連の堅牢性が評価されました。まず、RDAへの主成分もしくは座標の数が変更され、したがって、応答と予測因子の両方に分散の量が変わりました。ある構成要素はどれだけの分散を説明する必要があるかというさまざまな閾値(10%と15%と18%)は、結果にほとんど影響がありませんでした。次に、RDAへの言語標本が変えられました。ほとんどの言語は兆候にほとんど影響を与えませんが、アイヌに関しては当てはまらず、アイヌを分析から除外すると、文法と遺伝の関連は弱くなります。

 最後に、部分的RDAでは、一部の空間標本が他の標本よりも応答の分散を上手く説明する場合があります。低い調整済R2を有する場所の空間的クラスタは、最近の言語設定を示している可能性があり、高い調整済R2を有するクラスタは、系統的外れ値が兆候に影響している可能性を示唆します。0.2および0.8パーセンタイルの場所をマッピングすると、高パーセンタイルでは弱くて部分的なクラスタ化しか見つからず、低いパーセンタイルではまったく見つかりませんでした。これは、最近の接触も系統的外れ値も兆候を説明しない、と示唆します。

 要約すると、アジア北東部においてゲノムと音楽と言語の完全な一式を用いると、基本RDAにより遺伝と文法との間に有意な相関関係がある、と明らかになりました。地理や言語継承を制御した部分的RDAや感度分析では、遺伝と文法の関係は最近の接触および継承前の言語間の早期の関係にさかのぼるかもしれない、と示唆されます。


●考察

 本論文は語族の水準を超えて、遺伝と言語と文化間の関係を同時に調べました。その結果、人口史と文法の類似性との間の関係の顕著な証拠が見つかりましたが、ゲノムと文法は、配偶体系と文化伝達との間の違いなど、さまざまな進化の力に影響を受けたかもしれません。集団遺伝学は、系統発生的関係を超えて人口集団間の遺伝子流動を検出します。本論文のデータセットは、人口集団の系統発生的広範囲を網羅します。それは現代アジア東部人の3系統(アイヌとアジア東部人とアジア北東部人)と北アメリカ大陸の1系統(グリーンランドのイヌイット)で、日本人とアイヌやブリヤート人とヤクート人のように、系統を超えた遺伝子流動が含まれます。

 人口史に影響を及ぼす進化の力はかなりよく理解されていますが、特定の人口集団の遺伝的関係が、共有された祖先系統(祖先系譜、ancestry)と文化の先史時代の接触のどちらをどの程度反映しているのか判断することは、まだ困難です。さらに、文化と言語に影響を及ぼす進化的過程は議論されていますが、ゲノムに影響を及ぼす進化的過程とは明らかに異なる可能性があります。たとえば、文化的置換と言語変化は、植民地化もしく戦争や文化的拡大など他の社会政治的要因により、1世代でも起きる可能性があります。

 文化的類似性における近接性の影響を排除した本論文の結果は、これらのさまざまなデータはさまざまな歴史的パターンを明らかにする、という見解を支持しますが、一部の文化的特徴は依然として、語族の境界さえ超えた関係の維持が可能であることを示します。文法の類似性は、単純に遺伝的系統に従った場合に生じるわけではなく、朝鮮人と日本人とニブフ人とアイヌの遺伝的近接性は文法には反映されておらず、チュクチ人とコリヤーク人と西グリーンランド人も同様です。むしろ、先史時代に部分的に独立した垂直および水平伝達の複雑な相互作用を反映している可能性が高そうです。

 このパターンは、語族をなぞる語彙では著しく異なりますが、本論文のデータセットではより上位水準の関係は明らかになりません(図2)。これは、歴史言語学や、文法がオーストロネシア語族では語彙よりも速く進化し、インド・ヨーロッパ語族でも急速な進化を示す、という最近の知見からの予測とは対照的です。たとえば、英語とヒンディー語は多くの同起源の単語を保存していますが、両者は語順および格表記が大きく異なります。しかし、これらの知見は語族内の文法進化と関係していますが、本論文の手法は、語族間の初期の接触を可能とする共有された歴史を解明しようとします。したがって、本論文の知見は、語順など固有の特徴は語族内で急速に進化したものの、繰り返し模倣されて新たに調整された、という想定と一致し、それは同じ期間の遺伝的ネットワークを反映する先史時代にわたる比較的均一な特性をもたらします。感度分析でアイヌを削除すると、この兆候を検出する統計的能力が弱くなります。これは、アジア北東部の文脈におけるアイヌの特別な位置を示唆しているかもしれませんが、この問題の解決には、この地域の内外の言語と人口集団のより大きな標本が必要です。

 本論文の結果は、遺伝と言語と音楽の関係を定量的に比較した唯一の先行研究とは質的に異なります。以前の研究では、台湾先住民のオーストロネシア語族話者集団間では、音楽は遺伝と有意に相関していたものの、言語とは相関しておらず、一方で本論文では、音楽は言語もしくは遺伝のどちらとも強固には関連していない、と明らかになりました。しかし、これらの違いの背景にはいくつかの方法論的違いがあります。以前の研究ではmtDNAと語彙データと集団の歌のみが検証対象だったのにたいして、本論文では、ゲノム規模一塩基多型データと構造的な言語の特徴と集団および個人の歌が取り上げられました。より大規模な標本とさまざまな種類のデータを用いたさらなる研究が、言語と音楽と遺伝の間の一般的関係の解明に役立つかもしれません。

 最近の研究は、基底部ユーラシア東部人の主要な遺伝的構成要素の一つとしてのアジア北東部人口集団を浮き彫りにします(関連記事)。アジア北東部の高い言語的多様性は、以前の研究で仮定されていたように、地理的障壁による農耕人口集団からの影響が少ない、先史時代の関係を反映しているかもしれません。しかしアジア北東部では、文化と地域的人口史との間の関係についての知識は限られています。本論文の結果は、遺伝的パターンと文法的パターンとの間の関連だけではなく、複雑な分離も明らかにしており、そこでは、これらのデータが、文化的変化も含むかもしれないさまざまな地域史を反映しています。たとえば、以前の研究が朝鮮人と本州・四国・九州を中心とする日本列島「本土」人口集団との間の特有の遺伝的および文化的関係を提案するか、共有された起源を仮定する一方で、本論文の知見は、一塩基多型と音楽と文法では類似しているのに対して、語彙と音韻では類似していないことを裏づけます。

 アイヌはとくに日本人と遺伝的類似性を示しますが、その音楽はコリヤーク人とより密接にまとまります(図2)。これは、歴史のさまざまな時点で起きた、さまざまな水準の遺伝と言語と音楽の交換を反映しているかもしれません。音楽のパターンは、オホーツクおよび他の「極地付近」の人口集団からのより最近の文化的拡散や遺伝子流動を反映しているかもしれません。それらの人口集団は過去1500年以内に北方から到来してアイヌと相互作用し、これは日本列島の歴史の「三重構造」モデルで以前に提案されました。

 新たに遺伝子型決定されたニブフ人の標本は一塩基多型ではアイヌと近いものの、他のデータでは近い関係ではなく(図2)、アジア北東部沿岸地域における歴史的関係が示唆されます。ニブフ人はアイヌと他のアジア北東部人をつなぐ重要な人口集団かもしれませんが、ニブフの人口史はよく理解されていません。したがって、近隣網系統樹は、人口集団と関連する関係を反映しているかもしれないものの、ニブフ人を含むアジア北東部人における地域の人口史と文化的関係をより詳細に調べるには、さらなる分析が必要です。将来の研究では、社会のより大規模な標本とその文化的特徴のより豊かなコード化が必要になるでしょう。

 結論として、本論文は多様なアジア北東部語族全体で文法とゲノム規模一塩基多型との間の関係を示しました。本論文の結果から、文法的構造は語彙を含む他の文化的データよりも密接に人口史を反映しているかもしれない、と示唆されますが、本論文は、遺伝的データと文化的データのさまざまな側面が、複雑な人類史のさまざまな側面を明らかにすることも見出しました。換言すると、文化的関係は人口史により完全には予測できません。これらの不一致の別の解釈は、地域史における言語変化などの歴史的事象か、遺伝的進化から独立した文化固有の進化です。より明確なモデルを用いたより大きな規模での、これらの関係についての将来の分析は、ヒトの文化的および遺伝的進化の複雑な性質の理解の改善に役立つはずです。


参考文献:
Matsumae H. et al.(2021): Exploring correlations in genetic and cultural variation across language families in northeast Asia. Science Advances, 7, 34, eabd9223.
https://doi.org/10.1126/sciadv.abd9223

この記事へのコメント

この記事へのトラックバック