台湾のオーストロネシア語族話者集団の遺伝的多様性

 台湾のオーストロネシア語族話者集団の遺伝的多様性を報告した研究(Liu et al., 2023)が公表されました。オーストロネシア語族話者の拡大はおそらく台湾から始まり、そこからアジア南東部および太平洋全域へと拡大しました。しかし、台湾のオーストロネシア人集団のかなりの言語学的多様性にも関わらず、オーストロネシア人の拡大に関するゲノム研究は通常、そのうち1もしくは2集団しか含まれていません。台湾への移住および台湾からの移住についての推測に台湾人の多様性がどのように影響を及ぼすのか、研究するために、これまでで最大の台湾のオーストロネシア人のゲノムデータセットが生成されました。その結果、南北の高地集団間でかなりの遺伝的構造、台湾からの移住の祖先におけるアジア東部北方関連祖先系統(祖先系譜、祖先成分、祖先構成、ancestry)の増加、台湾南部の高地集団と台湾以外のオーストロネシア人との間のより密接な関係が見つかり、オーストロネシア人の拡大に関する推測に対する台湾人のゲノムの重要な影響が示されました。


●要約

 世界で最大かつ最も広がった言語の一つであるオーストロネシア語族の起源と拡散は、言語学者と考古学者と遺伝学者の注目を長く集めてきました。台湾がオーストロネシア語族の拡大の源だという総意が形成されつつありますが、台湾に定住し、台湾を去った初期オーストロネシア人の移住パターンについてはほとんど知られていません。つまり、「台湾への移住」および「台湾からの移住」事象です。とくに、台湾内の遺伝的多様性および構造と、これが台湾への移住および台湾からの移住事象とどう関連しているのかはほぼ調べられておらず、それはおもに、ほとんどのゲノム研究はほぼ、台湾の認識されている高地オーストロネシア人16集団のうちわずか2集団のデータを利用してきたからです。

 この研究では、台湾のオーストロネシア人のこれまでで最大のゲノム規模データセットが生成され、その中には、台湾島全域の高地の6集団および低地の1集団と台湾の漢人集団が含まれます。本論文は、台湾における微細なゲノム構造を特定し、オーストロネシア人の祖先の祖先系統を推測して、台湾南部のオーストロネシア人が台湾以外のオーストロネシア人と過剰な遺伝的類似性を示す、と明らかにしました。したがって、本論文の調査結果は、台湾への拡散および台湾からの拡散に新たな光を当てます。


●研究史

 オーストロネシア語族は世界で最大の語族の一つで、1200以上の言語が約4億人により話されており、西方ではマダガスカル島から東方ではハワイおよびイースター島まで広がっています。言語学的分析は、オーストロネシア語族の台湾起源を強く裏づけており(関連記事)、考古学および遺伝学の証拠は、オーストロネシア語族の拡大と関連する台湾からの人々の拡大をさらに裏づけています(関連記事)。このため、台湾島における台湾のオーストロネシア人の祖先の到来を詳しく述べる「台湾への」移住事象と、他のオーストロネシア人集団にとって同じ祖先の出発を詳しく述べる「台湾からの」移住事象は、たいへん重要です。

 「台湾への移住」に関しては、古代の遺跡における雑穀とイネの分布に基づいて、台湾のオーストロネシア人の祖先は台湾に中国本土の南東部沿岸から遅くとも4800年前頃には到来した、と考古学者が推定しています。言語学的には、これらの人々は「祖型オーストロネシア人」と考えられており、その言語は中国の南東部沿岸で話されているタイ・カダイ語族およびシナ・チベット語族と特徴を共有しています。最近の古代DNA研究も、台湾のオーストロネシア人と中国南部の古代の個体群(新石器時代農耕文化と関連しています)との間の強い遺伝的つながりを見つけました(関連記事1および関連記事2)。

 「台湾からの移住」に関しては、考古学的証拠から、オーストロネシア人の祖先と関連する農耕複合が台湾からフィリピンへと4200年前頃に拡大し始め、その後でインドネシア全域、西方ではマダガスカル島、東方では太平洋全域に急速に拡大した、と示唆されています。言語学者により認識されているオーストロネシア語族の10区分のうち、9系統が台湾諸語(Formosan)分枝でのみ見つかっているのに対して、台湾以外の残りのオーストロネシア語族言語はマレー・ポリネシア語派に分類されます。オーストロネシア語族言語の系統発生分析も台湾起源を裏づけており、台湾諸語とマレー・ポリネシア語派は5000年前頃に分岐した、と推定しました。

 遺伝学的研究では、台湾からの移住の証拠が見つかりましたが、推定年代の範囲は8000~4000年前頃です(関連記事1および関連記事2)。さらに、オーストロネシア人の拡大は近オセアニア(ニアオセアニア)におけるラピタ(Lapita)文化(3500~2500年前頃)の発展および遠オセアニア(リモートオセアニア)への拡大と関連しています。驚くべきことに、ラピタ文化と関連する遠オセアニアの古代の個体群のゲノムは、台湾のオーストロネシア人集団との強い遺伝的つながりを明らかにしてきており(関連記事1および関連記事2および関連記事3)、これら古代の個体群が最初の台湾からの移住集団の一つだった、と示唆されています。

 台湾への移住および台湾からの移住に関する多くの調査がありますが、台湾内のオーストロネシア人集団の多様性と構造は比較的調べられていないままです。ほんどのゲノム規模研究はアミ人(Ami)タイヤル人(Atayal)という2集団のみから得られたデータを使用してきましたが、じっさいには、台湾の原住民族委員会(Council of Indigenous People、略してCIP)によると、台湾では20以上の先住民(オーストロネシア人)集団が認められています。これらの先住民集団は大まかに、居住地に基づいて「高地」もしくは「低地」集団と分類され、北京官話では「高地(Gaoshan)」もしくは「低地(Pingpu)」集団と呼ばれていますが、高地集団の一部は山岳地帯に暮らしていません。

 現在公式には、16の先住民高地集団が存在し、それは、タイヤル人、アミ人(Ami)タイヤル人(Atayal)サイシャット人(Saysiyat)、トゥルク(タロコ)人(Truku)、セデック人(Sediq)、サキザヤ人(Sakizaya)、サオ人(Thao)、ツォウ人(Tsou)、カバラン人(Kavalan)、ブヌン人(Bunun)、ラワロア(サワロア)人(Hla’alua)、カナカナブ人(Kanakanavu)、アミ人、ルカイ人(Rukai)、プユマ人(Puyuma)、パイワン人(Paiwan)、タオ人(Tao)です。ヤミ人(Yami)とも呼ばれているタオ人は実際には、台湾の南東部沿岸沖に位置する蘭嶼島(Orchid Island)に暮らしています。そして、全ての高地集団は台湾諸語を話しますが、ヤミ語はマレー・ポリネシア語派の一部です。

 別の12ほどの低地集団が存在し、それは、ケタガラン人(Ketagalan)、カバラン人(Kavalan)、タオカ人(Taokas)、カハブ人(Kaxabu)、パゼッヘ人(Pazeh)、パポラ人(Papora)、バブザ人(Babuza)、ロア人(Lloa)、アリクン人(Arikun)、シラヤ人(Siraya)、タイボアン人(Taivoan)、マカタオ人(Makatao)です。過去500年間に中国本土から移住してきた漢人、その中ではおもに閩南(Minnan)と客家(Hakka)は、低地オーストロネシア語族言語の消滅もしくは絶滅危機につながってきました。

 台湾の高地集団は遺伝学的研究のおもな焦点となってきましたが、低地集団はさほど注目されてきませんでした。片親性遺伝標識(母系のミトコンドリアDNAと父系のY染色体)を用いての高地集団の研究により示されているように、台湾のオーストロネシア人における遺伝的多様性の証拠はありますが、これらの研究のほとんどは低地集団を含んでいません。さらに、人口史へのずっと詳細な洞察を提供できるゲノム規模研究はひじょうに限られています。本論文が把握している限りでは、ゲノム規模データはタイヤル人とアミ人とパイワン人とタオ人(ヤミ人)でのみ生成されてきました。さらに、台湾人集団らおける耐用性と関係の体系的なゲノム評価、およびこれらのデータが台湾への移住および台湾からの移住とどう関連しているのか、という調査は依然として不足しています。

 この知識の空隙を改善するため、台湾島全域の台湾オーストロネシア人7集団(このうち3集団については以前にはゲノム規模データが報告されておらず、低地の1集団が含まれます)と、台湾の漢人2集団について新たなゲノム規模データが生成され、台湾内の微細規模の構造が調べられました。台湾高地および蘭嶼島(Taiwan Highland/Taiwan Orchid Island、略してTHI/TOI)に関するCIPの定義を用いて、高地のさまざまな集団が分類されました。本論文の新たなデータを刊行された比較用の現代人および古代人のゲノムと組み合わせることで、台湾への移住および台湾からの移住についての新たな洞察を得るために、台湾のオーストロネシア人の多様性が利用されます。


●アジアとオセアニアにおける遺伝的差異に照らしての台湾人集団

 オーストロネシア人7集団(高地5集団と低地1集団と1集団)と漢人2集団の55個体について、アフィメトリクス(Affymetrix)社ヒト起源(Affymetrix Human Origins)配列でゲノム規模の一塩基多型(Single Nucleotide Polymorphism、略してSNP)配列データが生成されました(図1A)。新たなデータは、アジアとオセアニアから得られた比較用の現代人および古代人のゲノムと統合されました。以下は本論文の図1です。
画像

 まず、主成分分析(principal component analysis、略してPCA)とADMIXTURE/ DyStruct分析を用いて、データセットにおける全体的なパターンが調べられました。PCAでは、アジア東部人がアジア南部人およびオセアニア人から分離されました。アジア東部人は、アジア東部南方人(southern East Asian、略してsEA)、アジア東部北方人(northern East Asian、略してnEA)、アジア南東部本土人(Mainland Southeast Asian、略してMSEA)、アジア南東部島嶼部人(Island Southeast Asian、略してISEA)に区分されます。sEA/nEAについて、アジア東部の南方と北方は、秦嶺・淮河(Qinling–Huaihe)線の南北により定義されました。主成分1(PC1)に沿って、sEAはアジア東部人の極の端に位置し、ISEAはオセアニア人に向かっての勾配に位置しており、残りのアジア東部人集団はアジア南部人への勾配に位置しました。台湾の個体群の遺伝的特性はsEAの遺伝的差異内に収まり(図1B・C)、台湾のオーストロネシア人集団はsEAの極の端に、フィリピンのオーストロネシア人集団であるカンカナイ人(Kankanaey)とともに現れます(図1D)。台湾人集団と最も密接な古代の個体群は、sEAと初期(3000~2000年前頃)オセアニア個体群です(図1D)。

 ADMIXTURE分析の最適K(系統構成要素数)値については、タイヤル人とカンカナイ人が最高頻度の紫色の構成要素を有しており、これはTHI/TOI集団と、たとえば4500年前頃の鎖港(Suogang)遺跡個体や4300年前頃の曇石山(Tanshishan)文化個体など古代sEA集団と、たとえばバヌアツの2900年前頃の個体やトンガの2600年前頃の個体などオセアニア古代人でも濃くなっています(図2)。対照的に、台湾の漢人集団は中国南部の福建省の漢人と類似しており、明るい緑色と青緑色で表される2つの主要な構成要素を有しています。中国北部の山東省の漢人と比較すると、台湾と福建省の漢人集団は紫色のオーストロネシア人関連構成要素を少量示しており、sEA漢人とオーストロネシア人の集団間の相互作用の可能性が示唆されます。同様に、台湾の低地オーストロネシア人集団であるマカタオ人は台湾の漢人集団と類似の特性を有しているものの、紫色のオーストロネシア人関連構成要素がより多くあります。以下は本論文の図2です。
画像

 時間横断区を組み込み、それ故に古代DNAにより適している、ADMIXTURE 的なクラスタ化(まとまり)演算法であるDyStruct分析での最適K値は、THI/TOI集団がカンカナイ人および古代sEA個体群に近いことについて類似の結果を示唆しました。カンカナイ人と古代sEA個体群は、2つの構成要素の比較的均質なパターンを共有していました(図2)。茶色の構成要素は4500年前頃となるsEAの鎖港遺跡個体(祖型オーストロネシア人の可能性が高そうです)と2900年前頃のバヌアツ個体(初期オーストロネシア人の可能性が高そうです)において最高頻度で、この構成要素はISEAとオセアニアの全ての現代オーストロネシア人集団と関連しており、その全集団間のつながりが示唆されます。灰色の構成要素はタイ・カダイ語族話者のリー人(Li)において最高頻度で、アジア東部現代人に広がっていました。

 本論文はこの灰色の構成要素を調べるため、それが台湾低地および漢人集団において、明るい/暗い紫色の構成要素のように最高頻度で、ADMIXTUREにおける明るい緑色と青緑色の構成要素のパターンと類似していることに注目しました。さらに、これらの全ては漢人集団で多くなっていました(図2)。したがって、台湾人集団におけるこれらの構成要素の割合が比較され(ADMIXTUREの明るい緑色対青緑色、DyStructの灰色および明るい紫色対濃い紫色)、それらの間の相関が見つかり、これらの構成要素は主要な漢人との混合事象を介してもたらされたかもしれない、と示唆されました。さらに、これらの構成要素の割合は漢人集団の地理的分布と相関していました(北方集団は南方集団と比較して、より多くの青緑色/濃い紫色の構成要素を示しました)。この点について、台湾の漢人集団における割合は中国南部の漢人集団に近かったものの、台湾のオーストロネシア人集団の勾配は台湾の漢人に向かっていました。


●台湾内の遺伝的構造

 アジア人とオセアニア人の遺伝的差異の文脈では、THI/TOIの遺伝的特性は比較的均質で、漢人集団と分離されており、低地集団がTHI/TOIと漢人集団との間に位置することを除いて、構造はほとんど明らかになりませんでした(図3A)。台湾内の構造をさらに調べるため、ハプロタイプに基づく手法であるfineSTRUCTUREが適用されました。近隣集団からハプロタイプ供給源を提供するため、本論文のデータセットにおけるオーストロネシア語族とタイ・カダイ語族とシナ・チベット語族の話者集団の全てで染色体描写が実行されました。それは、これらの語族が関連している、と提案されているからです。fineSTRUCTUREの結果は一般的に、MSEA集団が異質なパターンを示すことを除いて、語族に従うクラスタ化を裏づけました。これは、広範な混合と言語変化の可能性が高い事例を含む、複雑な歴史を示唆した先行研究と一致します。

 台湾内では、THI/TOIと低地/漢人集団との間で明確な分離があり、THI/TOIが他のオーストロネシア人集団とクラスタ化したのに対して、低地/漢人集団はシナ・チベット語族およびイ・カダイ語族話者集団とクラスタ化しました(図3B)。THI/TOI集団に関しては、北部(タイヤル人)および中央部(ブヌン人)集団が1クレード(単系統群)でクラスタ化しました。南部集団(ルカイ人とパイワン人とアミ人)では区分があり、ルカイ人とパイワン人はともにまとまりましたが、アミ人は蘭嶼島集団(タオ人)およびフィリピンの集団であるカンカナイ人およびイロカノ人(Ilocano)と別のクレードでまとまりました。以下は本論文の図3です。
画像

 THI/TOI集団で明らかになった構造が低地/漢人集団と異なることを考えて、THI/TOI個体群のみを用いて計算された固有値でPCAが実行され、低地/漢人個体群が投影されました。PC1は北部集団であるタイヤル人を南部集団から分離し、PC2はアミ人をルカイ人およびパイワン人から分離しました。中央部集団であるブヌン人はタイヤル人に、蘭嶼島集団であるタオ人はアミ人の方へと位置し、低地集団であるマカタオ人は不均一で、ほとんどの個体は中間で漢人集団とまとまりましたが、一部の個体はルカイ人/パイワン人の方へと位置したいました。注目すべきことに、刊行されたデータセットのタイヤル人とアミ人は、本論文で遺伝子型決定されたタイヤル人およびアミ人ととともにまとまりました。タイヤル人とアミ人とルカイ人がこのPCAの極を駆動する、という事実は恐らく、その孤立と浮動を反映しており、それは、これらの集団が集団内の多量の同祖対立遺伝子(identity-by-descent、略してIBD)共有を示したからです。

 ADMIXTUREとPCA両方の結果から、低地集団であるマカタオ人はTHI/TOIと漢人の集団間の中間的な遺伝的特性を有している、と示され(図2および図3A)、混合が示唆されます。この可能性を検証するため、f3形式(閩南、ルカイ人;マカタオ人)のf3混合値が計算され、Z=−7が得られて、これら2つの代理供給源を含むマカタオ人における混合が明らかになりました。ルカイ人はオーストロネシア人供給源の代理として選択され、それは、マカタオ人がTHI/TOIのPCAではルカイ人の極に向かって投影されたからです(図3C)。この決定は、ムブティ人(外群)と低地のマカタオ人と漢人集団と代表的なTHIの3集団(タイヤル人とアミ人とルカイ人)の最適混合図によりさらに裏づけられました。マカタオ人はTHI集団であるルカイ人の祖先から42%の祖先系統と、漢人集団である閩南の祖先から58%の祖先系統を有している、とモデル化されました。GLOBETROTTERを用いて、この混合は1.64±0.93世代前(1世代30年と仮定すると50年前頃)と年代測定された大きな最近の波の事象から生じた、と推測されましたる全体的に、THI/TOI集団における3つの異なる遺伝的クラスタと、低地集団におけるTHIと漢人の集団間の混合事象が観察されました。


●台湾のオーストロネシア人集団の遺伝的構造:台湾への移住についての示唆

 台湾内における遺伝的構造をより深く理解するため、台湾のオーストロネシア人の祖先もしくは祖型オーストロネシア人の遺伝的特性が調べられました。まず、台湾もしくはその近くの古代人のゲノムに焦点が当てられました。それは、台湾北東部の漢本(Hanben)の1500年前頃の個体、台湾北東部沖合の澎湖島(Penghu Island)の鎖港の4500年前頃の個体、台湾北西部沖合の亮島(Liangdao)の7700年前頃の個体です。THI/TOIのPCA上でのすべての投影された古代人のゲノムのうち、祖型オーストロネシア人と関連すると考えられている鎖港と亮島の個体群はルカイ人の極に向かって位置しましたが、漢本の個体群はタイヤル人の極のより近くに位置しました。

 先行研究は供給源としての古代人のゲノムと外群でqpAdmを用いて、アミ人とタイヤル人を含めてアジア東部現代人をモデル化しました。しかし、2020年の研究(関連記事)がアミ人を純粋なsEAとして、タイヤル人をsEAおよびnEAの供給源の混合としてモデル化したのに対して、2021年の研究(関連記事)はアミ人のみを含めて、アミ人をさまざまな供給源および外群でsEAとnEAの混合としてモデル化しました。本論文は、上述の2020年の研究における供給源と外を用いて、この枠組みを調べ、分析を本論文で取り上げた他の台湾人集団に拡張しました。2020年の研究が採用されたのは、これらの集団が明確に定義されていたからです。1ヶ所の修正があり、本論文は7000年前頃となるラオスのファ・ファエン(Pha Faen)遺跡個体(関連記事)のゲノムを、1万年前頃となる広西チワン族自治区の隆林洞窟(Longlin Cave)の個体(関連記事)に置換し、より明確なsEA外群を提供します。隆林洞窟個体は、ホアビン文化(Hoabinhian)関連祖先系統の観点でオンゲ人と重複します。

 選択された古代人集団に関しては、4500年前頃となる鎖港遺跡集団(低網羅率のため、この集団をモデル化するのに充分な能力がありませんでした)と密接に関連している中国南部の4300年前頃となる曇石山文化集団が、おもにsEA(7700年前頃の亮島個体)祖先系統と、低い割合(8%)の8200年前頃となる山東省の淄博(Boshan)遺跡個体のnEA祖先系統を有するとモデル化されたのに対して、より新しいsEAおよび台湾集団は、より多くの(23~26%)のnEA祖先系統を有していました。同様に、全ての選択された現代人集団(台湾人集団を含みます)が、古代のnEAおよびsEA祖先系統の混合としてモデル化され、nEA祖先系統はsEAの現代人標本ではさらに増加します(図4A)。以下は本論文の図4です。
画像

 sEA祖先系統は古代のnEA集団にも低頻度で存在しており、現代人の標本では増加し、上述の2020年および2021年の研究と一致します。最適混合図では、1500年前頃の漢本集団がnEA供給源(8300年前頃となる淄博遺跡個体の祖先)とsEA供給源(7700年前頃となる亮島個体の祖先)の混合としてモデル化されました。同様に、THIオーストロネシア人(タイヤル人とアミ人とルカイ人)とタイ・カダイ語族話者のリー人は、共有されたnEA(山東省漢人の祖先)およびsEA(7700年前頃となる亮島個体の祖先)祖先系統の混合としてモデル化されましたが、リー人は標本抽出されていない集団から追加のsEA関連祖先系統を受け取りました。


●台湾のオーストロネシア人集団の遺伝的構造:台湾からの移住への示唆

 次に、台湾からの(複数の)移住事象への洞察を得るために、台湾のオーストロネシア人集団とISEAおよびオセアニアの集団との間の関係が調べられました。ラピタ文化関連の古代人集団(3000~2000年前頃のグアムとバヌアツとトンガの個体群)が、台湾から移住したオーストロネシア人と関連していると考えられており、より新しい(1500年前頃)のsEA古代人集団と類似の特性を示したのに対して、台湾からの移住集団の現代人の代理としてよく用いられる孤立した集団現在のフィリピンのカンカナイ人は、THI/TOI集団とより類似していました(図4)。まとめると、これらの結果から、興味深いことに、初期の台湾から移住した(ラピタ文化)集団はすでに、初期の台湾へ移住した(sEA)集団(0~8%)と比較して増加したnEA祖先系統(21~29%)を有しており、nEA祖先系統は現在のTHI/TOI(28~37%)およびカンカナイ人(33%)集団でさらにわずかに増加した、と示唆されました。これらの集団(および他のISEAとオセアニア人の集団)がTHI/TOIのPCAでどのように投影されるのか焦点を当てると、これらの集団は一般的に南方集団であるアミ人およびルカイ人の方へと投影され、わずかにアミ人の方に動いていた、と分かりました。

 f4形式(タイヤル人、アミ人/ルカイ人;現代人および古代人集団、ムブティ人)のf4統計の結果からさらに裏づけられる観察は、北方集団のタイヤル人と比較して、南方集団のアミ人およびルカイ人は現代および古代のISEAおよびオセアニア集団と過剰な共有がある、というものです(図5)。より正確には、タイヤル人がアミ人と比較してsEA本土現代人および古代人集団と顕著に過剰な共有を示したのに対して、ルカイ人はタイヤル人と比較してISEAおよびオセアニアの集団と顕著に過剰な共有を示しました(図5C・D)。最後に、祖先的な台湾からの移住集団がアミ人もしくはルカイ人とより近いのかどうか、f4形式(アミ人、ルカイ人;現代人および古代人集団、ムブティ人)のf4統計での判断が試みられました。その結果、値はほぼ負と分かり、ほとんどの人口集団がルカイ人と過剰な祖先系統を共有していた、と示唆されました。これらのf4結果と一致して、最適混合図では、タイヤル人が台湾への移住集団(sEAのリー人)と、ルカイ人が台湾からの移住集団(ISEAのカンカナイ人)と最も近く、アミ人はその中間に位置する、とモデル化しました。以下は本論文の図5です。
画像

 さらに、最近の遺伝的共有の兆候を強化する、ハプロタイプに基づく手法を適用して、台湾のオーストロネシア人と台湾から移住したオーストロネシア人関連集団との間の類似性が調べられました。頻度に基づく手法(つまり、f4とqpgraph)の結果から、ルカイ人が台湾から移住した集団に最も近いかもしれない、と示唆されましたが、ハプロタイプに基づくfineSTRUCTUREの結果は、アミ人をタオ人およびカンカナイ人とクラスタ化し、ハプロタイプに基づく観点ではアミ人が台湾から移住した集団に最も近いかもしれない、と示唆されました。したがって、供給源としてTHI(台湾諸語話者)集団のみを用いて、別のChromoPainter分析が実行され、他のオーストロネシア人(マレー・ポリネシア語派話者)が描かれ、アミ人が他のオーストロネシア人集団と最も多くを共有しており、ルカイ人がそれに続く、と実際に分かりました(図6)。以下は本論文の図6です。
画像

 3通りの主要な規模範囲で、IBDゲノム断片の共有も調べられました。つまり、1~5 cM(センチモルガン)、5~10 cM、10 cM超で、それぞれほぼ、2700年前頃、675年前頃、225年前頃に相当します。兆候のほとんどは1~5 cMの規模範囲で濃縮されていましたが、台湾内の遺伝的構造の以前の分析で見られたように、THI集団はより長い規模範囲で強い集団内の共有と地域的構造を示しました(図3)。同様に、低地のマカタオ人も1~5 cMの規模範囲では、漢人集団とTHI/TOI集団との間で中間的な共有特性を示しました。この最短の規模範囲では、THI/TOI集団だけがオーストロネシア人集団と顕著な共有(1cM以上の合計IBD長の平均の対数値)を示し、例外は、THI/TOI集団が台湾の漢人(客家)およびパプアの中央州と湾岸州とベラ・ラベラ(Vella Lavella)島のパプア人集団ともオーストロネシア人との混合を共有していたことです最後に、IBDの結果から、台湾の南方集団は、台湾の北方/中央集団の場合よりも、台湾から移住した集団とより多く共有していた、と示唆されました。たとえば、ルカイ人/アミ人対カンカナイ人の3 cM超の平均合計IBD長の対数値や、ルカイ人/アミ人対パプア中央州住民の2cM超の平均合計IBD長の対数値に対して、タイヤル人/ブヌン人では、これらの値はより低くなりました。


●台湾の遺伝的構造

 この研究では、台湾人55個体(そのうちオーストロネシア人は43個体)新たなゲノム規模データが生成され、台湾人の遺伝的構造が特徴づけられ、この構造が台湾への移住および台湾からの移住に関する問題にどのように影響するのか、取り組まれました。本論文は、THI/TOI集団の遺伝的構造、台湾低地集団の遺伝的特性、台湾への移住事象および台湾からの移住事象に関する最重要の調査結果を浮き彫りにし、考察します。

 オーストロネシア語族の台湾諸語の言語学的多様性と、台湾先住民集団の異なる文化は、台湾内、とくにTHI/TOI集団の人口構造を示唆します。台湾人集団におけるミトコンドリアDNA(mtDNA)の差異に関する先行研究は、北方から南方へと遺伝的多様性が減少する勾配を明らかにし、mtDNA配列の共有パターンに基づくと、北部と中央部と南部にさらに細分化されました。さらに、中央部集団は南方集団の場合よりも密接に北方集団と関連しており、本論文のゲノム規模データにより示されるように(図3B)、南方集団はさらに細分化できます。じっさい、mtDNA研究では、北方集団のタイヤル人と中央部集団のブヌン人が一部のハプロタイプを共有していたのに対して、南方集団であるルカイ人/パイワン人とアミ人は異なるハプロタイプ特性を有していた、と分かりました。

 さらに、THI/TOIに関する本論文のPCAの結果は、北部集団対南部集団(PC1)および南部集団における細分化(PC2)により駆動される、大きな構造を示唆しています。これは、タイヤル人とルカイ人とアミ人の極により表されており(図3C)、台湾諸語の異なる3系統も表しています(それぞれ、タイヤル語とルカイ語と東台湾諸語)。この構造を形成する主因は、集団内での高水準のIBD共有により示されるように、おそらく集団間の孤立です。タイヤル人が最高水準の集団内IBD共有を示す事実も、タイヤル人がPCAおよびADMIXTURE分析においてTHI/TOI集団で最も独特であることを説明できるかもしれません。タイヤル人は、以前のY染色体DNA研究によると自身の独特なハプロタイプ網を有しており、創始者/孤立事象を経た、と示唆されます。台湾内で観察された遺伝的構造は過去3000年間以内に形成(もしくは強化)されたかもしれません。それは、THI/TOI集団間および集団内のIBD共有の全ての規模範囲でその兆候を確認でき、さまざまな集団の形成について、mtDNAに基づく3000~1000年前頃の推定と一致するからです。しかし、全てのTHI/TOI集団が本論文の分析で表されているわけではなく、これら標本抽出されていない集団を含むさらなる研究が、本論文の観察を証明し、拡張するのに必要です。


●台湾低地集団の遺伝的特性

 約12の確認された台湾低地オーストロネシア人集団(台湾諸語の西平原と北西と東の系統に属します)が存在しますが、本論文のデータでは1集団だけが表されています。台湾低地集団はTHI/TOI集団よりもさらに研究されていないので、本論文のデータは、低地集団の最初のゲノム規模の特徴づけを提供します。より孤立した高地集団とは対照的に、低地集団は漢人集団と広範に接触してきた、と知られています。低地集団は、mtDNAに関してTHI集団とは異なるより大きな人口規模と人口規模変化の類似の人口統計学的パターン、およびY染色体に関してより大きな人口規模とハプログループ共有のより高い頻度を、漢人と共有しています。本論文のデータは、低地集団のマカタオ人について、THI集団と漢人集団との間の常染色体混合の証拠を提供し(図2および図3A)、ルカイ人はTHI供給源の最適な代理となります。マカタオ語は東台湾低地に、ルカイ語はルカイ語群に属していますが、この2集団の標本抽出の場所は地理的に近く(図1A)、その遺伝的類似性を説明し、5~10 cMの規模範囲におけるIBD共有を通じて、最近の局所的接触を反映しているかもしれません。

 漢人集団とオーストロネシア人集団との間の進行中の遺伝子流動の証拠は、50年前頃という推測された混合年代により示唆され、これは本論文の年代測定手法により得られた最新の混合年代かもしれません。マカタオ人の標本抽出が1998~2001年に行なわれたことを考えると、この混合は1950年頃に相当しそうで、それは台湾への中華民国の統治の退却(および多数の漢人の移住)時期と一致します。これも、漢人とオーストロネシア人の集団間の通婚を促進した、鄭氏政権(1661~1683年)とダイチン・グルン(大清帝国)の支配(1683~1895年)後の、最新の歴史的事象の一つでした。したがって、この通婚は、混合の兆候を説明できるかもしれません。

 年代測定の結果とは対照的に、より長い規模範囲ではマカタオ人集団と漢人集団との間でIBD共有の証拠は見つかりませんでした。この理由について本論文は、標本規模が(漢人のような)拡大する人口集団においてIBDを検出するのに充分なほど大きくなかったかもしれない、と推測します。台湾の漢人集団(とくに客家)において追跡可能な量のオーストロネシア人関連構成要素があり、中国の漢人集団よりわずかに多かったので、この遺伝子流動は双方向だった、と推測されます(図2)。しかし、この兆候の弱さを考えると、本論文の混合図分析を用いて、この混合を漢人集団でモデル化できません。しかし、客家クラスタは閩南の場合よりもTHI集団と密接にクラスタ化する、と分かりました。さらに、台湾生物銀行の台湾の漢人の最近の研究は、台湾の漢人集団とオーストロネシア人集団との間の遺伝的共有の証拠を見つけました。台湾低地集団の追加の研究が、これらの人口集団の関係を解明するのに明らかに必要です。


●台湾への移住についての示唆

 台湾への移住事象は、台湾のオーストロネシア人の祖先の起源がどこにあるのか、説明します。言語学的研究では、「オーストロネシア語族祖語」は中国本土の南東部沿岸で形成された可能性が高い、と示唆されています。栽培化されたイネと雑穀の考古学的研究は、中国南東部から台湾、その後はアジア南東部へのつながりを示しており、これは「農耕・言語拡散」モデル下でのオーストロネシア人の祖先の中国南東部起源をさらに裏づけます。mtDNAとY染色体の研究も、中国南東部と台湾との間のつながりを示唆しています。古代DNA研究は、中国南東部沿岸の古代人集団と台湾のオーストロネシア人との遺伝的つながりを確証してきましたが、これらの古代DNA研究はアミ人とタイヤル人のみを含んでおり、nEA祖先系統対sEA祖先系統の推定の不一致を生じました(関連記事1および関連記事2)。

 本論文の結果は、台湾の1500年前頃となる漢本個体群が台湾北部の集団であるタイヤル人と遺伝的類似性を有している一方で、7700年前頃となる亮島および4500年前頃となる鎖港個体群が台湾南部の集団であるルカイ人とわずかにより近い、と示すことにより、台湾もしくはその近隣の刊行された古代人のゲノムに文脈を追加します。タイヤル人の伝統的な領域は台湾北部の宜蘭(Yilan)県の漢本遺跡と重なっており、古代の漢本集団と現代のタイヤル人集団との間の家系関係が示唆されます。対照的に、台湾西部沖合の島に位置する亮島および鎖港遺跡は、ルカイ人の活動的な地域から離れています。古代の亮島および鎖港遺跡個体群と現代のルカイ人との類似性についてのあり得る説明の一つは、mtDNA研究により示唆されているように、ルカイ人が北方から南方へと迅速に移動した台湾への初期移住集団とより密接に関連している、というものかもしれません。じっさい、言語学的研究では、ルカイ語は台湾諸語の最初の分岐と示唆されています。

 本論文は、THI/TOI集団と近隣の古代人および現代人集団におけるnEA対sEAの供給源のモデル化にも立ち戻り、検証された集団の全てはnEA祖先系統(8300年前頃の淄博遺跡個体により表されます)とsEA祖先系統(7700年前頃の亮島個体により表されます)を有するものとしてモデル化できる、と確証しました(図4)。この調査結果から、「祖型オーストロネシア人」およびオーストロネシア人関連の遺伝的構成要素は両方とも、nEA祖先系統とsEA祖先系統の混合である、と示唆されます。さらに、台湾への移住集団(7700年前頃の亮島個体と4300年前頃の曇石山文化個体により表されます)と比較して、1500年前頃の漢本個体群と現在のTHI/TOI集団はnEA供給源の量の増加を示しており、新石器時代拡大後の台湾へのnEA祖先系統の追加の流入を示唆しており、nEAとsEAの間の新石器時代後の遺伝子流動を示した古代DNA研究(関連記事)と一致します。

 興味深いことに、初期の台湾からの移住集団(2200年前頃のグアムの個体、2600年前頃のトンガの個体、2900年前頃のバヌアツの個体)は初期の台湾への移住集団よりも多いものの、THI/TOI 集団およびカンカナイよりも少ないnEA祖先系統を示します。タイヤル人とブヌン人とタオ人は、これらの集団では最も多いnEA祖先系統を示します。このパターンから、台湾へのより多くのnEAからの遺伝子流動が台湾からの拡大の前に起きたか、台湾から移住した初期集団よりも多いnEA祖先系統を有する標本抽出されていない台湾への移住集団が存在した、と示唆されます。さらに、現在のTHI/TOI北部集団は、nEA関連集団との追加の接触がありました。

 先行研究は、オーストロネシア語族話者とタイ・カダイ語族話者との間の密接な言語学的および遺伝学的関係を示唆してきました(関連記事)。言語学的研究はこの関係について、二つの仮説を提起しています。一方は、「オーストロネシア語族祖語」と「タイ・カダイ語族祖語」の話者の共通祖先で、もう一方は、台湾から中国本土に戻り、タイ・カダイ語族話者の祖先となったオーストロネシア人集団です。本論文の混合図の結果は前者の仮説を支持します。それは、タイ・カダイ語族話者祖先系統の標本抽出されていない代理と示されてきたタイ・カダイ語族話者のリー人が、オーストロネシア人集団内に組み込まれているのではなく、オーストロネシア人集団とnEA祖先系統の同じ供給源を共有しているからです。さらに、リー人は祖先的なsEA分枝から追加の祖先系統を別に受け取りました。


●台湾からの移住への示唆

 台湾からの移住事象は、台湾からISEAおよびオセアニアへの移住を説明し、オーストロネシア語族および農耕の拡大と一致します。この移住と文化の拡大は、考古学と言語学と遺伝学の証拠により確証されてきました。とくに、mtDNAとY染色体の研究では、台湾がISEAとオセアニアのオーストロネシア人集団における一部のハプログループ、たとえばmtDNAハプログループ(mtHg)-E1aやY染色体ハプログループ(YHg)O1a2などの起源だった、と示唆されてきました。しかし、台湾からの片親性遺伝標識における大きな寄与と移住の様相/速度の裏づけは議論中で、台湾内の構造とどう関連するのかは、ほぼ調べられていません。片親性遺伝標識データと一致して、本論文の結果は、台湾からの移住集団と台湾南部のTHI/TOI集団との間のより密接な関係を裏づけます。しかし、様々な結果は、台湾から移住した集団と最も近いのが台湾南部のさまざまな集団と示しています。

 ハプロタイプに基づく結果は、アミ人が台湾からの移住集団により近いことを支持し(図3Bおよび図6)、それは、東台湾諸語(アミ語がこれに属します)が台湾からの移住集団のマレー・ポリネシア語派に最も近い、と示唆する最近の言語学的研究により裏づけられます。しかし、アレル(対立遺伝子)に基づくf4比較からは、ルカイ人がアミ人よりも台湾からの移住集団と多くの祖先系統を共有している(図5)、と示され、これはアレルに基づく混合図と一致する結果です。ハプロタイプに基づく分析が最近の接触の兆候を強化する一方で、アレルに基づく分析は人口史における全体的な共有の平均を把握するので、これらの分析結果から、台湾からの移住集団と、アミ人が追加の最近の接触を受け取った一方で、ルカイ人はその歴史を通じて平均的な高い遺伝的類似性を保持した、と示唆されます。

 さらに複雑になる可能性があるのは、最近の遺伝学的研究がTHIとフィリピン人集団との間の言語学的な台湾からの移住年代推定より古い分岐年代を推定し、オーストロネシア語族の拡大は人々の移住と関連していないかもしれない、と示唆したことです(関連記事1および関連記事2)。そのモデルで用いられたアミ人とパイワン人(ルカイ人と密接です)が台湾南部集団であることを考えると、このより古い推定値は、台湾からの移住集団とより遠いTHI集団を用いたことには起因しません。しかし、フィリピン人集団と比較してのTHI集団とnEA関連集団との間の少量の追加の相互作用でさえ、推定値を増加させるかもしれず、それは、このモデルにおいて1つのnEA供給源を含めることが、言語学的な台湾からの移住年代と重複するような信頼区間を拡張するからです。本論文では、全てのTHI集団についてモデル化されたnEA供給源が見られます(図4)。

 要約すると、本論文の結果の簡潔な総合は以下のようになります。第一に、台湾への初期の移住集団は急速に南方へと移動し、台湾からの移住集団になりました。この結論は、初期sEA集団が初期オセアニアの(ラピタ文化関連の)集団と類似の特性を共有している(図2)、と示唆するDyStructの結果と、以前のmtDNA研究により裏づけられます。第二に、台湾への移住集団と台湾からの移住集団との間にほとんど分岐がなかったことを考えると、南部集団であるルカイ人が台湾への移住集団と台湾からの移住集団の両方と過剰なアレル共有を維持している、という本論文の結果は、その祖先が他の現在の台湾人集団の祖先よりも遺伝的浮動が少なかったことを反映しているかもしれません。あるいは、ルカイ人の祖先はじっさいに、台湾への移住集団(すぐに台湾からの移住集団となりました)と最も近いかもしれず、それはルカイ語が最初に分岐した語群という言語学的証拠と一致します。

 第三に、IBDの結果とmtDNAにより示唆されるように、人口はこれら初期の事象後に台湾内でさらに分岐し、台湾北部の集団であるタイヤル人は最も強いボトルネック(瓶首効果)/孤立を経ました。第四に、台湾南部集団であるアミ人と台湾から移住した集団との間のより密接なハプロタイプ共有(とおそらくは言語学的関係)は、最近の逆移住と接触の結果かもしれません(図3Bおよび図6)。本論文の結果と以前の調査結果に基づくと、東台湾諸語話者のアミ人は、マレー・ポリネシア語派話者のタオ人と、地理的にも遺伝学的にも密接です。さらに、蘭嶼島集団であるタオ人はISEAからの逆移住に由来するかもしれない、と示唆されてきました。最後に、さらに最近において、低地集団は漢人集団と広範に相互作用し、混合された遺伝的特性が生じました(図2および図3A)。いずれにしても、THI/TOI集団のより多くの全ゲノム配列決定が、台湾への移住集団と台湾集団と台湾からの移住集団のより多くの古代人ゲノムとともに、これらのモデルを検証する、より洗練された分析の能力を改善するでしょう。


参考文献:
Liu D. et al.(2023): The genomic diversity of Taiwanese Austronesian groups: Implications for the “Into- and Out-of-Taiwan” models. PNAS Nexus, 2, 5, pgad122.
https://doi.org/10.1093/pnasnexus/pgad122

この記事へのコメント