啐啄同時

若手研究者を応援するオヤジ研究者の独白的な日記です。

incomplete lineage sortingの普遍的な謎

 「incomplete linneage sorting (ILS)」の和訳さえない状況の中で、この問題は、ゲノム系統進化学そして集団ゲノム学の中心課題として浮上してきました。
 ここで、教授は、仮和訳として「不完全遺伝子系統仕分け」と呼んでおきます。このような命名は斎藤成也教授の得意とするところですので、適切な和訳に関しては、一度斎藤教授や専門の長谷川政美教授とも相談してみます。ただ、簡単にILS(「不完全遺伝子系統仕分け」)と呼んでおきましょう。(わざと、ILS(「不完全遺伝子系統仕分け」の「遺伝子」を入れておきます。)
 「古多型」(Old polymorphism)といわれるように、生物集団が進化的に分岐する前、単一の祖先集団として存在していたときに、遺伝子レベルではすでに多型現象が存在し、その祖先集団内で遺伝子がすでに分岐を開始しているため、それらの遺伝子は、その後の生物集団の分岐過程に沿って分岐していく他の遺伝子とは異なる系統関係を示します。これが、ILS(「不完全遺伝子系統仕分け」)という現象です。
 とくに、この現象がやっかいなのは、これらの生物集団以前に分岐した遺伝子(単に「ILS遺伝子」といいましょう)は、生物集団の分岐過程に沿って分岐した遺伝子の系統と、トポロジーとしては同じ系統関係を示すものも存在することから、生物集団の分岐前の祖先集団内で分岐したILS遺伝子の「分岐時間」は、もちろん生物集団の分岐以前であるので、全く生物集団の分岐時間と異なる訳ですが、トポロジー的には一見全く区別がつかないという点です。
 さらに、これらの全ての遺伝子は遺伝子重複による分岐ではないので、すべて「オソログ」(直系遺伝子)であるという点です。
 このILS(「不完全遺伝子系統仕分け」)のため、「より正確な系統関係を知るには出来るだけ数多くの遺伝子や完全ゲノムを知って比較すれば、「ひとつ」の正しい系統関係が得られる」という大原則が壊れてしまったのです。
 実は、1980年代に精力的に研究されたコアレッセンス理論によって、「遺伝子の系統関係はある確率分布でしか得られない」ことは既に分かっていたのですが、実際に完全ゲノムや大量の遺伝子のデータが利用可能になって、現実の大きな問題として表面化してきました。
 昨年2011年の11月下旬に米国のUCLAでの「Evolutionary Genomics」のワークショップでは、話題提供の7割が、実に、この問題にフォーカスしていました。
 祖先集団であった時間の長さとその集団の有効サイズ(有効個体数)に、祖先集団における多型の程度が強く依存するので、それらがILS(「不完全遺伝子系統仕分け」)の程度を決める決定的なパラメタになります。
 その意味では、ミトコンドリアゲノムのほうが、核ゲノムより、集団の有効なサイズがハプロイドである分小さいので、ILS(「不完全遺伝子系統仕分け」)が起こりにくく有利に見えます。しかし、ミトコンドリアでは、gene leakage(遺伝子漏れ)や遺伝子のセット置換などが起こり、ミトコンドリアゲノムに基づく系統関係の推定は、「極めて危険」な状況を作り出すことがあり得るが分かってきました。したがって、ミトコンドリアゲノムだけで、系統関係の正確な推定が本当にできているのかという強い危惧を抱くようになってきました。
 いずれにしても、「データが単に多くあれば、それだけより正確な系統関係が導き出せる」という大いなる幻想の時代が終焉を迎えて来ています。では、いったいどうしたらいいのか?
 答は、一見矛盾するようですが、「数多くの遺伝子やゲノムを使う」ということではないでしょうか。「えっ、何それ?、それではより正確な系統関係が得られないといったばかりなのに!」との声が聞こえてきそうです。
 いや、複数の系統関係が得られることを前提にその解析を行い、つまりそれぞれの異なるトポロジーについて「より正確な確率が得られる」ように数多くの遺伝子やゲノム情報を用いて、もっとも確率の高いトポロジーをもつものを生物集団の分岐に沿うものとして、「正解」を得ようとするしか現時点では解決策はないように思われます。
 なお、このILS(「不完全遺伝子系統仕分け」)は、サンプル誤差によるものではなく、現象そのものによる系統的な誤差なので、「ブーツトラップ」のような確率とは本質的に異なることに留意しておきましょう。
 教授は、この問題にも挑戦したいと思っています。