Систематика прокариот — детализированные пояснения

в 1:20, , рубрики: биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: , , , , ,

В предыдущей статье я не сильно утруждал себя детальным описанием идеи. Мне казалось она интуитивна понятна и элементарна. Но после дискуссии с Davidov понял, что идею не так то просто схватить. Дело в том, что сейчас классические представления в филогенетике строятся на одной догме, которая искажает мировоззрение биологов.

Когда мы строим эволюционное дерево — мы конечно же хотим знать в какой последовательности во времени видообразовывались виды. Но классическая филогенетика объявила, что это не научно ставить такой вопрос. И по сути расписалась в своем невежестве. Действительно, судить о времени видообразования, в то время как эволюционный процесс идет каждую минуту сложно. Но можно. Пояснить как это можно и призвано данное детализированное объяснение.

Идеальная точка расхождения видов

Рассматривать на пальцах, умозрительно будет не понятно, поэтому мы рассмотрим проблему на одном частном примере.

Систематика прокариот — детализированные пояснения

Обязательно смотрим пример в высоком разрешении.

Начнем с того, что такое вершина Cellvibrio. Cellvibrio — это один род протеобактерий. В роду есть несколько видов. Но секвенируют не вид, а одного из представителей вида — называется штамп (все равно, что взять геном конкретного человека — так получаем штамп вида). Теперь в данном примере получилось так, что сейчас секвенирован только один штамп Cellvibrio — вида Cellvibrio japonicus, а штамп назвали Ueda107. Поэтому на графе на вершине Cellvibrio нет связи с сами собой — нет информации.

Далее посмотрим на другую вершину Cellulomonas. Это другой род, и секвенированно два штампа разных видов. И около вершины есть связь с самим собой. И там стоят цифры 8-8. Это означает, что при сравнении этих штампов (в данном случае только двух) этого рода оказалось, что у них на 100% совпадают 8 разных тРНК.

Вообще в организме как правило около 20 тРНК (на каждую аминокислоту). Далее как правило организм содержит 2-3 вариации одной и той же тРНК. Но более древние организмы содержат даже не все 20 тРНК, и часто в одном варианте. Более молодые имеют большие разнообразие. Поэтому внутри рода если совпадают 40-60 тРНК — то можно с уверенностью говорить, что это сравнительно молодой род, и штампы к нему отнесены правильно. В данном случае у нас 8 — это маловато, но это как раз исключение, т.к. это один из древнейших организмов.

Откуда это следует (кроме как из малого числа совпадающих тРНК)?

В прошлой статье я давал полный граф систематики прокариот

Систематика прокариот — детализированные пояснения

Тут есть идеальная точка между самым большим черным пятном (там представители Гамма протеобактерий) и областью справа, где видны отдельные узлы. Это точка и есть вершина Cellvibrio.

Чем она примечательна? Сам род Cellvibrio относят к гаммапротеобактериям, но мы видим, что этот род имеет связи не только с кластером гаммапротеобактерий, но и с другим, например с вершиной Cellulomonas — а это род относят к типу Actinobacteria.

Встает вопрос: что более вероятно, что представители рода Cellvibrio агрегировали в себя тРНК из десятка гаммапротеобактерий и десятка других видов разных типов, например из Actinobacteria?

(Отдельно подчеркну, что даже совпадение одной тРНК это не случайное событие, а тут совпадает 5-7. )

Или же мы должны сделать вывод, что вид Cellvibrio japonicus существовал до того, как образовались протеобактерии и ряд типов, таких как Actinobacteria?

Естественно, что вероятность наличия одного вида вначале больше, чем агрегация сразу нескольких десятков видов в один вид.

Да, сейчас Cellvibrio japonicus — может отличаться, от Cellvibrio japonicus который был миллион лет назад, но за этот миллион лет его 5-7 тРНК не изменились вообще, в то время как белки и скажем рРНК подвергались мутациям.

Вот это один самый простой и яркий пример как можно судить о возрасте видов по отношению к другим.

Упорядочивание по возрасту

Но таких идеальных точек как мы видим на общем графе очень мало, это скорее случайность, когда так легко можно судить о том какой вид древнее, а какой более молодой.

Чаще идет наслоение одних родов на другие, и разобраться становится сложнее. Проследим это по первому графу. Вершина Cellvibrio имеет связи со всеми прочими вершинами, за исключением только одной Nocardia, которая связана так Cellvibrio — Cellulomonas — Nocardia. Т.е. мы можем здесь говорить, что род Nocardia более молодой по сравнению со всеми остальными, т.к. требует образования промежуточного рода Cellulomonas.

Как же проанализировать остальные связи?

Есть несколько способов в зависимости от желания детализации. Если посмотреть на подписи связей там мы увидим минимальное-максимальное число идентичных тРНК. Например, между родами Cellvibrio и Isoptericola (находится крайний слева) есть 6 идентичных тРНК. А с другой стороны между Cellvibrio и Kocuria (крайний справа) только 1 идентичная тРНК.
Таким образом можно говорить, что рода удаляются от Cellvibrio постепенно слева на право.

Это справедливо для первого ряда на 100%. И снова это позволяет говорить о времени образования родов.

Но со вторым рядом сложнее. Дело в том, что во втором ряде вершины имеют два входа от Cellvibrio и Cellulomonas, и становится не ясно от кого же из эти двух образовался следующий род.

Можно поступить статистически. Например, сравним две связи Cellvibrio — Isoptericola и Cellulomonas — Isoptericola. Первая имеет 6-6 идентичных тРНК, вторая 5-7. Значит можно сделать вывод, что от Cellvibrio к Cellulomonas передались 6 идентичных тРНК, и только потом образовался род Isoptericola которому передалась еще 1 тРНК, а в каком то виде потерялась 1 тРНК (итого передалось 5-7). И тогда связь Cellvibrio — Isoptericola опосредованна и ее можно удалить. И становится более точно видно кто от кого происходит во времени.

Есть и другие варианты. Там уже можно смотреть не статистически, а детально, есть ли конкретные тРНК, как предпосылка для последующего образования рода. Объясню подробнее на этом же примере в комментариях — если будет интерес.

Т.е. основная идея в том, что Целое не может образоваться, если еще в природе нет частей, из которых должно состоять целое.

Автор: tac

Источник


* - обязательные к заполнению поля