Логика случая

Страница: 1 ... 3839404142434445464748 ... 370

Структуру эволюционного процесса определяют не только консервативные последовательности. На протяжении чрезвычайно длительных эволюционных периодов не просто сохраняется сходство последовательностей РНК и белков, но и гены имеют свойство сохранять свою уникальность. Иными словами, большинство генов развиваются как ортологичные линии , с редкими случаями дупликации (Koonin, 2005). Устойчивость ортологии генов становится очевидной благодаря простой процедуре, широко применяемой в сравнительной геномике и позволяющей эффективно выявлять ортологичные наборы генов. При этом ортологи обнаруживаются как «наилучшие совпадения при двунаправленном сравнении» (bidirectional best hits): все закодированные в геноме белковые последовательности сравниваются со всеми белками, закодированными в другом геноме, a затем процедура повторяется в обратном направлении (Tatusov et al., 1997). Пары генов, дающие наилучшие совпадения (те, которые демонстрируют наибольшее сходство последовательностей) при обоих направлениях сравнения, считаются возможными ортологами; нетрудно применить эту процедуру к нескольким видам путем совмещения треугольников двунаправленных совпадений, имеющих общую сторону (см. табл. 3–1). Примечательно, что такой прямолинейный подход в большинстве случаев хорошо срабатывает: к примеру, порядка 70 процентов генов организмов, разделенных приблизительно 100 миллионами лет эволюции, таких как люди и мыши, легко идентифицируются как ортологи при помощи описанной процедуры (Wolf et al., 2009). Если применить простую модификацию этого алгоритма и включить дупликации генов, характерных для одной линии наследования (дупликации, образовавшиеся после расхождения сравниваемых видов), такой подход позволяет идентифицировать наборы ортологов (известных как кластеры ортологичных генов , КОГ) во многих геномах, в том числе столь удаленных друг от друга, как археи и бактерии – представители двух доменов прокариот (см. гл. 5). Более точные и мощные способы обнаружения ортологов требуют подробного анализа филогенетических деревьев (см. табл. 3–1); впрочем, результаты такого анализа обычно близки к тем, что дают более простые методы, основанные только на сравнении последовательностей. Разумеется, для части генов история дупликаций и потерь настолько сложна, что обнаружить КОГ трудно, поэтому они становятся нечеткими кластерами с неопределенной внутренней структурой. По счастью, этих «трудных» генов в каждом геноме относительно немного.

Таблица 3–1. Классификация гомологичных связей генов: ортологи, паралоги и методы их определения.

— 43 —
Страница: 1 ... 3839404142434445464748 ... 370