ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
Прочтение первых генетических последовательностей позволило приступить к исследованиям их нуклеотидного состава. Рост числа секвенированных геномов расширяет возможности поиска закономерностей, проявляющихся через недопредставленность или перепредставленность слов в геномах различных организмов. Одновременно появляется база для поиска исключений из уже известных правил. По-видимому, именно эти исключения могут пролить свет на механизмы эволюции и мутагенеза. Ранее мы исследовали встречаемость слов длиной от 1 до 7 нуклеотидов включительно в 139 полных геномах эукариот, представляющих почти все крупные таксоны, и подтвердили исключительность ряда слов [Mitrofanov et. al, JBCB 2009]. Ярким примером исключительности служит слово TA, которое недопредставлено в 130 из 139 исследованных геномов, относящихся к 24 из 25 (кроме Placozoa) крупных таксономических групп. Комплементарная пара слов CTA/TAG недопредставлена в геномах всех исследованных организмов в 13 группах из 25. В некоторых случаях недопредставленности слов известны механизмы, ее вызвавшие. Например, в клетках многих эукариот динуклеотид CpG метилируется, что, по современным воззрениям, увеличивает вероятность транзиции из C в T. В связи с этим можно предположить, что и другие исключительные слова также могут маркировать биологические процессы, ведущие к повышенной или пониженной частоте мутирования. Одним из наиболее удобных объектов для исследования зависимости частот мутаций от нуклеотидного контекста является геном человека. Это связано с наличием большого объёма хорошо аннотированных данных о полиморфизмах, а также с прочтением геномов родственников человека (шимпанзе, орангутанга, макаки резус), сравнение с которыми позволяет восстановить предполагаемый ход эволюции отдельных нуклеотидных позиций. В тех случаях, когда в геноме человека известны аллельные варианты, один из которых присутствует в геномах всех трех упомянутых обезьян, можно предположить направление мутации, в результате которой возник данный полиморфизм. После проведения нормировки числа направленных мутаций в разных словах, можно определить, какие слова менялись чаще, а какие реже в ходе эволюции генома. Направление мутаций было установлено для примерно 4 млн. одиночных нуклеотидных полиморфизмов, а их нормированные частоты были проанализированы в различных контекстах. Полученные результаты указывают на то, что, кроме хорошо известного случая частой замены C>T/G>A в слове CG, существуют и другие слова, в которых мутации происходят с повышенной частотой. Например, транзиции T>C/A>G средней буквы трехбуквенного слова чаще происходят в контексте ATG/CAT и ATA/TAT, а трансверсии G>C/C>G – в слове CGA/TCG. Поиск механизмов, ведущих к появлению найденных закономерностей, представляет собой цель дальнейших исследований. Работа поддержана грантами РФФИ 08-04-91975-ННИОМ_а, 09-04-92743-ННИОМ_а, контрактами с Федеральным агентством по образованию № П1711 и № П810.