ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
В человеческом геноме представлены многочисленные копии повторяющихся генетических элементов (ПГЭ), часть из которых способны к перемещению. Хотя считается, что большинство мобильных ПГЭ неактивны, некоторые из них содержат протяжённые рамки считывания, которые потенциально могут кодировать функциональные белки. Мобилизация ПГЭ приводит к появлению в геноме их новых копий, которые могут стать причиной наследственных заболеваний и изменений в физиологии соматических клеток, включая раковую трансформацию и клеточное старение. Несмотря на усиливающееся внимание к этим аспектам активности ПГЭ, до сих пор не было предпринято попыток провести систематический анализ их кодирующего потенциала. Анализ данных высокопроизводительного секвенирования и масс-спектрометрии в приложении к ПГЭ и кодируемым ими белкам осложняется многокопийностью, диспергированностью и сложной классификацией многочисленных подсемейств ПГЭ, а также дивергированностью их последовательностей. Мы разработали подход, позволяющий идентифицировать транслируемые открытые рамки считывания (ORF) в консенсусных последовательностях ПГЭ на основании данных рибосомного профайлинга и высокопроизводительной масс-спектрометрии клеток и тканей человека. Это позволило выявить более 400 ORF с белок-кодирующим потенциалом в 19 подсемействах ПГЭ человека, в том числе в элементах, которые ранее считались неактивными или некодирующими (в ДНК-транспозонах семейств TIGGER и CHARLIE, неавтономных мобильных элементах SVA и других). В докладе будет представлена он-лайн база данных таких ORF ПГЭ и результаты верификации трансляции некоторых из них. Работа поддержана грантом РНФ 18-14-00291.