Математика и её применение в биологии и медицине. БиоинформатикаНИР

Mathematics and its applications to biology and medicine. Bioinformatics.

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
2 1 января 2014 г.-31 декабря 2014 г. Математика и её применение в биологии и медицине. Биоинформатика
Результаты этапа: Разработана классификация ДНК-узнающих доменов белков, основанная на типах взаимодействующих элементов. Классификация интегрирована в ранее разработанную и поддерживаемую базу структур комплексов белков с нуклеиновыми кислотами NPIDB. Метод машинного обучения (так называемый случайный лес) применён к двум задачам, возникающим в молекулярной филогенетике: оценке вероятного качества реконструкции филогении на основании свойств множественного выравнивания белковых последовательностей и выбору лучшего алгоритма реконструкции филогении для данного выравнивания. На основе сравнительного анализа геномов человека, шимпанзе и орангутана и данных по вновь возникающим мутациям и однонуклеотидным полиморфизмам человека получены свидетельства сильного стабилизирующего отбора в пользу CG-динуклеотидов в эволюции человека. Разработан детектор структурных мотивов в пространственных структурах белков. При сравнении с другими программами, решающими аналогичную задачу, этот детектор показывает лучшие результаты в сравнении с экспертными классификациями в базе данных SCOP. Разработан алгоритм построения нуклеотидного пангенома семейства близкородственных бактерий с известными последовательностями геномов. Методами биоинформатики показано, что длительное существование системы рестрикции-модификации типа II (но не типов I и III) в геноме бактерии в большинстве случаев приводит к существенному снижению числа сайтов узнавания в геноме. Таким образом, по крайней мере, статистически, по “следам” систем рестрикции-модификации можно делать обоснованные суждения об их жизненном цикле. Методами биоинформатики найдены согласованно мутирующие аминокислотные остатки разных белков вируса гриппа. Высказано предположение, что найденные пары остатков участвуют во взаимодействии соответствующих белков in vivo. Предсказание нуждается в дальнейшей экспериментальной проверке. В области теоретической математики получена явная формула, дающая для любой строго гиперболической группы выражение второго члена в формуле Вейля в виде ряда по нулям функции Сельберга, и указаны некоторые вытекающие из нее следствия. Алгебра $A_\infty$, построенная Ивановым и Керовым, является алгеброй классов сопряженных элементов бесконечной симметрической группы $S_\infty$. В нашей работе конструкция Иванова – Керова обобщена на некоторый класс групп, являющихся индуктивным пределом конечных групп. В основе конструкции лежит определение “частичных элементов”, представляющих из себя пару (конечная группа, элемент этой группы).
3 1 января 2015 г.-31 декабря 2015 г. Математика и её применение в биологии и медицине. Биоинформатика
Результаты этапа:
4 1 января 2016 г.-31 декабря 2016 г. Математика и её применение в биологии и медицине. Биоинформатика
Результаты этапа: План на 2016 г. выполнен полностью. Базы данных комплексов белков с нуклеиновыми кислотами NPIDB работала бесперебойно. Разработаны программы для расширения ее функционала. Созданы два новых веб-сервиса для анализа пространственных структур комплексов белков с ДНК. В программу построения нуклеотидного пангенома NPG-explorer добавлены новые модули анализа пангенома. Программа использована для анализа десятков видов бактерий. Разработан новые алгоритм кластеризации и анализа семейства родственных последовательностей. Он реализован в программе для частного ых выравниваний белков и результатов поиска в базах данных по профилю выравнивания. Изучение систем рестрикции-модификации и их влияния на геномы методами сравнительной геномики. Получение новых результатов в изучении и применении операторов Лапласа.
5 1 января 2017 г.-31 декабря 2017 г. Математика и её применение в биологии и медицине. Биоинформатика
Результаты этапа: База данных комплексов белков с нуклеиновыми кислотами NPIDB была пубдично доступна в течении всего отчетного периода. В нее была интегрирована классификация белков из базв данных семейств доменов Pfam, что расширяет возможности аналоза для пользователей. Изучена эволюция систем рестрикции-модификации трех классов согласно ранее разработанной классификации. Показано, что горизонтальный перенос систем превалирует над вертикальным, от предка к потомкам. Описаны системы рестрикции-модификации в метагеноме антарктического озера Глубокое. Выявлены горизонтальные переносы систем рестрикции-модификации между таксономически далекими археями в этом микробиоме, показано, что в штаммы одного вида архей могут различаться по составу систем рестрикции-модификации. Продемонстрировано, что применяемая нами методика может использоваться для изучения систем рестрикции-модификации в микробиомах. Построены нуклеотидные пангеномы 81 вида бактерий и архей. Разработаны программы для сравнительного анализа аннотаций генов в штаммах, представленных в виде нуклеотидного пангенома. Продолжение работы над системой сравнения программ реконструкции молекулярной филогении. В области теоретической математики решена проблема РЁлбке про спектр оператора Лапласа. Рукопись опубликована как препринт и представлена в журнал. Доказано, что функция распределения простых чисел восстанавливается по дискретному спектру оператора Лапласа на фундаментальной области группы SL(2,Z).
6 1 января 2018 г.-31 декабря 2018 г. Математика и её применение в биологии и медицине. Биоинформатика
Результаты этапа: В отчетном периоде получены результаты в следующих задачах. Эволюция нуклеоплазминового семейства белков.В отчетном году полу- чены следующие результаты, показано, что * Белки NPM имеются только у животных и близкой к ним группы хоанофлагеллят. * Белки хоанофлагел- лят и беспозвоночных почти всегда лишены С-концевых доменов. Исклю- чение составляют только трихоплакс и миксоспоридии. признаки наличия белков NPM с С-концевыми доменами имеются также у гребневиков. * Фи- логенетическое дерево белков NPM распадается на две ветви, одна из ко- торых соответствует белкам беспозвоночных, а другая – белкам хордовых. Последняя, в свою очередь, также разделяется на две ветви, которые соот- ветствуют белкам NPM2 и NPM3. При этом белки оболочников, не имеющие С-концевых доменов, не попадают ни в одну из этих групп. * Несмотря на то, что аминокислотные последовательности N-концевых доменов у разных видов заметно отличаются, остатки, играющие ключевую роль в олигомери- зации, остаются в значительной мере консервативными. Это касается как NPM-белков из разных организмов, так и одного организма (белки NPM1, NPM2 и NPM3 человека). * С-концевые домены в некоторой степени консер- вативны, даже у таких далёких организмов, как трихоплакс и человек, хотя и менее консервативны, чем N- концевые домены. * Белки NPM1 имеются только у позвоночных, причём на данный момент не известно позвоночных животных, у которых отсутствие NPM1 было бы установлено достоверно. Су- ществуют, однако, организмы, имеющие из всех белков NPM только NPM1. Отсутствие у ряда групп белка NPM2 может быть связано с особенностями оогенеза. В 2018 году обеспечена поддержка работоспособности и публичный до- ступ к базе данных о структурах комплексов белков с нуклеиновыми кис- лотами NPIDB, регулярное обновление данных, включенных в NPIDB. Ба- за NPIDB, содержащая структуры РНК-белковых и ДНК-белковых комплек- сов, регулярно обновлялась. После последнего обновления 16 ноября 2018 года она содержит информацию о 7452 структурах. Изменено представле- ние эволюционных доменов, найденных в белковых частях комплексов, вве- дён уровень отдельного белка, каждый из которых может быть представ- лен несколькими структурами. Завершён переход от устаревшей системы онлайн-визуализации макромолекул Jmol к современной JSmol. Продолжена работа по изучению эволюции систем рестрикции модифи- кации методами сравнительной геномики. Описана эволюция трех классов гомологичных систем рестрикции-модификации разных типов. Во всех слу- чаях показаны множественные горизонтальные переносы систем целиком между разными отделами бактерий и архей и даже между бактериями и ар- хеями. Встречаются также случаи горизонтального переноса отдельных ге- нов систем рестрикции-модификации с образованием в результате переноса новых систем, но их меньше, чем переносов систем целиком. Начато изу- чение распространения систем рестрикции-модификации в метагеномных данных. * В 243 собранных метагеномах проектах Tara Ocean было найдено 17500 белков систем Р-М. Из них 9569 – в 135 метагеномах бактериально- го подпроекта. * Системы Типа II находятся существенно чаще остальных, причем в освещенной зоне их в процентном отношении больше, чем в тем- ной. * Зависимости похожести сообществ от географического расстояния ИСТИНА 5 между ними нет. Поверхность Мирового океана можно рассматривать как единое сообщество. * Морские вирусы чаще избегают распространенные сайты, чем редкие. Разработаны новые алгоритмы анализа нуклеотидных пангеномов, по- строенных разработанной нами ранее программой NPG- explorer. В част- ности, создана программа для получения сводной таблицы основных пара- метров множества нуклеотидных пангеномов. Программа была применена для сравнительного анализа нуклеотидных пангеномов 80 видов бактерий и архей, представленных десятью или более геномами разных штаммов. С помощью биоинформатического анализа был выделен новая группа трансаминаз IV типа. По сходству с ранее охаректреризованными белками, были предсказаны особенности специфичности этих трансаминаз, которые затем были проверены экспериментально. В отчетном году в рамках проекта начата работа по анализу данных вы- сокопроизводительных методов секвенирования (NGS) и их применению (В.Штратникова). Методы секвенирования нового поколения (NGS) откры- вают новые возможности для решения многих задач.Проводились работы по исследованию метилирования ДНК сперматозоидов и влияния на него различных химических препаратов окружающей среды у молодых мужчин с помощью метода RRBS (Reduced representation bisulfite sequencing). Со- трудники также принимали участие в теоретическом исследовании мета- баркодинга растений для анализа искусственных смесей определённого и неопределённого состава. Ведётся работа по оптимизации прокотолов се- квенирования микроРНК животных и человека в тканях с высоким и низ- ким содержанием микроРНК. <Выделялись РНК и делались библиотеки для печени крыс, для сперматозоидов крыс, для лейкоцитов людей, для спер- матозоидов людей, для червяка волосатика и для паразитического червя Intoshia>. Продолжена работа над системой сравнения филогенетических про- грамм. Подготовлены 12 наборов выравниваний последовательностей ор- тологичных эволюционных доменов белков, по 60 последовательностей в каждом выравнивании. В совокупности все наборы включают 11578 вырав- ниваний. Каждый набор соответствует одной таксономической группе кле- точных организмов (археи, протеобактерии, актинобактерии, грибы и т.д.). Для каждого набора сформировано референсное филогенетическое дере- во, с которым в дальнейшем будут сравниваться реконструкции филогении, полученные по отдельным выравниваниям. В области теоретической математики доказано,что дискретный спектр оператора Лапласа на фундментальной области модулярной группы опре- деляет закон распределния простых чисел. Статья ”Дискретный спектр оператора Лапласа на фундментальной обла- сти модулярной группы и пси-функция Чебышева” принята к печати в жур- нале ”Известия РАН. Серия математическая” http://www.mathnet.ru/php/archive.phtm ИС

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".