Биоинформатика

Целью группы биоинформатики является разработка эффективных вычислительных методов для актуальных задач биологии и медицины. Проекты группы покрывают достаточной широкий спектр задач: от обработки данных метагеномного ДНК-секвкенирования, до анализа экспрессии генов и метаболомики.

 

Группа активно сотрудничает с лабораторией Максима Артемова в Университете Вашингтона в Сент-Луисе и лабораторией Дмитрий Алексеева в МФТИ. Также группа поддерживается компанией JetBrains.

 

Ежегодно, совместно с Институтом Биоинформатики и Университетов Вашингтона в Сент-Луисе, проводится семинар по системной биологии (http://bioinformaticsinstitute.ru/sbw).

 

Основные проекты

 

Сравнительный анализ метагеномных данных. В рамках проекта разрабатывается программа MetaFast (https://github.com/ctlab/metafast). В методе MetaFast применяется компромиссный вариант между использованием метагеномной de novo сборки и спектров k-меров. Такая комбинация позволяет объединить преимущества этих подходов: интерпретируемость и вычислительную эффективность, при отсутствии необходимости наличия заранее известных референсных геномных последовательностей.

 

Анализ открытых баз экспериментальных данных. Базы экспериментальных данных, такие как TCGA и GEO Omnibus, хранят в себе данные большого числа экспериментов и интересным является поиск связей в этих данных. Для поиска таких связей разработывается веб-сервис GeneQuery (http://genome.ifmo.ru/genequery), позволяющий искать эксперименты с похожей регуляцией генов. Поиск неочевидных связей с другими экспериментами упрощает процесс генерации гипотез.

 

Методы анализа для изучения метаболической регуляции. В последнее время ученые оценили роль метаболической регуляции, особенно в контексте иммунной системы и развития опухолевых клеток. Данный проект посвящен разработке методов для изучения метаболической регуляции с помощью анализа данных транскриптомики и метаболомики. В рамках проекта был разработан набор методов, доступных в виде веб-сервиса GAM (https://artyomovlab.wustl.edu/shiny/gam) для интегративного сетевого анализа таких данных.