'

Биоинформатика, или молекулярная биология in silico

Понравилась презентация – покажи это...





Слайд 0

Биоинформатика, или молекулярная биология in silico М.С.Гельфанд 15 января 2008 Институт проблем передачи информации им. А.А.Харкевича РАН


Слайд 1

Расшифрован геном!


Слайд 2

Перехватить зашифрованное сообщение – еще не значит его понять Геном бактерии: несколько миллионов нуклеотидов От 600 до 9 тысяч генов (примерно 90% генома кодирует белки) На этом слайде – 0,1% генома Escherichia coli


Слайд 3

Экспоненциальный рост объема данных красный – статьи (PubMed) синий – последовательности (GenBank) зеленый – объем в нуклеотидах (GenBank) из 18 миллионов ссылок, ~675 тыс. отвечают на “bioinformat* OR comput*” 16 тыс. “bioinformat*” 65 тыс. “bioinformat* OR computat*”


Слайд 4

Цель (локальная): аннотировать гены / белки in silico Что? (биохимическая) функция клеточная роль Когда? Регуляция Экспрессия Время жизни (мРНК, белка) Где? Локализация Внутри/снаружи Органеллы и компартменты Как? Механизм Специфичность, регуляция Наиболее важные предсказания затем проверяются экспериментально


Слайд 5

622 полных генома (прокариот)


Слайд 6

Цель (глобальная) Предсказать свойства организма путем (компьютерного) анализа его генома (возможно, с использованием дополнительной информации: эпигенетика, белок-белковые взаимодействия и т.п.) сейчас: метаболическая реконструкция, транспортные системы, ответ на стресс и т.д. “Понять” эволюцию геномов/организмов


Слайд 7

Сравнительная геномика Базовые постулаты: Сходство => гомология (общность происхождения) Гомология => сходная функция Консервативно то, что важно структурные и функциональные мотивы в белках регуляторные сайты в ДНК


Слайд 8

Математические и алгоритмические проблемы Формализация понятия сходства теория вероятностей: значимость наблюдаемого уровня сходства вычислительная геометрия: сходство структур Алгоритмические проблемы: быстрый поиск сходных последовательностей большой объем базы данных (растет быстрее, чем быстродействие процессоров) множественное выравнивание оптимальный алгоритм имеет полиномиальное время работы, но степень равна числу последовательностей построение эволюционных деревьев баланс между биологическими соображениями и вычислительными возможностями Идентификация функциональных и регуляторных мотивов в последовательностях теория предсказания образов: нейронные сети, поддерживающие вектора и т.п.


Слайд 9

Первый российский бактериальный геном - Acholeplasma laidlawii Секвенирование: ИФХМ МЗ РФ, аннотация: ИППИ РАН ~1,5 Mb; ~1400 генов. Установлены функции ~80% генов; проведена метаболическая реконструкция


Слайд 10

Сравнение с родственными геномами


Слайд 11

Сравнительная геномика - 2 Не обязательно последовательности: структура белка и РНК расположение генов на хромосоме (ко-локализация) ко-регуляция и ко-экспрессия генов филогенетические образцы (совместное появление в геномах) Предсказав структурные особенности белка, можно определить его функциональный класс Изучение геномного контекста позволяет отнести ген (белок) к функциональной подсистеме Задача: формализация этих подходов Полногеномные сравнения Статистическая значимость Распознавание образов и экспертные системы


Слайд 12

РНК-переключатели: от биоинформатического анализа к экспериментальной проверке Новый универсальный механизм регуляции экспрессии генов за счет формирования альтернативных структур РНК и прямого связывания малых молекул Структуры и механизм предсказаны биоинформатически и затем подтверждены экспериментально


Слайд 13

Регуляция экспрессии генов за счет формирования альтернативных структур РНК Transcription attenuation Translation attenuation Структура предсказана на основе сравнитель-ного анализа выравненных последова-тельностей Механизм предсказан на основе литературных данных и анализа структурных особенностей


Слайд 14

5’-нетранслируемые области бактериальных генов биосинтеза рибофлавина


Слайд 15

Аттенюация транскрипции Terminator The RFN element Antiterminator Antiterminator


Слайд 16

Другие РНК-переключатели, найденные методами сравнительной геномики Есть во всех трех основных царствах (бактерии, археи, эукариоты) Древнейшие регуляторные элементы: реликт «РНКового мира»?


Слайд 17

Регуляторы гомеостаза цинка nZUR-? nZUR-? AdcR pZUR TTAACYRGTTAA GATATGTTATAACATATC GAAATGTTATANTATAACATTTC GTAATGTAATAACATTAC TAAATCGTAATNATTACGATTTA


Слайд 18

Регуляция гомологов рибосомальных белков nZUR pZUR AdcR


Слайд 19

Плохой сценарий достаточно цинка недостаточно цинка: весь цинк использован рибосомами, не хватает цинка для ферментов


Слайд 20

Регуляторный механизм рибосомы Zn-зависимые ферменты R Достаточно Zn Голодание по Zn R репрессор


Слайд 21

Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.) … и подтверждение (Mol Microbiol. 2004 Apr;52(1):273-83.) (+ еще пять статей в последующие годы): другие гены, другие бактерии


Слайд 22

Сводка подтвердившихся предсказаний Регуляторы РНК-переключатели витамины: рибофлавин, тиамин, кобаламин аминокислоты: лизин, метионин Факторы транскрипции NrdR: рибонуклеотид-редуктазы MtaR, CmbR: метионин и цистеин NiaR, NrtR: метаболизм NAD NsrR, NnrA: нитрозативный стресс Регуляторные взаимодействия регуляторные мотивы в ДНК (>10) отдельные сайты связывания (>20) Ферменты ThiN и TenA (биосинтез тиамина) CobX, CobZ (биосинтез кобаламина) FadE (синтез жирных кислот) AbnA, Xca (катаболизм арабинозы) NagK, NagBII (катаболизм N-ацетилглюкозамина) Транспортеры витамины и кофакторы YpaA и RibM: рибофлавин BioMNY: биотин ThiXYZ: тиамин NiaP: ниацин Vng1369-71: корриноиды сахара и полисахариды OgtABCD: продукты деградации пектина NagP: N-ацетилглюкозамин аминокислоты MetD: метионин SteT: треонин ионы металлов CbiMNQO, HoxN: кобальт NikMNQO: никель нуклеотиды: YicE: ксантин


Слайд 23

Не только тексты Другие типы массовых экспериментов: Транскриптомика «выстилающие массивы»: полная карта транскриптов уровень экспрессии и время жизни мРНК ДНК-белковые взаимодействия Протеомика концентрации белков белок-белковые взаимодействия, белковые комплексы структуры белков Эпигенетика метилирование ДНК положение и модификации нуклеосом Генетика летальность мутаций фенотипы синтетические летали


Слайд 24

«Неприкладная» биоинформатика Молекулярная эволюция филогения генов таксономия организмов горизонтальные переносы и т.п. положительный и отрицательный отбор что сделало нас людьми? лекарственная устойчивость эволюция геномов Системная биология строение геномов сети взаимодействий белок-белковые регуляция транскрипции сигнальные пути


Слайд 25

Перспективы Индивидуальные геномы персональные человеческие геномы геномы штаммов Метагеномы некультивируемые бактерии метагеномы экологических ниш бактериальный метагеном человека Другие виды данных интеграция Моделирование (пока рано) построение полных карт


Слайд 26

Биоинформатика в России Сильные устойчивые школы Москва+Пущино: содружество лабораторий в разных учреждениях Новосибирск: вертикальная структура Высокий уровень конкурентоспособный в мире Интеграция с образованием Факультет биоинженерии и биоинформатики МГУ Кафедра информационной биологии ФЕН НГУ Перспективная область: относительно дешево общедоступная информация – можно использовать чужие данные связь с экспериментальными исследованиями, ведущимися на современном уровне Как развивать: технические разработки (базы данных, пакеты программ») – контракты, наличие потребителя интегрированные компоненты в медицинских и молекулярно-биологических проектах (крупные проекты должны иметь биоинформатическую поддержку) самостоятельные исследовательские работы – гранты


Слайд 27

Российский фонд фундаментальных исследований РАН, программа «Молекулярная и клеточная биология» INTAS Howard Hughes Medical Institute


×

HTML:





Ссылка: