hse_mol_mod_2021

To GitHub

Введение в молекулярное моделирование для ПМИ ФКН (5 лекций и семинаров) (Осень 2021)

Contact information

Meetings and Location

Course Description

The course provides an overview of molecular modeling and simulations methods in biology with an emphasis on 3D modeling of biomolecular structures. Covered topics include: viewing and anlyzing PDB structures, structural bioinformatics, molecular dynamics simulations, Monte-Carlo simulations, coarse-grained modeling, molecular screening, docking, model building from experimental data, integrative modeling, quantum chemistry calculations, protein structure prediction. The course include both lectures, hands-on exercises and two home assignments.

Learning objectives

Textbooks and learning resources

Required resources

  1. Laptop or workstation with access to internet.
  2. Account on Discord https://discord.com
  3. UCSF ChimeraX installed locally on your workstation/laptop.
  4. VMD installed locally on your workstation/laptop.
  5. Pymol installed locally on your workstation/laptop.

Course calendar

Assignments policy

Course program (in Russian)

Модуль 1. Введение (1 неделя)

Лекция 1 Вводная лекция. История и виды методов моделирования. Понятия молекулярного моделирования, имитационного моделирования, интегративного моделирования. История развития методов молекулярной динамики, методов Монте-Карло. Подходы к созданию моделей структур по экспериментальным данным. Различные методы и границы их применимости. Понятия ab initio и in silico. Современные пакеты для молекулярного моделирования. Современные пакеты для визуализации PDB структур. Суперкомпьютеры в молекулярном моделировании. Слайды лекции. Запись лекции - начало. Запись лекции (весна 2021).
Семинар 1 База данных PDB. Использование ЭВМ и доступ к ним, установка, настройка программ и сред. База данных PDB - обзор, поиск информации. Использование ОС Линукс, подключение к вычислительному кластеру, SSH, установка и компиляция программ. Jupyter notebooks. Google Colab. Использование репозиториев, GitHub. Установка и использование программ визуализации структур. Программы PyMol, Chimera, VMD.
- По результатам семинара стеднты должны иметь представление о работе с базой данных https://www.rcsb.org
- По результатам семинара студенты должны иметь представление о работе в командной строке ОС Linux, уметь работать с Jupyter Notebooks, установить на свои компьютеры программы PyMol, Chimera, VMD. Скомпилировать программу Gromacs в Google Colab или на сервере.
- Ссылка на Google Colab - Видео семинара
Suggested reading - John Kendrew and myoglobin: Protein structure determination in the 1950s
- A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits
- Metropolis, N. The Beginnig of the Monte Carlo Method
- Э.Э. Шноль. "А.Г. Гривцов и молекулярная динамика - начало"
- An Introduction to Biological NMR Spectroscopy

Модуль 2. Структурная биоинформатика (2 недели).

Лекция 2 Форматы хранения информации о структуре молекул (PDB, mmCIF, mol2, Z-матрицы и др.). Формат PDB, поля формата. Происхождение структурной информации, основные экспериментальные методы, представление данных. Элементарная ячейка кристалла, асиметричная единица, понятие BioAssembly, кристаллографическая и некристаллографическая симметрии структур. PDB: B-факторы, occupancy. PDB: специфика ЯМР структур. Правила описания белков, нуклеиновых кислот, липидов, лигандов. Тяжелоатомные и протонированные модели. Протонирование моделей. Базы данных структур. Базы PDB, NDB, MMDB, CCDC, EMDB. Поиск в базах данных, поиск по последовательности и по структуре. Форматы записи электронной плотности. Типичные проблемы в структурах, ротамеры боковых цепей. Определение качества PDB структур. Программы анализа качества структур. Слайды лекции. Запись лекции.
Required reading - Introduction to PDB Data
Suggested reading - PDB format description
Семинар 2 Визуализация 3D-структур. Обзор различных программ (Pymol, Chimera, VMD, Maestro, CND3D, Coot). Программа Chimera X. Загрузка структур. Выделение цепей, фрагментов последовательности. Различные представления. Построение поверхностей. Наложение структур. Протонирование моделей. Создание видео. Визуализация конформационных перестроек. Раскраска структуры по B-фактору и другим параметрам. Сравнение структуры с электронной плотностью. Автоматизация в виде скриптов.
Видео семинара


Лекция 3 Анализ и сравнительный анализ 3D-структур. Виды визуализации структур, стерео-представление, ray-tracing. Определение вторичной структуры. Карты Рамачандрана. Поверхность доступная растворителю. Водородные связи. Карты контактов. Структурные выравнивания и среднеквадратичное отклонение. Идентификация структурных доменов. Базы данных CDD и PFAM. Структурная классификация доменов (SCOP, CATH). Идентификация полостей и сайтов связывания. Электростатический и гидрофобный потенциалы. Определение состояний протонирования. Анализ симметрии. Анализ динамики, нормальные моды. Оценка свободной энергии сворачивания. Определение мультимеров. Слайды лекции. Запись лекции.
Семинар 3 Анализ и сравнительный анализ 3D-структур. Работа в программе ChimeraX. Изучения структур с лигандами. Выравнивания последовательностей белков, раскраска структур по консервативности. Работы с картами электронной плотности. Изучение меню программы Chimera.
Протокол семинара. Видео семинара
Домашняя работа 1 Вам будет необходимо выбрать одну из молекул месяца с сайта PDB (кажый студент выбирает свою), на странице описания выбрать понравившуюся струтуру PDB. Для этой структуры необходимо провести следующий анализ: 1) визуализировать в трех различных представлениях, 2) визуализировать электростатическую поверхность струкутры, 3) провести анализ структуры на предмет наличия лигандов, ионов, молекул воды, 4) отобразить основные контанты/водородные связи лигандов или ионов с ключевыми аминокислотами, определить эти аминокислоты, 5) провести раскраску структуры белка по консервативности, определить наиболее и наименее консервативные аминокислоты.
Для распределения работ - вписать себя по ссылке в этот файл.
По выполненной работе необходимо сделать отчет в форматие PDF с иллюстрациями и ссылками на литературу, в начале отчета необходимо предоставить информацию о функциях и биологическом значении изучаемой PDB струкутры.
Suggested reading - D. Eisenberg, The discovery of the α-helix and β-sheet, the principal structural features of proteins
- J.S. Richardson, The Anatomy and Taxonomy of Protein Structure

Модуль 3. Методы молекулярной механики и динамики (1 неделя).

Лекция 4 Теоретические и практические основы методов молекулярной механики и динамики. Молекулярно-механические модели, границы применимости. Основы классической механики: материальные точки, законы Ньютона, силы, энергия, Гамильтониан, обобщенные переменные, координаты реакции. Методы минимизации энергии. Уравнения движения. Траектории движения частиц, фазовое пространство. Численные подходы к решению уравнений движения. Алгоритмы Эйлера, Верле, Лип-Фрог. Неустойчивость траектроий и хаос. Обратимость по времени уравнений движения. Типы взаимодействий в молекулярных системах. Понятие силового поля и топологии молекулы. Единицы длины, времени, энергии. Основные типы взаимодействий: валентные, невалентные взаимодействия, связи, валентные, торсионные, ложноторсионные углы, потенциал Леннард-Джонса, заряды. Проблема учета электростатических взаимодействий. Силовые поля класса II. Поляризуемые силовые поля. Модели воды. Неявный растворитель. Основы статистической физики: распределение Больцмана-Гиббса, понятие энтропии, второй закон термодинамики. Парадокс обратимости. Гипотеза эргодичности. Понятие термодинамического ансамбля. Общая схема постановки молекулярно-динамического расчета. Подготовка, минимизация и релакасация системы. Выбор шага интегрирования. Периодические граничные условия. Радиусы обрезания. Суммы Эвальда и методы учета электростатических взаимодействий. Списки соседей. Термостатирование и баростатирование системы. Броуновская динамика, динамика Ланжевена. Параллельные вычисления. Декомпозиция области. Суперкомпьютерные параллельные технологии в молекулярном моделировании. Использование графических процессоров. Слайды лекции. Запись лекции.
Семинар 4 Знакомство с программой Gromacs, расчеты методом МД. Протокол семинара. Видео семинара
Домашняя работа 2 Вам необходимо выбрать любую структуру белка с сайта базы данный PDB и провести ее моделирование в программе Gromacs, следуя протоколу, разобранному на семинаре. В отчете по домашнему заданию необходимо построить графики зависимости потенциальной энергии, температуры, давления, RMSD и радиуса гирации от времени моделирования. Траекторию необходимо визулизировать в программе VMD и сделать изображение белка в представлении Cartoon с наложением нескольких динамических конформаций друг на друга.
Советы по выбору структуры PDB: выбирайте небольшой белок (до 100 аминокислот), белок должен состоять только из стандартных аминокислотных остатков, не содержать иных химических соединений.

Модуль 4. Предсказание и дизайн структуры белков (1 неделя).

Лекция 5Методы предсказания и дизайна структры белков. Физические принципы организации белков. Водородные связи, гидрофобные взаимодействия, взаимодействия ароматических аминокислот. Понятие воронки фолдинга, парадокс Левинталя, расплавленная глобула. Однодоменные и многодоменные белки. Моделирование по гомологии. Создание выравнивания. Оценка качества модели. Скрытые марковские модели. Физические методы моделирования и предсказания. Эмпирические функции свободной энергии белков. Создание мутантных белков, термостабильных белков. Предсказание влияния аминокислотных замен. Использование машинного обучения для предсказания структуры белка. Alpha Fold. De novo дизайн белков. Подходы к оптимизации структуры. Мультимасштабные подходы. Пример подходов в программе Rosetta. Примеры искусственно созданных белков. Слайды лекции. <a href="Запись лекции. ">Видеозапись лекции.</a>
Семинар 5 Предсказание структуры белка с помощью AlphaFold2. Видео семинара Используем пример из проекта CollabFold
Пример запуска из программы ChimeraX