mm_hse_2023

To GitHub

Molecular Modeling and Simulations (HSE) (Fall 2023)

Contact information

Meetings and Location

1 модуль: 12 и 19 сентября - D210 с 26 сентября до 24 октября - D507

2 модуль: 7,14 и 21 ноября - D210 с 28 ноября по 19 декабря - R610.

Course Description

The course provides an overview of molecular modeling and simulations methods in biology with an emphasis on 3D modeling of biomolecular structures. Covered topics include: viewing and analyzing PDB structures, structural bioinformatics, molecular dynamics simulations, Monte-Carlo simulations, coarse-grained modeling, molecular screening, docking, integrative modeling, quantum chemistry calculations, protein structure prediction, protein design, application of AI methods from protein design and prediction. The course includes both lectures, hands-on exercises, and home assignments.

Learning objectives

Textbooks and learning resources

Required resources

  1. Laptop or workstation with access to internet.
  2. Pymol installed locally on your workstation/laptop.
  3. UCSF Chimera installed locally on your workstation/laptop.
  4. VMD installed locally on your workstation/laptop.
  5. Avogadro installed locally on your workstation/laptop.
  6. Gromacs installed locally.

Course calendar

Attendance policy

Course program (in Russian)

Модуль 1. Introduction and orientation (1 неделя)

Лекция 1 Вводная лекция. История и виды методов моделирования. Понятия молекулярного моделирования, имитационного моделирования, интегративного моделирования. История развития методов молекулярной динамики, методов Монте-Карло. Подходы к созданию моделей структур по экспериментальным данным. Различные методы и границы их применимости. Понятия ab initio и in silico. Современные пакеты для молекулярного моделирования. Современные пакеты для визуализации PDB структур. Суперкомпьютеры в молекулярном моделировании. Слайды лекции. Запись лекции.
Семинар 1 Оргвопросы. Использование ЭВМ и доступ к ним, установка, настройка программ и сред Использование ОС Линукс, установка и компиляция программ. Использование репозиториев, GitHub. Установка и использование программ визуализации структур.
Suggested reading - Методы молекулярного и интегративного моделирования в структурной биологии
- John Kendrew and myoglobin: Protein structure determination in the 1950s
- A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits
- Metropolis, N. The Beginnig of the Monte Carlo Method
- Э.Э. Шноль. "А.Г. Гривцов и молекулярная динамика - начало"
Additional reading - An Introduction to Biological NMR Spectroscopy

Модуль 2. Структурная биоинформатика (4 недели).

Лекция 2 Форматы хранения информации о структуре молекул (PDB, mmCIF, mol2, Z-матрицы и др.). Формат PDB, поля формата. Происхождение структурной информации, основные экспериментальные методы, представление данных. Основы методов РСА, ЯМР, криоЭМ. Элементарная ячейка кристалла, асиметричная единица, понятие BioAssembly, кристаллографическая и некристаллографическая симметрии структур. PDB: B-факторы, occupancy. PDB: специфика ЯМР структур. Правила описания белков, нуклеиновых кислот, липидов, лигандов. Тяжелоатомные и протонированные модели. Протонирование моделей. Базы данных структур. Базы PDB, NDB, MMDB, CCDC, EMDB. Поиск в базах данных, поиск по последовательности и по структуре. Форматы записи электронной плотности. Типичные проблемы в структурах, ротамеры боковых цепей. Определение качества PDB структур. Программы анализа качества структур. Слайды лекции.
Suggested reading - Introduction to PDB Data
Additional reading - PDB format description
Семинар 2 Визуализация 3D-структур. Обзор различных программ (Pymol, Chimera, VMD, Maestro, CND3D, Coot). Программа Pymol. Загрузка структур. Выделение цепей, фрагментов последовательности. Различные представления. Построение поверхностей. Наложение структур. Протонирование моделей. Создание видео. Визуализация конформационных перестроек. Раскраска структуры по B-фактору и другим параметрам. Сравнение структуры с электронной плотностью. Автоматизация в виде скриптов.
Описание и протокол семинара.
Самостоятельная работа 1 см. описание семинара
Лекция 3 Продолжение лекции 2. Методы ЯМР. КриоЭМ. Особенности структур, полученных этими методами. Различные биомолекулы и их представление в PDB. Слайды лекции.
Семинар 3 Работа в программе Chimera
Протокол семинара.
Самостоятельная работа 2 см. описание семинара
Suggested reading/watching - Kurt Wutrich on NMR
- CryoEM
Additional reading - History of spectroscopy
Лекция 4-5 Анализ и сравнительный анализ 3D-структур. Виды визуализации структур, стерео-представление, ray-tracing. Определение вторичной структуры. Карты Рамачандрана. Поверхность доступная растворителю. Водородные связи. Карты контактов. Структурные выравнивания и среднеквадратичное отклонение. Идентификация структурных доменов. Базы данных CDD и PFAM. Структурная классификация доменов (SCOP, CATH). Идентификация полостей и сайтов связывания. Электростатический и гидрофобный потенциалы. Определение состояний протонирования. Анализ симметрии. Анализ динамики, нормальные моды. Оценка свободной энергии сворачивания. Определение мультимеров. Слайды лекции.
Семинар 4-5 Анализ и сравнительный анализ 3D-структур. Работа с библиотекой MDAnalysis. Расчет растояний, углов, контактов. Расчет RMSD. Стркутурное выравнивание. Работа в программе Chimera. Структурные выранивания, струкутрное выравнивание последовательностей. Добавление водородов, программа REDUCE. Добавление зарядов, PDB2PQR. Рассчет pK, PROPKA. Расчет электростатического потенциала, APBS. Поиск водородных связей. Библиотека Prody. Анализ нормальных мод. Поиск родственных структур, определение консервативных остатков, визуализация.
Протокол семинара.
Самостоятельная работа 4 см. описание семинара
Suggested reading - D. Eisenberg, The discovery of the α-helix and β-sheet, the principal structural features of proteins
- J.S. Richardson, The Anatomy and Taxonomy of Protein Structure

Модуль 3. Предсказание структуры белков (1 неделя).

Лекция 6 Методы предсказания структры белков. Моделирование по гомологии. Создание выравнивания. Оценка качества модели. Детекция фолда. Протягивание. Скрытые марковские модели. Нейросети. Физические методы моделирования и предсказания. Слайды лекции. Видеозапись.
Семинар 6 Знакомство с программами Modeller, AlphaFold и Swiss-Model. Знакомство с программами Modeller и Swiss-Model. Построение структурных моделей по гомологии с известными структурами. Знакомство с программой AlphaFold и построение структурных моделей с её помощью. Протокол семинара.
Самостоятельная работа 5 см. описание семинара
Suggested reading - Mini-review: before and after AlphaFold2
- A structural biology community assessment of AlphaFold2 applications
Additional reading - Разбор Алгоритов Альфа Фолд на Харбре AS IS

Модуль 4. Методы молекулярной механики и динамики (4 недели).

Лекция 7-8 Теоретические основы методов молекулярной механики и динамики. Задание моделей молекул. Молекулярно-механические модели, границы применимости. Основы классической механики: материальные точки, законы Ньютона, силы, энергия, Гамильтониан, обобщенные переменные, координаты реакции. Методы минимизации энергии. Уравнения движения. Траектории движения частиц, фазовое пространство. Численные подходы к решению уравнений движения. Алгоритмы Эйлера, Верле, Лип-Фрог. Неустойчивость траектроий и хаос. Обратимость по времени уравнений движения. Типы взаимодействий в молекулярных системах. Понятие силового поля и топологии молекулы. Единицы длины, времени, энергии. Основные типы взаимодействий: валентные, невалентные взаимодействия, связи, валентные, торсионные, ложноторсионные углы, потенциал Леннард-Джонса, заряды. Проблема учета электростатических взаимодействий. Силовые поля класса II. Поляризуемые силовые поля. Модели воды. Неявный растворитель. Основы статистической физики: распределение Больцмана-Гиббса, понятие энтропии, второй закон термодинамики. Парадокс обратимости. Гипотеза эргодичности. Понятие термодинамического ансамбля. Понятие свободной энергии, работы. Профили свободной энергии, потенциал средней силы. Неравновесные процессы. Равенство Джарзинского. Слайды лекции.
Семинар 7-8 Подготовка и запуск МД расчетов в Gromacs Протокол семинара.
Самостоятельная работа 6 см. описание семинара
Suggested reading - M. Karplus History of molecular dynamics
Лекция 9 Алгоритмы и методы молекулярной динамики. Общая схема постановки молекулярно-динамического расчета. Подготовка, минимизация и релакасация системы. Выбор шага интегрирования. Периодические граничные условия. Радиусы обрезания. Суммы Эвальда и методы учета электростатических взаимодействий. Списки соседей. Ограничения на длины связей. Термостатирование и баростатирование системы. Броуновская динамика, динамика Ланжевена. Параллельные вычисления. Декомпозиция области. Суперкомпьютерные параллельные технологии в молекулярном моделировании. Использование графических процессоров. Слайды лекции.
Suggested reading - стр. 38 - 55. Диссертация "Интегративное моделирование структуры и динамики биомакромолекулярных комплексов"
- Hollingsworth et al. Molecular Dynamics Simulation for All"
Семинар 9 Анализ расчетов в MDAnalysis. Протокол семинара.
Самостоятельная работа 7 см. описание семинара
Лекция 10 Дизайн и анализ молекулярно-динамических экспериментов. Методы Монте-Карло. Вариации методов МД Выбор стартового состояния. Выбор набора систем для сравнительного моделирования. Выбор силового поля. Выбор времени моделирования и количества моделирумых систем. Методы работы с траекториями. Выход на равновесие. Иерархия динамических веремен. Анализ средних, флуктуаций, статистической достоверности. Автокорреляционные функции. Связь корреляции и диффузии. Энтальпия взаимодействия, теплоемкость. Функции радиального распределения. Анализ RMSD, d-RMSD. Кластерный анализ. Сетевой анализ. Анализ на основе марковских моделей. Добавление внешних воздействий. Примеры результатов моделирования различных систем (фолдинг белков, диффузия лигандов в белках, биомембраны, ионные каналы, ДНК-белковые комплексы). Транспортные коэффициенты. Анализ главных компонент. Методы понижения размерности. Применение нейросетей. Методы Монте-Карло. Методы марковских цепей Монте-Карло (Markov chain Monte-Carlo). Критерий Метрополиса-Хастингса. Методы улучшения возмжоностей статистических выборок (enhanced sampling techniques). Вычислительный отжиг (simulated annealing). Методы обмена репликами (Replica Exchange, Parallel tempering.). Метод зонтичной выборки (umbrella sampling, WHAM). Метод адаптивной семщающей силы (ABF, adaptive biasing force). Различные виды коллективных переменных. Метод управляемой МД (steered MD). Адиабатически смещенная МД (adiabatic bias MD). Метод метадинамики. Метод ускоренной МД (accelerated MD). Методы расчета свободной энергии. Примеры оценки термодинамических параметров и профилей свободной энергии. Огрубленное моделирование. Мультимасштабное моделирование. Слайды лекции.
Suggested reading - Руководство к программе Amber, рекомендации по силовым полям, раздел II.3 стр. 33-65
- Chen et al. Enhancing sampling with free-energy calculations"
Семинар 10 Using PLUMED for enhanced sampling. Протокол семинара.
Самостоятельная работа 9 см. описание семинара

Модуль 5. Виртуальный скрининг и докинг (1 неделя).

Лекция 11 Методы виртуального скирининга и докинга. Медицинская химия и рациональный дизайн лекарств. Хиты и лидерные соединения. Хранение информации о химических соединениях. Меры сходства химических соединений. Коэффициент Танимото. Базы данных химических соединений. Понятие о QSAR методах, расчеты ADMET cвойств. Виды виртуального скрининга. Фармакофоры и фармакофорный поиск. Молекулярный докинг: общая постановка задачи, определения и основные подходы. Учёт конформационной подвижности лиганда и рецептора. Алгоритмы поиска поз. Межмолекулярные взаимодействия и функции оценки энергии связывания. Использование молекулярного докинга для аннотации функции белка. Макромолекулярный докинг - его отличия от докинга низкомолекулярных соединений. Белок-пептидный докинг. Примеры программ и веб-сервисов для выполнения молекулярного докинга. Слайды лекции. Слайды лекции. В.Н. Новоселецкого 2021 год
Suggested reading - Руководство к программе Autodock
Семинар 11 Знакомство с программами SwissDock и AutoDock Vina Протокол семинара.


—– Окончание курса ——

Assessment

Оценка по курсу кумулятивная.

Каждый оценочный элемент содержит стандартную часть, которая оценивается по 8 бальной шкале и часть повышенной сложности, которая позволяет получить дополнительные два балла (для оценок 9 и 10).

Домашние работы

Промежуточная контрольная работа

Промежуточная контрольная работа содержит стандартную часть по метриалам лекций (оценивается от 0 до 8) и часть повышенной сложности – вопросы на основе списка литератры, предложенного к прочтению для данной лекции (suggested reading) (оценивается в два дополнительных балла).

Финальная контрольная работа или экзамен

Слушателям на выбор представляется возможность либо сдать финальную контрольную работу, либо устный экзамен, либо и то, и то и выбрать для кумулятивной оценки наилучший для себя вариант. Финальная контрольная работа содержит вопросы только по материалам лекций и оценивается максимум в 8 баллов. Устный экзамен состоит из стандартной части (любые вопросы по материалам лекций, оценивается от 0 до 8 баллов) и части повышенной сложности – вопросы на основе списка литературы, предложенного к прочтению для лекций (suggested reading) (оценивается в два дополнительных балла). Вопросы повышенной сложности задаются, если слушатель ответил на все вопросы стандартной части на оценку 8. Слушателям желающим получить оценку 9 или 10 за весь курс необходимо сдать устный экзамен.

Политика в отношении экзамена автомата

Слушатели, набравшие определенный средний балл за домашние работы, промежуточную контрольную и финальную контрольную работу, могут получить данный балл в качестве экзамена автомата (округление производится по стандартным правилам 3.5=4 3.49=3). Данный балл не может быть больше 8. Желающие получить балл более 8 должны сдавать устный экзамен.