mol_model_course

To GitHub

Molecular Modeling and Simulations for Biologists (Spring 2021)

Contact information

Meetings and Location

Credits

2 credits, 72 academic hours

Course Description

The course provides an overview of molecular modeling and simulations methods in biology with an emphasis on 3D modeling of biomolecular structures. Covered topics include: viewing and anlyzing PDB structures, structural bioinformatics, molecular dynamics simulations, Monte-Carlo simulations, coarse-grained modeling, molecular screening, docking, model building from experimental data, integrative modeling, quantum chemistry calculations, protein structure prediction. The course include both lectures, hands-on exercises and home assignments.

Learning objectives

Textbooks and learning resources

Required resources

  1. Laptop or workstation with access to internet.
  2. Web-cam in case of distant learning.
  3. An account on Newton Server https://newton.bioeng.ru See instructions here.
  4. Pymol installed locally on your workstation/laptop.
  5. UCSF Chimera installed locally on your workstation/laptop.
  6. VMD installed locally on your workstation/laptop.
  7. Avogadro installed locally on your workstation/laptop.

Course calendar

Attendance policy

Assignments policy

Course program (in Russian)

Модуль 1. Introduction and orientation (1 неделя)

Лекция 1 Вводная лекция. История и виды методов моделирования. Понятия молекулярного моделирования, имитационного моделирования, интегративного моделирования. История развития методов молекулярной динамики, методов Монте-Карло. Подходы к созданию моделей структур по экспериментальным данным. Различные методы и границы их применимости. Понятия ab initio и in silico. Современные пакеты для молекулярного моделирования. Современные пакеты для визуализации PDB структур. Суперкомпьютеры в молекулярном моделировании. Слайды лекции. Запись лекции.
Семинар 1 Использование ЭВМ и доступ к ним, установка, настройка программ и сред Использование ОС Линукс, подключение к вычислительному кластеру, SSH, X2GO, установка и компиляция программ. Использование репозиториев, GitHub. Установка и использование программ визуализации структур. - Протокол семинара
Самостоятельная работа 1 см. протокол семинара
Required reading - Методы молекулярного и интегративного моделирования в структурной биологии
Suggested reading - John Kendrew and myoglobin: Protein structure determination in the 1950s
- A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits
- Metropolis, N. The Beginnig of the Monte Carlo Method
- Э.Э. Шноль. "А.Г. Гривцов и молекулярная динамика - начало"
- An Introduction to Biological NMR Spectroscopy

Модуль 2. Структурная биоинформатика (2 недели).

Лекция 2 Форматы хранения информации о структуре молекул (PDB, mmCIF, mol2, Z-матрицы и др.). Формат PDB, поля формата. Происхождение структурной информации, основные экспериментальные методы, представление данных. Элементарная ячейка кристалла, асиметричная единица, понятие BioAssembly, кристаллографическая и некристаллографическая симметрии структур. PDB: B-факторы, occupancy. PDB: специфика ЯМР структур. Правила описания белков, нуклеиновых кислот, липидов, лигандов. Тяжелоатомные и протонированные модели. Протонирование моделей. Базы данных структур. Базы PDB, NDB, MMDB, CCDC, EMDB. Поиск в базах данных, поиск по последовательности и по структуре. Форматы записи электронной плотности. Типичные проблемы в структурах, ротамеры боковых цепей. Определение качества PDB структур. Программы анализа качества структур. Слайды лекции.
Required reading - Introduction to PDB Data
Suggested reading - PDB format description
Семинар 2 Визуализация 3D-структур. Обзор различных программ (Pymol, Chimera, VMD, Maestro, CND3D, Coot). Программа Pymol. Загрузка структур. Выделение цепей, фрагментов последовательности. Различные представления. Построение поверхностей. Наложение структур. Протонирование моделей. Создание видео. Визуализация конформационных перестроек. Раскраска структуры по B-фактору и другим параметрам. Сравнение структуры с электронной плотностью. Автоматизация в виде скриптов.
Описание и протокол семинара.
Самостоятельная работа 2 см. описание семинара


Лекция 3 Анализ и сравнительный анализ 3D-структур. Виды визуализации структур, стерео-представление, ray-tracing. Определение вторичной структуры. Карты Рамачандрана. Поверхность доступная растворителю. Водородные связи. Карты контактов. Структурные выравнивания и среднеквадратичное отклонение. Идентификация структурных доменов. Базы данных CDD и PFAM. Структурная классификация доменов (SCOP, CATH). Идентификация полостей и сайтов связывания. Электростатический и гидрофобный потенциалы. Определение состояний протонирования. Анализ симметрии. Анализ динамики, нормальные моды. Оценка свободной энергии сворачивания. Определение мультимеров. Слайды лекции.
Семинар 3 Анализ и сравнительный анализ 3D-структур. Работа с библиотекой MDAnalysis. Расчет растояний, углов, контактов. Расчет RMSD. Стркутурное выравнивание. Работа в программе Chimera. Структурные выранивания, струкутрное выравнивание последовательностей. Добавление водородов, программа REDUCE. Добавление зарядов, PDB2PQR. Рассчет pK, PROPKA. Расчет электростатического потенциала, APBS. Поиск водородных связей. Библиотека Prody. Анализ нормальных мод. Поиск родственных структур, определение консервативных остатков, визуализация.
Протокол семинара.
Самостоятельная работа 3 см. описание семинара
Suggested reading - D. Eisenberg, The discovery of the α-helix and β-sheet, the principal structural features of proteins - J.S. Richardson, The Anatomy and Taxonomy of Protein Structure

Модуль 3. Методы молекулярной механики и динамики (4 недели).

Лекция 4 Теоретические основы методов молекулярной механики и динамики. Задание моделей молекул. Молекулярно-механические модели, границы применимости. Основы классической механики: материальные точки, законы Ньютона, силы, энергия, Гамильтониан, обобщенные переменные, координаты реакции. Методы минимизации энергии. Уравнения движения. Траектории движения частиц, фазовое пространство. Численные подходы к решению уравнений движения. Алгоритмы Эйлера, Верле, Лип-Фрог. Неустойчивость траектроий и хаос. Обратимость по времени уравнений движения. Типы взаимодействий в молекулярных системах. Понятие силового поля и топологии молекулы. Единицы длины, времени, энергии. Основные типы взаимодействий: валентные, невалентные взаимодействия, связи, валентные, торсионные, ложноторсионные углы, потенциал Леннард-Джонса, заряды. Проблема учета электростатических взаимодействий. Силовые поля класса II. Поляризуемые силовые поля. Модели воды. Неявный растворитель. Основы статистической физики: распределение Больцмана-Гиббса, понятие энтропии, второй закон термодинамики. Парадокс обратимости. Гипотеза эргодичности. Понятие термодинамического ансамбля. Понятие свободной энергии, работы. Профили свободной энергии, потенциал средней силы. Неравновесные процессы. Равенство Джарзинского. Слайды лекции.
Семинар 4 Простейшие расчеты в Python. Знакомство с программой Gromacs. Протокол семинара.
Самостоятельная работа 4 см. описание семинара
Лекция 5Алгоритмы и методы молекулярной динамики. Общая схема постановки молекулярно-динамического расчета. Подготовка, минимизация и релакасация системы. Выбор шага интегрирования. Периодические граничные условия. Радиусы обрезания. Суммы Эвальда и методы учета электростатических взаимодействий. Списки соседей. Ограничения на длины связей. Термостатирование и баростатирование системы. Броуновская динамика, динамика Ланжевена. Параллельные вычисления. Декомпозиция области. Суперкомпьютерные параллельные технологии в молекулярном моделировании. Использование графических процессоров. Слайды лекции.
Семинар 5 Подготовка и запуск МД расчетов в Gromacs Протокол семинара.
Самостоятельная работа 5 см. описание семинара
Лекция 6Дизайн и анализ молекулярно-динамических экспериментов. Выбор стартового состояния. Выбор набора систем для сравнительного моделирования. Выбор силового поля. Выбор времени моделирования и количества моделирумых систем. Методы работы с траекториями. Выход на равновесие. Иерархия динамических веремен. Анализ средних, флуктуаций, статистической достоверности. Автокорреляционные функции. Связь корреляции и диффузии. Энтальпия взаимодействия, теплоемкость. Функции радиального распределения. Анализ RMSD, d-RMSD. Кластерный анализ. Сетевой анализ. Анализ на основе марковских моделей. Добавление внешних воздействий. Примеры результатов моделирования различных систем (фолдинг белков, диффузия лигандов в белках, биомембраны, ионные каналы, ДНК-белковые комплексы). Транспортные коэффициенты. Анализ главных компонент. Методы понижения размерности. Применение нейросетей. Слайды лекции.
Семинар 6 Анализ расчетов в MDAnalysis. Протокол семинара.
Самостоятельная работа 6 см. описание семинара
Лекция 7Методы Монте-Карло. Вариации методов МД. Методы Монте-Карло. Методы марковских цепей Монте-Карло (Markov chain Monte-Carlo). Критерий Метрополиса-Хастингса. Методы улучшения возмжоностей статистических выборок (enhanced sampling techniques). Вычислительный отжиг (simulated annealing). Методы обмена репликами (Replica Exchange, Parallel tempering.). Метод зонтичной выборки (umbrella sampling, WHAM). Метод адаптивной семщающей силы (ABF, adaptive biasing force). Различные виды коллективных переменных. Метод управляемой МД (steered MD). Адиабатически смещенная МД (adiabatic bias MD). Метод метадинамики. Метод ускоренной МД (accelerated MD). Методы расчета свободной энергии. Примеры оценки термодинамических параметров и профилей свободной энергии. Огрубленное моделирование. Мультимасштабное моделирование. Слайды лекции.
Семинар 7 Using PLUMED for enhanced sampling. Протокол семинара.
Самостоятельная работа 7 см. описание семинара

Модуль 4. Предсказание и дизайн структуры белков (2 недели).

Лекция 8Методы предсказания структры белков. Моделирование по гомологии. Создание выравнивания. Оценка качества модели. Детекция фолда. Протягивание. Скрытые марковские модели. Нейросети. Физические методы моделирования и предсказания. Слайды лекции. Видеозапись.
Семинар 8 Знакомство с программой Modeller. Знакомство с программой Modeller. Построение структурных моделей по гомологии с с известными структурами. Протокол семинара.
Самостоятельная работа 8 см. описание семинара
Лекция 9. Методы дизайна структуры белков. Физические принципы организации белков. Водородные связи, гидрофобные взаимодействия, взаимодействия ароматических аминокислот. Понятие воронки фолдинга, парадокс Левинталя, расплавленная глобула. Однодоменные и многодоменные белки. Эмпирические функции свободной энергии белков. Создание мутантных белков, термостабильных белков. Предсказание влияния аминокислотных замен. De novo дизайн белков. Подходы к оптимизации структуры. Мультимасштабные подходы. Пример подходов в программе Rosetta. Примеры искусственно созданных белков. Слайды лекции.
Семинар 9 Знакомство с программой Rossetta. Протокол семинара.
Самостоятельная работа 9 см. описание семинара

Модуль 5. Докинг (1 неделя).

Лекция 10Методы докинга. Белок-лигандный докинг. Предварительный скрининг. Подготовка модели. Подходы к генерации поз. Оценочные функции. Белок-пептидный докинг. Макромолекулярный докинг. Программы (AUTODOCK, GLIDE, GOLD, HADDOCK). Слайды лекции. Видеозапись.
Семинар 10 Знакомство с программами SwissDock и AutoDock Vina Протокол семинара.
Самостоятельная работа 10 ЗДЕСЬ БУДУТ ДЕТАЛИ ЗАДАНИЯ

Модуль 6. Принципы квантовых расчетов (2 недели).

Лекция 11Основы квантово-химических расчетов. Приближение Борна-Оппенгеймера. Теория молекулярных орбиталей. Метод Хартри-Фока. Эмпирические и полуэмпирические методы. Слайды лекции. Видеозапись.
Семинар 11 Знакомство с программой NWCHEM Протокол семинара.
Самостоятельная работа 11 ЗДЕСЬ БУДУТ ДЕТАЛИ ЗАДАНИЯ
Лекция 12Различные подходы. Методы функционала плотности (DFT). Методы расчета спектральных характеристик. Моделирование химических реакций. Моделирование переноса заряда. Методы КМ/ММ. Слайды лекции. Видеозапись.
Семинар 12 Работа с программой NWCHEM Протокол семинара.
Самостоятельная работа 12 ЗДЕСЬ БУДУТ ДЕТАЛИ ЗАДАНИЯ

Assessments

Criteria

Grades