Molecular Modeling and Simulations for Biologists (Spring 2021)
- Instructor: Alexey K. Shaytan, PHD alex@intbio.org
- Teaching assistant:
- Slack link
Meetings and Location
- Classroom: Bioeng Dept. (Leninskie Gory 1-73), rooms 542, 543
- Lectures: 15:35-17:10
- Seminars: 17:20 - 18:55
- Online stream and recodings here
Credits
2 credits, 72 academic hours
Course Description
The course provides an overview of molecular modeling and simulations methods in biology with an emphasis on 3D modeling of biomolecular structures. Covered topics include: viewing and anlyzing PDB structures, structural bioinformatics, molecular dynamics simulations, Monte-Carlo simulations, coarse-grained modeling, molecular screening, docking, model building from experimental data, integrative modeling, quantum chemistry calculations, protein structure prediction. The course include both lectures, hands-on exercises and home assignments.
Learning objectives
- To understand:
- the principle of molecular modeling techniques in biology.
- the spectrum of molecular modeling and simulations methods and their applicability.
- the relation between the experimental data and structural models.
- To be able to:
- vizualize and analyze PDB-structure files.
- run basic MD simulations.
- do comparative protein modeling and use protein structure prediction tools.
- Run basic docking simulations.
- Run basic quantum chemistry simulations.
Textbooks and learning resources
- H.-D. Höltje et al. Molecular Modeling: Basic Principles and Applications, 3rd Edition English, Russian
- J. Gu, Ph. Bourne. Structural Bioinformatics, 2nd Edition English
- D.C. Young Computational Chemistry: A Practical Guide for Applying Techniques to Real World Problems Link
- D. Frenkel, B. Smit Understanding Molecular Simulation: From Algorithms to Applications, 2nd Edition Link
- B. Rupp “Biomolecular Crystallography: Principles, Practice, and Application to Structural Biology” Link
- J. Rigden “From Protein Structure to Function with Bioinformatics” English, Russian
- A.R. Khokhlov, A.L. Rabinovich, V.A. Ivanov. Computer modeling methods in polymer and biopolymer research. Russian only
- K.V. Shaitan, K.B. Tereshkina. Molecular dynamics simulations of proteins and peptides. Russian only
- Gromacs manual
Required resources
- Laptop or workstation with access to internet.
- Web-cam in case of distant learning.
- An account on Newton Server https://newton.bioeng.ru See instructions here.
- Pymol installed locally on your workstation/laptop.
- UCSF Chimera installed locally on your workstation/laptop.
- VMD installed locally on your workstation/laptop.
- Avogadro installed locally on your workstation/laptop.
Course calendar
- Dates: 2/8/2021; 2/15/2021 ; 3/1/2021 ; 3/15/2021 ; 3/22/2021 ; 3/29/2021 ; 4/5/2021 ; 4/12/2021 ; 4/19/2021 ; 4/26/2021 ; 5/17/2021 ; 5/24/2021
Attendance policy
- 100% attendance is required
- For every missed lecture a paper no less than 1500 words is required explaining the lecture contents.
- For every missed seminar a written protocol or a screen cast showing that the student has succesfully done all hands-on excercises is required.
Assignments policy
- Assignments are due 1 day before the next seminar.
- Assignments should be uploaded via this link in one file (doc, pdf, zip). The name of the file is as follows: Asgmt_Number_Surname_Initials. E.g. Asgmt_2_Petrov_AV.pdf
- Assignments are graded on a 100 point scale
- Late policy: 10 points are deducted for each day the assignment is late.
Course program (in Russian)
Модуль 1. Introduction and orientation (1 неделя)
Лекция 1 Вводная лекция. История и виды методов моделирования.
Понятия молекулярного моделирования, имитационного моделирования, интегративного моделирования. История развития методов молекулярной динамики, методов Монте-Карло. Подходы к созданию моделей структур по экспериментальным данным. Различные методы и границы их применимости. Понятия ab initio и in silico. Современные пакеты для молекулярного моделирования. Современные пакеты для визуализации PDB структур. Суперкомпьютеры в молекулярном моделировании.
Слайды лекции.
Запись лекции.
Семинар 1 Использование ЭВМ и доступ к ним, установка, настройка программ и сред
Использование ОС Линукс, подключение к вычислительному кластеру, SSH, X2GO, установка и компиляция программ. Использование репозиториев, GitHub. Установка и использование программ визуализации структур.
- Протокол семинара
Самостоятельная работа 1
см. протокол семинара
Required reading
- Методы молекулярного и интегративного моделирования в структурной биологии
Suggested reading
- John Kendrew and myoglobin: Protein structure determination in the 1950s
- A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits
- Metropolis, N. The Beginnig of the Monte Carlo Method
- Э.Э. Шноль. "А.Г. Гривцов и молекулярная динамика - начало"
- An Introduction to Biological NMR Spectroscopy
Модуль 2. Структурная биоинформатика (2 недели).
Лекция 2
Форматы хранения информации о структуре молекул (PDB, mmCIF, mol2, Z-матрицы и др.). Формат PDB, поля формата. Происхождение структурной информации, основные экспериментальные методы, представление данных. Элементарная ячейка кристалла, асиметричная единица, понятие BioAssembly, кристаллографическая и некристаллографическая симметрии структур. PDB: B-факторы, occupancy. PDB: специфика ЯМР структур. Правила описания белков, нуклеиновых кислот, липидов, лигандов. Тяжелоатомные и протонированные модели. Протонирование моделей. Базы данных структур. Базы PDB, NDB, MMDB, CCDC, EMDB. Поиск в базах данных, поиск по последовательности и по структуре. Форматы записи электронной плотности. Типичные проблемы в структурах, ротамеры боковых цепей. Определение качества PDB структур. Программы анализа качества структур.
Слайды лекции.
Required reading
- Introduction to PDB Data
Suggested reading
- PDB format description
Семинар 2 Визуализация 3D-структур.
Обзор различных программ (Pymol, Chimera, VMD, Maestro, CND3D, Coot). Программа Pymol. Загрузка структур. Выделение цепей, фрагментов последовательности. Различные представления. Построение поверхностей. Наложение структур. Протонирование моделей. Создание видео. Визуализация конформационных перестроек. Раскраска структуры по B-фактору и другим параметрам. Сравнение структуры с электронной плотностью. Автоматизация в виде скриптов.
Описание и протокол семинара.
Самостоятельная работа 2
см. описание семинара
Лекция 3 Анализ и сравнительный анализ 3D-структур.
Виды визуализации структур, стерео-представление, ray-tracing. Определение вторичной структуры. Карты Рамачандрана. Поверхность доступная растворителю. Водородные связи. Карты контактов. Структурные выравнивания и среднеквадратичное отклонение. Идентификация структурных доменов. Базы данных CDD и PFAM. Структурная классификация доменов (SCOP, CATH). Идентификация полостей и сайтов связывания. Электростатический и гидрофобный потенциалы. Определение состояний протонирования. Анализ симметрии. Анализ динамики, нормальные моды. Оценка свободной энергии сворачивания. Определение мультимеров.
Слайды лекции.
Семинар 3 Анализ и сравнительный анализ 3D-структур.
Работа с библиотекой MDAnalysis. Расчет растояний, углов, контактов. Расчет RMSD. Стркутурное выравнивание. Работа в программе Chimera. Структурные выранивания, струкутрное выравнивание последовательностей. Добавление водородов, программа REDUCE. Добавление зарядов, PDB2PQR. Рассчет pK, PROPKA. Расчет электростатического потенциала, APBS. Поиск водородных связей. Библиотека Prody. Анализ нормальных мод. Поиск родственных структур, определение консервативных остатков, визуализация.
Протокол семинара.
Самостоятельная работа 3
см. описание семинара
Suggested reading
- D. Eisenberg, The discovery of the α-helix and β-sheet, the principal structural features of proteins
- J.S. Richardson, The Anatomy and Taxonomy of Protein Structure
Модуль 3. Методы молекулярной механики и динамики (4 недели).
Лекция 4 Теоретические основы методов молекулярной механики и динамики. Задание моделей молекул.
Молекулярно-механические модели, границы применимости. Основы классической механики: материальные точки, законы Ньютона, силы, энергия, Гамильтониан, обобщенные переменные, координаты реакции. Методы минимизации энергии. Уравнения движения. Траектории движения частиц, фазовое пространство. Численные подходы к решению уравнений движения. Алгоритмы Эйлера, Верле, Лип-Фрог. Неустойчивость траектроий и хаос. Обратимость по времени уравнений движения. Типы взаимодействий в молекулярных системах. Понятие силового поля и топологии молекулы. Единицы длины, времени, энергии. Основные типы взаимодействий: валентные, невалентные взаимодействия, связи, валентные, торсионные, ложноторсионные углы, потенциал Леннард-Джонса, заряды. Проблема учета электростатических взаимодействий. Силовые поля класса II. Поляризуемые силовые поля. Модели воды. Неявный растворитель. Основы статистической физики: распределение Больцмана-Гиббса, понятие энтропии, второй закон термодинамики. Парадокс обратимости. Гипотеза эргодичности. Понятие термодинамического ансамбля. Понятие свободной энергии, работы. Профили свободной энергии, потенциал средней силы. Неравновесные процессы. Равенство Джарзинского.
Слайды лекции.
Семинар 4 Простейшие расчеты в Python. Знакомство с программой Gromacs.
Протокол семинара.
Самостоятельная работа 4
см. описание семинара
Лекция 5Алгоритмы и методы молекулярной динамики.
Общая схема постановки молекулярно-динамического расчета. Подготовка, минимизация и релакасация системы. Выбор шага интегрирования. Периодические граничные условия. Радиусы обрезания. Суммы Эвальда и методы учета электростатических взаимодействий. Списки соседей. Ограничения на длины связей. Термостатирование и баростатирование системы. Броуновская динамика, динамика Ланжевена. Параллельные вычисления. Декомпозиция области. Суперкомпьютерные параллельные технологии в молекулярном моделировании. Использование графических процессоров.
Слайды лекции.
Семинар 5 Подготовка и запуск МД расчетов в Gromacs
Протокол семинара.
Самостоятельная работа 5
см. описание семинара
Лекция 6Дизайн и анализ молекулярно-динамических экспериментов.
Выбор стартового состояния. Выбор набора систем для сравнительного моделирования. Выбор силового поля. Выбор времени моделирования и количества моделирумых систем. Методы работы с траекториями. Выход на равновесие. Иерархия динамических веремен. Анализ средних, флуктуаций, статистической достоверности. Автокорреляционные функции. Связь корреляции и диффузии. Энтальпия взаимодействия, теплоемкость. Функции радиального распределения. Анализ RMSD, d-RMSD. Кластерный анализ. Сетевой анализ. Анализ на основе марковских моделей. Добавление внешних воздействий. Примеры результатов моделирования различных систем (фолдинг белков, диффузия лигандов в белках, биомембраны, ионные каналы, ДНК-белковые комплексы). Транспортные коэффициенты. Анализ главных компонент. Методы понижения размерности. Применение нейросетей.
Слайды лекции.
Семинар 6 Анализ расчетов в MDAnalysis.
Протокол семинара.
Самостоятельная работа 6
см. описание семинара
Лекция 7Методы Монте-Карло. Вариации методов МД.
Методы Монте-Карло. Методы марковских цепей Монте-Карло (Markov chain Monte-Carlo). Критерий Метрополиса-Хастингса. Методы улучшения возмжоностей статистических выборок (enhanced sampling techniques). Вычислительный отжиг (simulated annealing). Методы обмена репликами (Replica Exchange, Parallel tempering.). Метод зонтичной выборки (umbrella sampling, WHAM). Метод адаптивной семщающей силы (ABF, adaptive biasing force). Различные виды коллективных переменных. Метод управляемой МД (steered MD). Адиабатически смещенная МД (adiabatic bias MD). Метод метадинамики. Метод ускоренной МД (accelerated MD). Методы расчета свободной энергии. Примеры оценки термодинамических параметров и профилей свободной энергии. Огрубленное моделирование. Мультимасштабное моделирование.
Слайды лекции.
Семинар 7 Using PLUMED for enhanced sampling.
Протокол семинара.
Самостоятельная работа 7
см. описание семинара
Модуль 4. Предсказание и дизайн структуры белков (2 недели).
Лекция 8Методы предсказания структры белков.
Моделирование по гомологии. Создание выравнивания. Оценка качества модели. Детекция фолда. Протягивание. Скрытые марковские модели. Нейросети. Физические методы моделирования и предсказания.
Слайды лекции. Видеозапись.
Семинар 8 Знакомство с программой Modeller.
Знакомство с программой Modeller. Построение структурных моделей по гомологии с с известными структурами.
Протокол семинара.
Самостоятельная работа 8
см. описание семинара
Лекция 9. Методы дизайна структуры белков.
Физические принципы организации белков. Водородные связи, гидрофобные взаимодействия, взаимодействия ароматических аминокислот. Понятие воронки фолдинга, парадокс Левинталя, расплавленная глобула. Однодоменные и многодоменные белки. Эмпирические функции свободной энергии белков. Создание мутантных белков, термостабильных белков. Предсказание влияния аминокислотных замен. De novo дизайн белков. Подходы к оптимизации структуры. Мультимасштабные подходы. Пример подходов в программе Rosetta. Примеры искусственно созданных белков.
Слайды лекции.
Семинар 9 Знакомство с программой Rossetta.
Протокол семинара.
Самостоятельная работа 9
см. описание семинара
Модуль 5. Докинг (1 неделя).
Лекция 10Методы скирининга и докинга.
Базы данных химических соединений. Виды виртуального скрининга. Фармакофоры и фармакофорный поиск. Восприятие вкуса и сапофоры. Молекулярный докинг: общая постановка задачи, определения и основные подходы. Учёт конформационной подвижности лиганда и рецептора. Генетический алгоритм и его реализация в молекулярном докинге. Межмолекулярные взаимодействия и функции оценки энергии связывания. Использование мол. докинга для аннотации функции белка. Макромолекулярный докинг - его отличия от докинга низкомолекулярных соединений. Белок-пептидный докинг и примеры его применения. Примеры программ и веб-сервисов для выполнения мол. докинга.
Слайды лекции.
Семинар 10 Знакомство с программами SwissDock и AutoDock Vina
Протокол семинара.
Самостоятельная работа 10
ЗДЕСЬ БУДУТ ДЕТАЛИ ЗАДАНИЯ
Модуль 6. Принципы квантовых расчетов (1 неделя).
Лекция 11Основы квантово-химических расчетов.
Квантовая механика. Стационарное уравнение Шредингера для электрона. Волновые функции. Орбитали атома водорода. Приближение Борна-Оппенгеймера. Спин. Фермионы и принцип Паули. Ab initio подходы. Метод Хартри-Фока. ЛКАО. Молекулярные орбитали.
Базисы и базисные функции. Методы учета корреляций электронов. Полуэмпирические методы. Теория функционала плотности (DFT). DFT функционалы и базисы. Методы расчета возбужденных состояний и спектральных характеристик. Методы расчета переноса заряда, теория Маркуса. Методы КМ/ММ. Квантовая МД. Методы расчета парциальных зарядов, заряды по Малликену, RESP. Методы расчета торсионных потенциалов. Программы![image](https://user-images.githubusercontent.com/397204/118412488-f7021c80-b6a2-11eb-8d53-11ce5b3f3b86.png)
Слайды лекции.
Семинар 11 Знакомство с программой NWCHEM
Протокол семинара.
Самостоятельная работа 11
см. описание семинара
Assessments
Criteria
- Assignments - 35%
- Mid-term quiz or exam - 30%
- Final exam - 35%
Grades
- Excellent: > 90%
- Good: 70-90%
- Stisfactory: 50%-70%
- Fail: <50%