1. Биоинформатика, общее представление о дисциплине 2. Информация: измерение, передача, хранение 3. Биологические базы данных (классификация и примеры) 4. Меры сходства последовательностей. Точечная матрица сходства. 5. Матрицы замен: происхождение и применение 6. Метод динамического программирования. Алгоритм Нидлмана-Вунша и его вариации 7. Экспресс-методы сравнения последовательностей. Программы FASTA и BLAST. Значимость выравнивания 8. Множественное выравнивание и алгоритмы (Clustal, Muscle). Недостатки существующих методов множественного выравнивания. 9. Методы кластеризации: UPGMA и NJ. 10. Профиль множественного выравнивания 11. Филогенетические деревья, бутстреп. Проблема переменной скорости эволюции 12. Скрытые марковские модели: основные понятия, примеры использования 13. Основные понятия теории графов. Гамильтонов обход, эйлеров обход графа. Последовательность де Брёйна 14. Секвенирование по Сэнгеру, принцип метода 15. Метод секвенирования путем синтеза с обратимой терминацией, платформа Illumina, мостиковая амплификация 16. Пиросеквенирование, принцип метода 17. Отличительные особенности методов секвенирования второго и третьего поколения 18. Сборка генома с помощью подхода OLC. Сборка с помощью графов де Брёйна 19. Влияние длины чтения и покрытия на качество сборки 20. Оценка качества сборки. Методы улучшения сборки. Методы скаффолдинга 21. Парноконцевые прочтения (Paired-end reads) - методика на примере Illumina 22. Картирование чтений. Основные понятия, связанные с картированием чтений на геном 23. Алгоритмы, используемые картировщиками: Хэш-таблица, Суффиксное дерево 24. Повторности в биологическом эксперименте. 25. Понятие случайной величины. Какое распределение имеет число ридов на ген, как случайная величина? 26. Нормализация. Какие виды нормализации применяются при анализе экспрессии генов и почему они нужны? 27. Какие параметры распределения сравнивают, чтобы узнать, изменилась ли экспрессия гена в заданном образце? 28. Если на ген А в образце 1 приходится 100 ридов, а в образце 2 - 200 ридов, значит ли это, что ген изменил экспрессию? Почему? 29. Диаграмма "vulcano plot": построение и чтение. 30. Методы для поиска периодичности в символьных последовательностях. 31. Позиционно-весовые матрицы и их использование для построения множественного выравнивания. 32. Филогенетический профиль гена. Отличие генов-ортологов от генов-паралогов. Использование филогенетического профиля гена для его аннотирования. 33. Точки разладки в генах и процессы, их создающие. 34. Сдвиг фазы триплетной периодичности гена. Как можно найти в гене потенциальный сдвиг рамки считывания?