Описание: Вы когда-нибудь задумывались, как роботы могут ориентироваться в пространстве и выполнять свои задачи, как поисковые системы могут индексировать миллиарды изображений и видео, как алгоритмы могут диагностировать медицинские изображения на предмет заболеваний, как автомобили с автоматическим управлением могут видеть и управлять автомобилем безопасно, или как Instagram создает фильтры?
В основе этих современных приложений ИИ лежат технологии компьютерного зрения, которые могут воспринимать, понимать и реконструировать сложный визуальный мир. Computer Vision – одна из самых быстрорастущих и захватывающих дисциплин искусственного интеллекта в современной академии и промышленности. Курс предназначен для того, чтобы познакомить студентов с постановками основных задач и основополагающих принципов на примерах частей реальных кейсов. В рамках программы будут рассмотрены классические подходы Computer Vison, знание которых является неотъемлемой частью и основой Computer Vision in Deep Learning.
Содержание: Классические методы обработки изображений, решение задач: классификации, распознавания и оценки параметров движения в видеопотоке.
Что нужно знать и уметь: Python (numpy, matplotlib), машинное обучение, линейная алгебра, математический анализ, статистика.
Курс основан на материалах CS131
-
Можно взять
requirements.txt
:pip install -r requirements.txt
-
Вручную установить следующие пакеты:
Requirements |
---|
jupyter |
matplotlib |
cv2 (4.3) |
skimage |
numpy |
-
Формирование изображений. Основные понятия:
- введение в задачи компьютерного зрения;
- представление изображений в компьютере;
- работа с цветом;
- аффинные преобразования;
- знакомство с библиотеками cv2, skimage.
- домашнее задание №1.
-
Введение в обработку сигналов:
- частотная область, преобразование Фурье;
- спектральный анализ;
- свертки, фильтры;
- кросс-корреляция;
- домашнее задание №2.
-
Введение в обработку изображений:
- гистограммы изображений;
- цветовая коррекция;
- пороговое выделение;
- морфологические операции;
- пирамиды изображений;
- домашнее задание №3.
-
Глобальные признаки изображений:
- выделение границ и контурные признаки;
- матрица смежности и текстурные признаки;
- практическая работа;
- домашнее задание №4.
-
Локальные признаки изображений:
- локализация особых точек (Harris, Shi-Tomasi);
- дескрипторы особых точек (SIFT);
- домашнее задание №5.
-
- Задача сегментации;
- Иерархическая класетризация;
- Mean-Shift;
- домашнее задание №6.
-
Параметрические модели
- гистограммы ориентированных гридентов (HOG)
- RANSAC
- сопоставление изображений
-
Распознавание образов
- Постановка задачи, метрики
- HOG, Dalal-Triggs
- Deformable parts model
-
Оптический поток
- постановка задачи
- метод Лукас-Канады
- метод Horn-Schunk
-
Трекинг объектов
- постановка задачи, метрики
- Kalman filter
- SORT