Методи та алгоритми виявлення об’єктів на зображеннях і у відео на основі сімейства архітектур YOLO
Автор: Саламонович Юрій Зіновійович
Кваліфікаційний рівень: магістр
Спеціальність: Інформаційні технології проектування
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2025-2026 н.р.
Мова захисту: українська
Анотація: Юрій САЛАМОНОВИЧ., к. ф.-м. наук, доцент кафедри САП Тамара КЛИМКОВИЧ (керівник). Методи та алгоритми виявлення об’єктів на основі сімейства архітектур YOLO. Магістерська кваліфікаційна робота – Національний університет «Львівська політехніка», Львів, 2025. Сучасний етап розвитку інформаційних технологій характеризується активним впровадженням інтелектуальних систем, здатних виконувати завдання, що ще донедавна вважалися виключно прерогативою людини. Одним із таких напрямів є комп’ютерний зір, що поєднує в собі методи інформатики, математики, біології та когнітивних наук. Його основна мета полягає у створенні алгоритмів та моделей, які можуть автоматично інтерпретувати візуальну інформацію, подібно до людського сприйняття. Метою магістерської роботи є дослідження нейромережевих методів комп’ютерного зору, виявлення їх переваг та обмежень, а також аналіз перспектив застосування сучасних архітектур у практичних задачах. Наукова новизна роботи полягає у системному аналізі та узагальненні сучасних нейромережевих підходів до детекції об’єктів, що охоплюють двоступеневі та одноступеневі архітектури, а також у розкритті ролі трансформерних моделей у формуванні глобального контексту при обробці зображень. У роботі вперше на концептуальному рівні порівнюються механізми вилучення ознак, регресії обмежувальних рамок і моделі уваги, що дозволяє глибше осмислити еволюцію методів комп’ютерного зору та визначити їх потенціал для підвищення точності та швидкодії алгоритмів виявлення об’єктів. Практичне значення отриманих результатів. Результати дослідження можуть бути використані для розроблення систем відеоспостереження, автономного транспорту, медичної діагностики, робототехніки та інших застосувань, де потрібне швидке й точне виявлення об’єктів. Викладені методи та аналітичні підходи можуть слугувати основою для побудови власних моделей детекції, удосконалення існуючих алгоритмів та оптимізації їх обчислювальної ефективності. Об’єкт дослідження – процеси автоматизованої інтерпретації зображень у системах комп’ютерного зору. Предмет дослідження – нейромережеві моделі детекції об’єктів, архітектури CNN і трансформерів, методи класифікації, сегментації, локалізації та аналізу ключових точок. Ключові слова: КОМП’ЮТЕРНИЙ ЗІР, ЗГОРТКОВІ НЕЙРОННІ МЕРЕЖІ, ТРАНСФОРМЕРИ, ДЕТЕКЦІЯ ОБ’ЄКТІВ, СЕГМЕНТАЦІЯ, КЛАСИФІКАЦІЯ ЗОБРАЖЕНЬ, CNN, R-CNN, YOLO, САМОУВАГА. Список використаних джерел: 1. Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press, 2016. 2. Szeliski R. Computer Vision: Algorithms and Applications. Springer, 2022. 3. Girshick R. Rich feature hierarchies for accurate object detection and semantic segmentation (R-CNN), 2014.