Використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network для семантичної сегментації аерофотознімків

Автор(и)

  • Віталій Власенко Національний технічний університет "Харківський політехнічний інститут", Україна https://orcid.org/0009-0008-6951-8496

DOI:

https://doi.org/10.20998/2411-0558.2025.02.02

Ключові слова:

комп’ютерний зір, нейронні мережі, глибоке навчання, U-Net, DeepLabV3 , Feature Pyramid Network (FPN), семантична сегментація, розпізнавання об’єктів, просторовий аналіз

Анотація

У роботі представлено дослідження ефективності використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network (FPN) для семантичної сегментації аерофотознімків. Ця задача дозволяє автоматизувати аналіз великих обсягів даних у різних сферах людської діяльності (містобудуванні, екологічного моніторингу тощо). У процесі дослідження було підготовлено власні вхідні дані та проведено навчання кожної з трьох моделей. Для оцінювання експериментальної роботи було розраховано функцію втрат, точність, індекс Жаккара, F-міру та час прогнозування одного зображення, що дозволило порівняти якість сегментації. Результати показують, що кожна модель здатна ефективно розпізнавати основні об’єкти на аерофотознімках. Модель U-Net демонструє кращу швидкість при навчанні, DeepLabV3+ навчається довше, але показує кращі показники, навіть на невеликій кількості вхідних даних, а FPN забезпечує найкращий баланс одночасно між швидкістю та якістю. Результати можуть бути використані для подальших досліджень у сфері автоматизованого аналізу зображень. Іл.: 5. Табл.: 3. Бібліогр.: 13 назв.

##submission.downloads##

Опубліковано

2025-07-11