Використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network для семантичної сегментації аерофотознімків
DOI:
https://doi.org/10.20998/2411-0558.2025.02.02Ключові слова:
комп’ютерний зір, нейронні мережі, глибоке навчання, U-Net, DeepLabV3 , Feature Pyramid Network (FPN), семантична сегментація, розпізнавання об’єктів, просторовий аналізАнотація
У роботі представлено дослідження ефективності використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network (FPN) для семантичної сегментації аерофотознімків. Ця задача дозволяє автоматизувати аналіз великих обсягів даних у різних сферах людської діяльності (містобудуванні, екологічного моніторингу тощо). У процесі дослідження було підготовлено власні вхідні дані та проведено навчання кожної з трьох моделей. Для оцінювання експериментальної роботи було розраховано функцію втрат, точність, індекс Жаккара, F-міру та час прогнозування одного зображення, що дозволило порівняти якість сегментації. Результати показують, що кожна модель здатна ефективно розпізнавати основні об’єкти на аерофотознімках. Модель U-Net демонструє кращу швидкість при навчанні, DeepLabV3+ навчається довше, але показує кращі показники, навіть на невеликій кількості вхідних даних, а FPN забезпечує найкращий баланс одночасно між швидкістю та якістю. Результати можуть бути використані для подальших досліджень у сфері автоматизованого аналізу зображень. Іл.: 5. Табл.: 3. Бібліогр.: 13 назв.