Методология устранения дисбаланса классов наборов изображений
DOI:
https://doi.org/10.20998/2411-0558.2021.02.04Аннотация
Представлена методология решения задачи устранения дисбаланса классов в наборах данных изображений. Предлагаемая методология включает этапы извлечения фрагментов изображений, аугментацию фрагментов, извлечение признаков, дублирование объектов миноритарного класса и основанную на технологии обучения с подкреплением. В качестве меры определения несбалансированности набора данных использован показатель степени дисбаланса. Проведен эксперимент с использованием набора данных изображений лиц пациентов с высыпаниями на коже, аннотированными в соответствии со степенью тяжести акне. Рассмотрены основные шаги по реализации методологии. Результаты классификации показали целесообразность применения предложенной методологии. Точность классификации на тестовых данных составила 85 %, что на 5 % выше результата, полученного без применения предложенной методологии.
Ключевые слова: дисбаланс классов, несбалансированный набор данных, удаление фрагментов изображений, аугментация.