ИНСТИТУТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ им. Г.И. МАРЧУКА
РОССИЙСКОЙ АКАДЕМИИ НАУК

ИНСТИТУТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ
им. Г.И. МАРЧУКА РАН

ИВМ РАН

119333, г. Москва, ул. Губкина, 8.
Тел.: (495) 984‑81‑20, (495) 989‑80‑24, факс: (495) 989‑80‑23, E‑mail: director@mail.inm.ras.ru

  • English


Аспиранты ИВМ РАН Артем Медведев и Иван Бутаков заняли 2 место на хакатоне “Цифровой прорыв”

В экологических исследованиях фотоловушки широко используются для наблюдения за дикой природой, снимая тысячи изображений. Однако многие из этих снимков оказываются пустыми или непригодными для анализа, поскольку животные на них не попали в кадр полностью или их перекрывают другие объекты. Обработка такого объема данных вручную становится долгим и трудоемким процессом, что ограничивает эффективность анализа и уменьшает его точность. Задача требует решения, способного автоматически отбирать качественные фотографии, на которых животные полностью видны и подходят для детального анализа.

Участникам предлагается разработать инструмент, способный обрабатывать множество изображений, выделяя кадры с животными и классифицируя их по степени попадания в кадр. Программа должна иметь базовый интерфейс и предоставлять отчет, где для каждой фотографии указано наличие животного, ограничивающая рамка вокруг объекта и его класс пригодности для анализа.

Описание решения команды: Команда «AAA IT» предоставила в качестве решения задачи фильтрации изображений с животными двухуровневую систему с большим уклоном на масштабируемость. Система состоит из 2 частей:

— Этап детекции с качеством, близким к 100%

— Этап классификации изображений на «вспомогательные» и «основные» с качеством выше 90% на валидации.

Сервис работает локально и не требует интернет-соединения. При этом он также может быть развернут на локальном сервере и распределен между научной группой исследователей. Основные компоненты решения:

— База данных для асинхронно поступающих запросов

— Очередь запросов, выдерживающая увеличенную нагрузку и гарантирующая сохранность данных

— Тритон-инференс, позволяющий параллельно и с высокой скоростью обрабатывать большие запросы поступающих изображенний от нескольких людей

— Веб-интерфейс, позволяющий получать полноценный отчет по изображениям, формировать PDF отчет и визуализировать прогнозы.

В качестве бейзлайн-модели мы использовали YOLO-v9c. Начальные веса были инициализированы через модель MegaDetectroV6, которая обучалась на детекцию животных. После этого, модель дополнительно дообучалась на датасете кейсодержателя.

Сайт хакатона: Главная
Гитхаб с решением: Donskoy-Andrey/animals-hack: Animals Detection Hackaton – Autumn 2024


    Добавить комментарий