
За последние несколько лет страшных лесных пожаров, опустошивших части Европы, Австралии и западных штатов США, критически важная роль БПЛА в оказании помощи спасателям при развертывании и борьбе с очагами возгорания заслужила должное внимание. Теперь группа исследователей разрабатывает способ использования нейронных вычислений с глубоким обучением, анализирующих изображения с дронов, для автоматического обнаружения новых пожаров и выявления очагов, требующих быстрейшей реакции.
Группа профессоров Университета Пердью в Индиане объединилась с аспирантом в области компьютерных и информационных технологий Зиянгом Тангом, чтобы использовать нейронные сети и компьютеры с глубоким обучением для ускорения и усиления способов использования изображений с дронов в борьбе с пожарами. В настоящее время большинство анализов и решений, принимаемых на основе аэрофотоснимков, осуществляется людьми, просматривающими кадры, снятые над обширными горящими землями. Задача так же огромна, как и утомительна, и текущая цель — сделать ее быстрее и проще с помощью автоматизации.
Работа Танга началась с вопроса, почему все более быстрое и мощное интерпретационное и дедуктивное способности компьютеров не используются для автоматизации поиска лесных пожаров, на которые могут реагировать люди.
«Глубокое обучение добилось больших успехов в обнаружении таких объектов, как люди и транспортные средства», — сказал Танг в статье, опубликованной на новостном портале Пердью. «Но мало что было сделано, чтобы помочь компьютерам обнаруживать объекты аморфной и неправильной формы, такие как точечные пожары».
Танг и его научные партнеры приступили к работе, пытаясь использовать вычислительную мощность, которая позволяет компьютерам обнаруживать объекты, снятые дронами, с фиксированными размерами и правильными формами, и применить ее к быстро меняющимся и непредсказуемым формам пламени.
Реконструкция нейронного компьютерного анализа изображений с дронов для выявления нерегулярных, изменяющихся форм пламени
Первым шагом было введение алгоритма, который идентифицировал бы пламя, пожарных и другие факторы, участвующие в лесных пожарах, запечатленных на изображениях с дронов, и передавал бы их операторам-людям. Самой простой и непосредственной целью было сделать процесс сканирования такого большого объема видеоматериалов, снятых на таких обширных территориях, менее сложным и трудоемким за счет компьютеризации.
«Во время реального пожара существует определенный уровень организованного хаоса», — объяснил Танг. «Оператор платформы БПЛА часто наблюдает за сотнями точечных пожаров и вынужден отслеживать множество пожарных бригад и соответствующего оборудования на земле. Поскольку мы подвержены ошибкам, усталости и имеем короткий промежуток внимания, некоторые объекты могут быть упущены».
Следующая задача была направлена на преодоление двух ограничений в текущих системах обнаружения нейронных сетей. Во-первых, это изменение их зависимости от изображений с низким разрешением — обычно 600 x 400 пикселей — с обновленной адаптацией к видео 4K, которое обычно снимают дроны. В рамках этого процесса пришлось изменить методы обнаружения нейронных сетей, которые делят более крупные снимки на множество блоков одинакового размера, которые обрабатываются индивидуально в поисках каталогизированных изображений. Эта процедура не только отнимает много времени, но и несет риск упустить огонь, который не аккуратно ограничен отдельными квадрантами.
В поисках решения Танг и его команда передали в свою систему изображения контролируемого пожара с дронов в разрешении 4K. Они создали, как они полагают, первый общедоступный набор данных высокого разрешения по лесным пожарам, состоящий из 1400 аннотированных фотографий, содержащих 18 449 идентифицируемых объектов, таких как грузовики, люди, элементы ландшафта и огонь.
Они также разработали подход к автоматическому обнаружению редкого, мелкого и нерегулярно расположенного пламени лесных пожаров, основанный на принципе «от общего к частному». В отличие от анализа каждого квадранта из фотографий, который выполняли предыдущие нейронные системы, метод «от общего к частному» сканирует только блоки, содержащие интересующие изображения, такие как вероятное пламя, или участки, на которых такое изображение перекрывает два квадрата. Детали каждого из них затем гораздо быстрее передаются операторам-людям, поскольку процесс пропускает участки значительно большего набора данных 4K, которые вряд ли содержат данные о лесных пожарах.
«После извлечения объектов из изображений высокого разрешения мы увеличиваем масштаб, чтобы обнаружить мелкие объекты, и объединяем окончательные результаты обратно в исходные изображения», — сказал Танг. «Наши эксперименты показывают, что этот метод может достигать высокой точности при сохранении высоких скоростей».