Текст произведения
(PDF):
Читать
Скачать
Особую актуальность в настоящее время имеет задача обеспечения необходимого уровня пожарной безопасности лесов. Существенный негативный эффект от лесных пожаров для Российской Федерации наглядно подтверждает статистика Рослесхоза [1]: с 2009 по 2018 гг. наблюдается рост площади лесных земель, пройденной лесными пожарами, в 2,89 раза (рис. 1). Рис. 1. Площадь лесных земель, пройденная пожарами, в Российской Федерации При этом необходимо отметить значительное увеличение данного показателя в 2018 г. С 2009 по 2017 гг. выявлен устойчивый умеренный рост площадей, пройденных лесными пожарами в России, на 27,92 %. В 2018 г. значение показателя составило 7 408 408,6 га, что в сравнении с 2017 г. показало рост в 2,26 раза, демонстрируя резкий скачок критерия. С 2013 по 2018 гг. рост расходов, связанных с охраной, защитой и восстановлением лесов, относящихся к лесному фонду России, составил 31,19 % (рис. 2). Рис. 2. Расходы на обеспечение охраны, защиты, воспроизводства лесов на землях лесного фонда в Российской Федерации При этом вышеуказанная динамика перечисленных показателей наблюдается на фоне снижения общего количества лесных пожаров на территории страны (с 1992 по 2018 гг. снижение на 52,97 %), что наглядно демонстрирует рис. 3. Таким образом, лесные пожары в России являются угрозой национальной безопасности страны, негативно влияя на экономику государства и на экологическую обстановку. Как выявлено в результате анализа существующих традиционных моделей прогнозирования лесного пожара (волновых, статистических и имитационных) [2], они имеют ряд существенных недостатков (ограниченную функциональность в условиях нестационарности и неопределенности, низкую точность прогноза, значительные временные и вычислительные затраты и пр.), что делает их малоприменимыми в условиях оперативного прогнозирования. Цель данной работы заключается в повышении эффективности формирования оперативного прогноза динамики развития лесного пожара в условиях нестационарности и неопределенности путем моделирования распространения пожара на базе искусственного интеллекта (Artificial Intelligence) и глубокого машинного обучения (Deep Machine Learning). Научное исследование направлено на разработку моделей распространения лесного пожара, базирующихся на ансамбле искусственных нейронных сетей в виде ациклического графа и реализующих выявление зависимостей между динамикой развития лесного пожара и характеристиками внешней и внутренней среды. Рис. 3. Число случаев лесных пожаров в Российской Федерации База визуальных данных о динамике развития лесных пожаров На начальном этапе реализации исследования выполнено обоснование необходимости использования в качестве инструментов оперативного прогнозирования динамики развития лесного пожара искусственного интеллекта и глубокого машинного обучения, что отображено в [2]. Выполнен сбор визуальных данных о динамике развития лесного пожара: о развитии пожара во времени, о факторах окружающей среды, о характере лесных насаждений (рис. 4). Рис. 4. Визуальные данные из базы данных о динамике развития лесных пожаров: о лесном пожаре (a); о характере лесных насаждений (б); о температуре воздуха (в); о скорости ветра (г); о влажности воздуха (д) [3-5] В качестве источников данных использованы 36-канальный спектрорадиометр с умеренным спектральным разрешением MODIS и 22-канальный радиометр VIIRS, просматривающие поверхность Земли для формирования набора данных, в том числе предоставляющие информацию о распространении пожара. Визуальные данные в виде карты Blue Marble, собранные MODIS и VIIRS, доступны в системе управления ресурсами FIRMS (Fire Information for Resource Management System) NASA [3]. Использованы 15-канальный спектрометр со средним спектральным разрешением MERIS (с полным разрешением FR и уменьшенным разрешением RR), 6-канальный радиометр с высоким спектральным разрешением AVHRR, система визуализации, работающая в 4-х спектральных диапазонах (синем, красном, ближнем инфракрасном и коротковолновом инфракрасном) SPOT-Vegetation на спутнике PROBA-V. Собранные данные о характере лесных насаждений доступны в виде глобальной годовой карты Land Cover Map Европейского космического агентства ESA CCI [4]. Визуальные данные о факторах окружающей среды (температуре воздуха на высоте 2 м над поверхностью земли, относительной влажности воздуха, скорости ветра на высоте 10 м над поверхностью земли) доступны в Ventusky InMeteo [5], использующей основные глобальные и региональные метеорологические модели погоды (глобальные модели ICON, GFS и GEM; региональные модели ICON, HRRR и COSMO). Визуальные данные, полученные от перечисленных выше источников, имеют один формат записи (JPEG). В настоящее время сформирован набор из более чем 26 тыс. изображений, что позволяет отнести эти визуальные данные к Big Data. В исследовании впервые выполнено построение базы визуальных данных о динамике развития лесных пожаров, основанной на собранных данных (визуальных данных о факторах окружающей среды, о развитии пожара во времени, о характере лесных насаждений) и предназначенной для их хранения и вывода в удобном для пользователя виде. При разработке базы применялись требования нормативных документов (ГОСТ 34.320-96 [6]; ГОСТ 34.321-96 [7]; ГОСТ Р ИСО/МЭК ТО 10032-2007 [8]) и правила Кодда [9]. Первоначально производилась предпроектная подготовка базы данных с использованием метода MoSCoW (MoSCoW method) [10] с последующим информационно-логическим проектированием базы методом ER (ER-method) [11]. Затем в процессе формирования базы данных был произведен анализ моделей баз данных (иерархической, сетевой, реляционной, постреляционной, объектно-ориентированной, многомерной и объектно-реляционной) с использованием методов системного анализа, результаты которого отображены в [12]. На основании требований к формируемой базе данных (большой объем данных, визуальные данные, возможность быстрого построения/модификации базы с минимальными временными и вычислительными затратами, минимальные временные и вычислительные затраты при работе с базой) предложено разработать реляционную модель базы данных о динамике лесных пожаров с использованием Access. На следующем этапе при выполнении логического проектирования базы данных информационно-логическая модель, полученная в виде ER-диаграммы, была преобразована в логическую схему базы. При этом выявлено отсутствие нереализуемых и необычных конструкций данных, определены первичные ключи и типы данных для полей таблиц базы, описаны ограничения целостности. На завершающем этапе выполнено создание прототипа базы данных с последующей отладкой, произведены подготовка данных к загрузке и загрузка данных (визуальных данных о факторах окружающей среды, о развитии пожара во времени, о характере лесных насаждений в виде гиперссылок) в базу. При тестировании работы базы данных выполнены следующие тесты: нагрузочный тест для определения производительности системы посредством анализа ее быстродействия, системный тест для проверки функционирования разработанной базы данных в целом. Особенностью разработанной базы является синтез большого количества визуальных данных из разнородных источников о параметрах среды и результатах распространения пожара в зависимости от значений факторов в единый нормализованный набор. Построенная база данных предназначена для формирования оперативного прогноза распространения лесного пожара с целью информационного обеспечения служб Федерального агентства лесного хозяйства, служб МЧС России, а также научных и образовательных учреждений. В настоящее время с целью защиты результатов интеллектуальной деятельности подана заявка на государственную регистрацию базы данных. Моделирование распространения лесного пожара при нестационарности и неопределенности посредством применения искусственных нейронных сетей В ходе исследования выполнено моделирование распространения лесных пожаров путем разработки соответствующих моделей (моделей верхового и низового пожаров), реализующих метод оперативного прогнозирования динамики развития лесного пожара. Метод оперативного прогнозирования динамики развития пожара подробно описан в [2]. Разработанный метод предназначен для анализа больших объемов визуальных данных (Big Data) из разнородных источников, интерпретации результатов выполненного анализа путем формулирования ключевых зависимостей распространения лесного пожара от факторов окружающей среды, характера лесных насаждений и типа лесных пожаров и оперативного прогнозирования динамики лесного пожара в сложных условиях (неопределенности и нестационарности). Предложенный метод оперативного прогнозирования динамики развития лесного пожара базируется на применении методологии глубокого машинного обучения в виде сверточной нейронной сети. Выбор сверточной нейронной сети обусловлен рядом ключевых особенностей, присущих данному типу сетей: необходимостью выполнения только минимальной предварительной обработки входных данных; высокой гибкостью архитектуры сети, что обеспечивает способность к самонастройке и самостоятельному выделению иерархии абстрактных признаков для выявления существенных деталей; относительной устойчивостью; возможностью распараллеливания вычислений; высокой точностью; возможностью обобщения информации за счет меньшего количества настраиваемых весов (в сравнении с персептроном). Разработанные модели, предназначенные для формирования оперативного прогноза в сложных условиях (при неопределенности и нестационарности, при дефиците времени), базируются на применении сверточных нейронных сетей (CNNs). Для построения и настройки искусственных нейронных сетей предлагается использовать построенную базу визуальных данных о динамике развития лесных пожаров. Идея функционирования сверточной нейронной сети (CNN) заключается в реализации последовательности переходов от конкретных особенностей визуальных входных данных к более абстрактным. Архитектура CNN характеризуется чередованием сверточных слоев (convolution layers) и слоев пулинга (pooling layers) (другое наименование пулинг-слоев - субдискретизирующие слои (subsampling layers)). Основным предназначением сверточных слоев сети является реализация операции свертки (convolution) с последующим формированием карты признаков (feature map). Слои пулинга сети позволяют уменьшить размерность сформированных ранее карт признаков путем выбора максимального нейрона из ряда соседних нейронов карты и замены данным нейроном всей рассматриваемой совокупности нейронов. В качестве выходного слоя нейронов в CNN используются полносвязные слои (fully connected layers), где формируется полносвязная нейронная сеть. Общая логическая модель динамики развития лесного пожара, разработанная с применением сверточных нейронных сетей, включает выполнение следующих этапов: 1. Ввод входных данных в виде изображений в формате JPEG (данных о факторах окружающей среды, а именно температуре воздуха на высоте 2 м над поверхностью земли T, относительной влажности воздуха W, скорости ветра на высоте 10 м над поверхностью земли WS; данных о характере лесных насаждений P и о развитии пожара во времени ). 2. Предобработка входных данных. 2.1. Проверка формата (рис. 5): в случае несовпадения формата изображения с требуемым (JPEG) предусмотрена конвертация изображения в указанный формат. Рис. 5. Предобработка входных данных: проверка формата 2.2. Проверка размеров входных данных (рис. 6): если размер ( и - ширина и высота изображения) меньше требуемого (400 × 400 пикселей), то изображение отбраковывается; если размер больше требуемого, то изображение обрезается до указанного размера; изображение, размер которого соответствует требуемому (400 × 400 пикселей), остается без изменений. Рис. 6. Предобработка входных данных: проверка размеров входных данных 2.3. Удаление шума (рис. 7): применен модифицированный медианный фильтр из [13]; при фильтрации цветного изображения предусмотрено извлечение красного, синего и зеленого каналов с последующим удалением шума в каждом канале по отдельности и на завершающем этапе восстановлением цветного изображения. Рис. 7. Предобработка входных данных: удаление шума 3. Распознавание объекта с использованием сверточных нейронных сетей (математическое описание сети из [14] представлено на рис. 8, где - выход, расположенный на -карте С-слоя в m, n; - позиция, где , , p - взвешенная сумма; b - смещение; Qi - набор индексов карт предыдущего слоя, связанных с картой ; - размер квадрата рецетипного поля для нейрона ; - часть настраиваемых особенностей, отвечающая за взаимодействие с q-картой предыдущего слоя; D - набор нейронов на последующей карте ( слой), связанный с нейроном в , ; - индекс карты S-слоя, где подключен с картой C-слой; - остаток для нейрона с координатами m, n в карте слоя λ; q - часть ядра настраиваемых функций, для которой получены компоненты градиента; - размер карты C-слоя; - выходное значение сети; - входные значения для нейрона . Рис. 8. Алгоритм функционирования сверточной нейронной сети 3.1. Распознавание данных о пожаре: на вход подается предобработанное цветное изображение (трехканальное изображение) разрешением 400 × 400 пикселей. Сверточная нейронная сеть для распознавания объектов на изображении (данных о лесном пожаре) содержит вход, сверточные слои, слои пулинга, полносвязные слои, выход. При этом размер ядра для каждого сверточного слоя равен 3 × 3, а в качестве функции активации применена функция ReLu(x) [15]. В слоях пулинга использован фильтр 2 × 2 с шагом 2, а в качестве метода пулинга выбран метод max-pooling. На выходе сверточной нейронной сети использован метод Object recognition. В сверточных слоях выполняется операция свертки, где на ввод подается изображение, а вывод представляет собой карту признаков. Выбор функции ReLu(x) в сверточных слоях обусловлен тем, что функция ReLu(x) устраняет проблему крайне малого градиента при больших значениях x, увеличивает разреженность значений у внутренних слоев сети для обеспечения нелинейности. Слои пулинга выполняют операцию уменьшения размера карты признаков и ориентированы на поиск более глобальных признаков в изображении. Выбор метода max-pooling в слоях пулинга обеспечивает ускорение сходимости во время обучения параметров сети. Полносвязная нейронная сеть типа персептрон используется для вывода результата распознавания объекта - лесного пожара. 3.2. Распознавание данных о факторах окружающей среды (температуры воздуха на высоте 2 м над поверхностью земли, относительной влажности воздуха, скорости ветра на высоте 10 м над поверхностью земли): содержание п. 3.2 соответствует п. 3.1, однако целью распознавания является решение задачи определения цвета фона (а не объекта, как для описанной выше сети CNN). Для решения данной задачи разрабатывается сверточная нейронная сеть, схожая с сетью из п. 3.1, однако отличительной особенностью является использование Semantic segmentation на выходе сети вместо Object recognition. Предложено выполнить построение ансамбля из 3-х сверточных нейронных сетей. Одна сеть выполняет распознавание фона для оценки температуры воздуха на высоте 2 м над поверхностью земли. 3.3. Распознавание данных о характере лесных насаждений: содержание п. 3.3 соответствует п. 3.2. 4. Прогнозирование динамики развития лесного пожара: формирование оперативного прог-ноза в условиях неопределенности и нестационарности в зависимости от влияния параметров среды. Для построения прогноза разработана сеть, сходная по структуре с сетью-автоэнкодером (рис. 9) (искусственной нейронной сетью, обеспечивающей воспроизведение на выходе входных данных) и содержащая сверточные и разверточные слои. Рис. 9. Алгоритм функционирования автоэнкодера [16] На вход сети подаются результаты распознавания из CNNs, соответствующих п. 3 (результаты распознавания данных о пожаре - п. 3.1; результаты распознавания данных о факторах окружающей среды - п. 3.2; результаты распознавания данных о характере лесных насаждений - п. 3.3). Предложенная сеть состоит из двух частей. Первая часть сети, реализующая свертку (вход, сверточные слои, слои пулинга), соответствует сети из п. 3.1. Вторая часть сети содержит разверточные слои и выход, при этом на вход разверточных слоев подаются результаты свертки из сверточных слоев. Разработанная сеть, предназначенная для прогнозирования динамики развития лесного пожара, является корневым узлом ориентированного ациклического графа - дерева сверточных нейронных сетей. Сети из п. 3.1, 3.2 и 3.3 представляют собой промежуточные узлы графа. 5. Вывод сгенерированного изображения с оперативным прогнозом в виде карты местности с выделенной областью и координатами области распространения пожара во времени. Научная новизна разработанных моделей распространения лесных пожаров заключается в построении ансамбля (дерева) сверточных нейронных сетей - ациклического графа, реализующего выявление зависимостей между динамикой развития лесного пожара и характеристиками внешней и внутренней среды. В качестве промежуточных узлов применены CNNs для распознавания объектов: сверточная нейронная сеть для распознавания данных о пожаре из цветного изображения; сверточные нейронные сети для распознавания данных о факторах окружающей среды из цветных изображений (температуры воздуха на высоте 2 м над поверхностью земли, относительной влажности воздуха, скорости ветра на высоте 10 м над поверхностью земли); сверточная нейронная сеть для распознавания данных о характере лесных насаждений. В качестве корневого узла для формирования прогноза динамики развития лесного пожара и генерирования изображения с оперативным прогнозом построена сеть сложной структуры, соединяющая сверточные и разверточные слои. Таким образом, выполнена разработка математических моделей распространения лесного пожара при нестационарности и неопределенности посредством применения элементов искусственного интеллекта - искусственных нейронных сетей. В настоящее время планируется дополнительная настройка входящих в состав моделей искусственных нейронных сетей и подача заявки на государственную регистрацию базы данных. Выводы 1. Реализован сбор визуальных данных о динамике развития лесного пожара (визуальных данных о развитии пожара во времени, о факторах окружающей среды, о характере лесных насаждений). Визуальные данные получены от разнородных источников: данные о распространении пожара - через систему управления ресурсами FIRMS NASA; данные о характере лесных насаждений - из глобальной годовой карты Land Cover Map ESA CCI; данные о факторах окружающей среды (температуре воздуха на высоте 2 м над поверхностью земли, относительной влажности воздуха, скорости ветра на высоте 10 м над поверхностью земли) - с использованием Ventusky InMeteo. В настоящее время сформирована база из более чем 26 тыс. изображений, что позволяет отнести эти визуальные данные к Big Data. 2. Построена база визуальных данных о лесных пожарах, основанная на данных о развитии пожара во времени, о факторах окружающей среды, о характере лесных насаждений и предназначенная для их хранения и вывода в удобном для пользователя виде. В процессе разработки базы использован Access. Особенностью разработанной базы визуальных данных о динамике развития лесных пожаров является синтез большого количества визуальных данных из разнородных источников о параметрах среды и результатах распространения пожара в зависимости от значений факторов в единый нормализованный набор. 3. Построены модели распространения лесного пожара при нестационарности и неопределенности посредством применения искусственных нейронных сетей. Модели реализуют метод оперативного прогнозирования динамики развития лесного пожара путем глубокого машинного обучения и предназначены для анализа визуальных данных и выявления ключевых зависимостей распространения лесного пожара от параметров среды. Описана общая логическая схема моделей распространения лесного пожара, состоящая из пяти этапов: 1 этап - ввод входных данных; 2 этап - предобработка входных данных (проверка формата, проверка размеров, удаление шума); 3 этап - распознавание объекта с использованием сверточных нейронных сетей (распознавание данных о пожаре; распознавание данных о факторах окружающей среды; распознавание данных о характере лесных насаждений); 4 этап - прогнозирование динамики развития лесного пожара; 5 этап - вывод сгенерированного изображения с оперативным прогнозом.