Текст произведения
(PDF):
Читать
Скачать
Введение В связи с развитием морских грузоперевозок в Арктической зоне России и субарктическом поясе Дальнего Востока России стремительно увеличивается спрос на морские грузоперевозки в данном регионе. Правительство Российской Федерации считает приоритетным развитие данного региона и Северного морского пути в целом. Увеличение морских грузоперевозок обязывает к повышению эффективности их организации в арктических условиях [1, 2]. Анализ существующих программных средств и информационных ресурсов в сфере организации морских грузоперевозок в Арктической зоне и субарктическом поясе России подтвердил необходимость разработки интеллектуальной информационной транспортно-логистической системы управления, способной оптимизировать логистические операции [3]. Для реализации интеллектуальной информационной транспортно-логистической системы управления морскими грузоперевозками сформирована на базе модели нечёткого вывода типа Мамдани и реализована посредством Fuzzy Logic Toolbox математического пакета MATLAB база правил нечётких продукций [4]. В базе правил нечётких продукций выделены и сформированы термы лингвистических переменных, которые служат для формирования входных параметров. Термы лингвистических переменных: «Период»; «Судно»; «Маршрут»; «Торосистость»; «Сплоченность льда»; «Возраст льда»; «Форма льда»; «Сжатие»; «Заснеженность». Для проверки адекватности модели типа Мамдани необходимо: - сформировать выборку из натурных данных на основе рейсовых отчётов капитана; - провести множественный регрессионный анализ для построения прогнозной модели; - проверить адекватность настроенной/обученной модели нечёткого вывода типа Мамдани. Методы и результаты исследования В работе проводится анализ рейсовых отчётов капитанов судов ледового класса, данные которых стали основой для настройки модели нечёткого вывода типа Мамдани. Маршрут включает следующие порты: Магадан, Петропавловск-Камчатский, Анадырь, Провидения, Певек. Данный маршрут был выбран не случайно, т. к. навигационная обстановка (в том числе ледовая) данного региона хорошо исследована и имеет достаточно данных для настройки модели. Настройка нечёткой модели типа Мамдани состояла в определении таких векторов чтобы среднеквадратичная ошибка (Root Mean Square Error, RMS Error, RMSE) стремилась к минимуму [5]: где P - вектор параметров функций принадлежности термов входных и выходной переменных; W - вектор весовых коэффициентов правил базы знаний; - функция, определяющая результат вывода по нечёткой базе знаний Мамдани с параметрами при значении входов Xr; M - объём выборки. Параметры настройки нечёткой модели состоят: - из весовых коэффициентов правил базы знаний; - координат максимумов функций принадлежностей термов входных переменных и максимумов функций принадлежностей некрайних термов выходных переменных; - коэффициентов концентраций функций принадлежностей термов входных и выходной переменных. Настроенная нечёткая модель адекватно отражает поведение идентифицируемой зависимости, что подтверждает и малое значение RMSE = 3,190. На высокоуровневом языке программирования MATLAB с помощью интерактивного инструмента GUIDE реализована программа, демонстрирующая работу нечёткого вывода типа Мамдани. На рис. 1 представлен интерфейс ввода данных интеллектуальной системы для расчёта эффективности организации морских грузоперевозок в арктических условиях. Данная программа реализует работу нечёткого вывода типа Мамдани и позволяет рассчитать стоимость затрат на маршрут и количество дней в пути. Для проверки адекватности модели нечёткого вывода типа Мамдани сформирована выборка из рейсовых отчётов капитанов (например, отчётов капитанов ледоколов «Магадан», «Адмирал Макаров», «Красин»). Рейсовые отчёты капитанов содержат информацию о навигационной обстановке на маршруте следования, что позволяет сформировать выборку. На основе анализа данных различных рейсовых отчётов капитанов сформирована выборка, состоящая из информации о реальных условиях плавания (фрагмент данных представлен в табл. 1). Рис. 1. Визуализация нечёткого вывода типа Мамдани Таблица 1 Выборка натурных данных Период Возраст льда, см Торосистость, баллы Сплоченность льда, баллы Форма льда, м Сжатие, баллы Заснеженность, баллы Судно, класс Средняя скорость, уз Маршрут Дни в пути 2 10-15 0 2-6 2-20 1-2 0 LL4 7,6 3 5 2 15-30 2 10 2-20 0 0 LL4 7,9 3 8 2 15-30 1 2-3 2-20 1-2 3 Icebreaker 3 5 24 - 10-15 0 5-6 2-20 0 0 L2 9 4 3 1 15-30 0 8-10 20-100 1 0 L2 5,7 4 12 1 15-30 0 6-7 0 0 0 L2 7,25 4 3 Данные выборки послужили входными параметрами для проверки адекватности модели (фрагмент результата представлен в табл. 2). Таблица 2 Данные проверки модели типа Мамдани № выборки Количество дней в пути согласно рейсовому отчёту капитана Количество дней в пути согласно результатам модели Мамдани % отклонения результата модели от натурных данных 1 5 4,85 3,00 2 24 24,32 -1,33 3 8 7,68 4,00 4 10 10,12 -1,20 5 5 5,05 -1,00 6 14 14,01 -0,07 7 3 3,26 -8,67 8 12 12,15 -1,25 9 18 17,95 0,28 10 2 1,68 2,00 Анализ данных проверки модели доказал, что количество дней в пути согласно рейсовым отчётам капитана и результатам работы программы приблизительно равны, что подтверждает адекватность настроенной модели типа Мамдани (наибольшая ошибка - 8,67 %). Были проанализированы также рейсовые отчёты капитанов другого региона плавания, например судна «Василий Головнин», для проверки возможности применения данной модели в другом регионе плавания (фрагмент данных представлен в табл. 3). Таблица 3 Выборка натурных данных другого региона плавания Маршрут Период Судно Скорость, уз Возраст льда Сплоченность льда, баллы Форма льда, м Дни в пути О-в Греэм-Белл - о-в Хейса сентябрь- октябрь ULA 8 Однолетний 2 2-20 (мелкобитый лёд) 5 Данные для проверочной выборки сформированы из отчётов капитана другой Арктической зоны России, также результаты работы программы приближенно равны, что позволяет утверждать о возможности использования данной модели при прогнозировании арктического плавания в любом регионе Арктики и субарктической области (наибольшая ошибка - 4,07 %). В работе ставилась задача провести сравнительный анализ результатов моделирования настроенной модели типа Мамдани с прогнозной регрессионной моделью. Множественный регрессионный анализ позволяет: - выявить факторы, действующие на отклик; - ранжировать факторы по степени влияния на отклик; - спрогнозировать значения отклика при различных факторах. Поскольку выходная переменная «Дни в пути» зависит от нескольких факторов, то регрессионная модель определяется уравнением множественной регрессии [6]: где b - параметр регрессии; xn - факторы; Y - отклик; e - вектор случайных ошибок наблюдений. Исходные данные для регрессионного анализа представляют собой результаты наблюдений зависимой переменной «Дни в пути» и факторов («Период»; «Судно»; «Маршрут»; «Торосистость»; «Сплоченность льда»; «Возраст льда»; «Форма льда»; «Сжатие»; «Заснеженность») и записываются в виде таблицы. Для формирования таблицы для множественного регрессионного анализа использованы данные (см. табл. 1). Для множественной регрессии использовали программное обеспечение STATISTICA. Ниже представлены результаты регрессии. После построения корреляционной матрицы и общего обзора описательных статистик для определения корреляции между факторами и дальнейшего исключения мультиколлинеарных факторов, проанализировав матрицу, пришли к выводу, что мультиколлинеарные факторы не обнаружены. Построив таблицы с уровнями значимости, мы получили следующие результаты: - зависимая переменная «Дни в пути», число наблюдений - 45; - коэффициент множественной корреляции R = 0,791387, коэффициент детерминации R2 = 0,62629377, скорректированный R2 = 0,598949; - среднее квадратическое отклонение ошибки наблюдений равно 3,3114644; - оценка свободы члена регрессии равна 23,7555234; - стандартная ошибка оценки, значение свободного члена равно 2,719798; - значение t-статистики для проверки гипотезы о равенстве свободного члена равно нулю, соответствующий уровень значимости p: t(34) = 8,7343, p = 0,000000; - значение F-статистики для проверки гипотезы H0: F = 22,90395, степени свободы распределения Фишера df = 3,41, уровень значимости p = 0,0000, соответствующий значению F-статистики. Согласно рис. 2 значение коэффициента детерминации R2 близко к 1, а p-значение меньше 0,05. Таким образом, модель регрессии признаётся значимой и очень хорошо объясняет дисперсию переменной «Дни в пути». Рис. 2. Итоговые статистики В столбце «t(35)» (рис. 3) стоят значения статистики Стьюдента для проверки гипотезы о равенстве нулю соответствующего коэффициента, а в столбце «р-value» (р-значение) - соответствующие уровни значимости отклонения этой гипотезы. Рис. 3. Итоговая таблица регрессии Удалили последовательно факторы, уровень значимости которых меньше 0,05, каждый раз перестраивая модель. Провели анализ остатков по двум критериям: - остатки должны быть нормально распределены; - остатки не зависят от предсказанных по уравнению регрессии значений отклика. Построив гистограмму остатков (рис. 4), приходим к выводу, что распределение симметричное и гипотеза о нормальности не отклоняется. Рис. 4. Гистограмма остатков Нормально вероятностный график остатков (рис. 5) систематических отклонений фактических данных от теоретической нормальной прямой не наблюдается, а значит, остатки распределены нормально. Рис. 5. Нормально вероятностный график остатков Наличие или отсутствие зависимости остатков от предсказанных значений демонстрирует диаграмма рассеивания (рис. 6), точки не имеют системности расположения, соответственно, остатки не зависят от предсказанных значений. Рис. 6. Предсказанные значения и остатки Анализ остатков удовлетворил оба критерия - свидетельствует, что модель предварительно достаточно хорошая. Оценка приемлемости модели в целом подтвердила, что уровень значимости меньше, чем 0,05, поэтому можем утверждать, что данная модель приемлема и будет работать лучше, чем наивный прогноз по средним значениям (рис. 7). Рис. 7. Приемлемость модели Предсказанное значение - 18,42, а фактическое - 21,86, отклонение составляет 15,73 % (рис. 8). Рис. 8. Проверка построения прогноза Проверим построенную регрессионную модель на данных (см. табл. 2) и сравним с результатами настроенной модели типа Мамдани и реальных данных (табл. 4). Таблица 4 Данные проверки двух моделей № выборки Количество дней в пути согласно рейсовому отчёту капитана Количество дней в пути согласно результатам модели Мамдани % отклонения результата модели типа Мамдани от натурных данных Количество дней в пути согласно регрессионной модели % отклонения результата регрессионной модели от натурных данных 1 5 4,85 3,00 10 -100,00 2 24 24,32 -1,33 14,81 38,29 3 8 7,68 4,00 1,99 75,13 4 10 10,12 -1,20 12,7 -27,00 5 5 5,05 -1,00 3,13242 37,35 6 14 14,01 -0,07 16,74524 -19,61 7 3 3,26 -8,67 4,097 -36,57 8 12 12,15 -1,25 12,70846 -5,90 9 18 17,95 0,28 20,35884 -13,10 10 2 1,96 2,00 3,12957 -56,48 Анализ данных табл. 4 доказал, что результаты модели типа Мамдани точнее, чем результаты регрессионной модели. Поэтому целесообразно использовать в дальнейшей работе модель типа Мамдани, т. к. она приводит не только более точный результат, но и учитывает все факторы. Консультации с экспертами в данной области подтвердили важность всех факторов при ледовом плавании. Модель типа Мамдани относится к нейросетевым технологиям, инвариантна к размерности задачи и способна накапливать информацию и обучаться на натурных данных, что делает её наиболее приемлемой для дальнейшего использования в качестве основного компонента интеллектуальной системы для расчёта эффективности организации морских грузоперевозок в арктических условиях. Заключение Настроенная модель типа Мамдани с оптимальными функциями принадлежности и весами доказала работоспособность сформированной структуры исходной модели нечёткого вывода типа Мамдани и базы правил нечётких продукций, что подтвердило правильность подхода выбора вектора навигационных параметров и их интерпретации в базе правил. Проверка адекватности модели типа Мамдани на данных, сформированных на базе рейсовых отчётов капитанов, подтвердила возможность использования данной модели в любом Арктическом регионе и регионах субарктического пояса России. Проведённый множественный регрессионный анализ определил необходимость использования большого количества входных переменных и невозможность исключения ни одного из них в связи с высокой вероятностью получения неточного результата.