Россия
Россия
Россия
Изложены цели и перспективы краткосрочного и долгосрочного прогнозирования трафика данных в сетях 5G. Представлен обзор актуальных методов прогнозирования трафика. Большое количество работ свидетельствует о множестве подходов к анализу и прогнозированию мобильного трафика. Эти подходы включают как традиционные статистические методы, так и методы глубокого обучения, что является важным фактором для развития сетевых технологий и оптимизации сетей радиодоступа. Прогнозирование и управление играют большую роль как на уровне всей сети 5G, так и на уровне отдельных ее компонентов. С увеличением объема больших данных прогнозирование трафика становится сложной задачей из-за мобильности и различного поведения пользователей. В связи с этим обстоятельством на примере данных мобильного трафика систем видеоконференций Google Meet, MS Teams и Zoom проанализированы особенности этого вида трафика и сделан вывод о том, что распределение интервалов времени между поступлением пакетов соответствует α-стабильному распределению. По результатам изучения некоторых методов машинного обучения, предназначенных для прогнозирования временных рядов, был выполнен сравнительный анализ эффективности этих методов для краткосрочного прогнозирования интенсивности трафика. Для анализа и прогноза были использованы следующие модели: наивная сезонная, экспоненциальное сглаживание, линейная регрессия, ARIMA, Theta и NBEATS. Установлено, что для трафика Google Meet наилучшие показатели качества обеспечивает линейная регрессия, для MS Teams лучшие показатели качества показывает метод экспоненциального сглаживания, а для Zoom лучшие показатели у метода Theta.
телекоммуникационные системы, анализ трафика, модели прогнозирования, QoS, искусственный интеллект, линейная регрессия, Theta, экспоненциальное сглаживание
Введение
Часть современного мобильного трафика в мире все еще поддерживается сетями 4G, однако в ближайшем будущем ситуация изменится – количество абонентов сетей 4G и 5G станет сопоставимым. Прогнозируется [1], что к 2027 г. с помощью технологии 5G будет обслуживаться большинство мобильных абонентов. Сеть 5G способна обеспечить более высокую пропускную способность, меньшую временную задержку и большую надежность связи по сравнению с предыдущими поколениями, такими как 4G (LTE). Основными преимуществами технологии 5G являются:
– высокая пропускная способность. 5G предоставляет гораздо большую пропускную способность данных, что позволяет еще быстрее передавать и получать информацию;
– низкая временная задержка. Одним из ключевых преимуществ 5G является снижение задержки при передаче данных, что особенно важно для приложений с высокими требованиями к откликам в реальном времени, такими как игры, виртуальная реальность и транспортные системы;
– поддержка большого количества устройств. 5G спроектирована для обслуживания миллионов подключенных устройств на квадратный километр, что актуально для интернета вещей (IoT);
– улучшенная энергоэффективность. Стандарт 5G также стремится к улучшенной энергоэффективности, что важно для поддержки разнообразных устройств и приложений;
– новые частотные диапазоны. 5G использует дополнительные частотные диапазоны, включая частоты миллиметрового диапазона, что позволяет достичь высоких скоростей передачи данных.
Прогнозирование телекоммуникационного трафика в системах 5G играет ключевую роль в обеспечении эффективного функционирования сети, обеспечении качественного обслуживания и удовлетворении потребностей пользователей.
Прогнозирование – это статистический метод, используемый для извлечения более релевантной информации из большого объема данных и предсказания будущих результатов путем сбора и анализа текущих и прошлых событий. Прогнозирование и управление играют большую роль как на уровне всей сети 5G, так и на уровне отдельных ее компонентов. С увеличением объема больших данных прогнозирование трафика становится сложной задачей из-за мобильности и различного поведения пользователей. Необходимо учесть, что растет уровень сложности абонентских устройств за счет увеличения их вычислительной мощности, внедрения новых мобильных сервисов и приложений и самих операционных систем. В такой сложной гетерогенной экосистеме для управления мобильной сетью важно опознавать шаблоны трафика определенных приложений, прогнозировать параметры трафика и выделять необходимые ресурсы сети. В статье [2] предлагается система управления приоритетами, которая в периоды перегрузки отдает предпочтение трафику, чувствительному ко времени, а нечувствительному ко времени фоновому трафику позволяет эффективно использовать любую свободную мощность. Прогнозирование телекоммуникационного трафика в системах 5G является важной практикой по нескольким причинам:
– оптимизация ресурсов. Предсказание трафика позволяет операторам сети эффективно распределять и оптимизировать ресурсы, такие как частотные полосы, пропускная способность и вычислительные мощности. Это важно для обеспечения качественного обслуживания пользователя и эффективного использования инфраструктуры;
– управление сетью. Прогнозирование трафика помогает операторам сети лучше понимать динамику использования сети. Это, в свою очередь, облегчает управление сетью, адаптацию к изменениям в запросах пользователя и предотвращение возможных проблем с производительностью;
– обеспечение качества обслуживания (QoS). Зная ожидаемый объем трафика, операторы сети могут принимать меры для поддержания высокого уровня качества обслуживания. Это включает в себя оптимизацию параметров сети, выделение ресурсов для областей с повышенным трафиком и принятие мер по предотвращению перегрузок;
– планирование емкости сети. Прогнозирование трафика необходимо для планирования емкости сети. Это позволяет операторам сети строить и модернизировать инфраструктуру, чтобы соответствовать ожидаемому росту трафика и обеспечивать высокую производительность сети;
– эффективное использование ресурсов спектра. Системы 5G используют различные частотные диапазоны, и прогнозирование трафика помогает эффективно управлять этими частотными ресурсами, учитывая специфику каждого диапазона и оптимизируя их использование.
Таким образом, прогнозирование трафика сотовой сети позволяет обеспечить хорошее качество услуг и играет важную роль в оптимизации, проектировании и управлении телекоммуникационными сетями. В настоящее время исследование прогнозирования трафика 5G и долгосрочного развития 4G (LTE) имеет важное значение для повышения качества обслуживания при передаче мультимедиа. Кроме того, прогнозирование трафика мобильных данных полезно для прогнозирования планирования городских районов и выбора места расположения базовой станции.
Прогнозирование трафика можно разделить на два класса прогнозов: краткосрочный и долгосрочный. Долгосрочное и краткосрочное прогнозирование трафика представляют собой два различных метода предсказания объема трафика в телекоммуникационных сетях на разные временные периоды. Использование обоих типов прогнозирования важно для обеспечения эффективного управления сетью и развития телекоммуникационных систем в целом. Выделим основные различия между краткосрочным и долгосрочным прогнозированием трафика.
Краткосрочное прогнозирование ориентировано на предсказание трафика на коротких временных интервалах. Долгосрочное прогнозирование осуществляется на более длительные периоды – на несколько месяцев, лет или даже десятилетий, используется для планирования долгосрочных стратегий развития сети и создания моделей сетевого трафика.
По детализации данных, краткосрочное прогнозирование часто требует более высокой детализации данных, т. к. фокусируется на быстрых изменениях и пиковых нагрузках в сети. Долгосрочное прогнозирование обычно менее детализировано, т. к. ориентировано на общие тенденции и долгосрочные паттерны использования.
Что касается методов прогнозирования, краткосрочное прогнозирование использует такие методы, как временные ряды, статистические модели и методы машинного обучения для учета краткосрочных изменений и пиков трафика. Долгосрочное прогнозирование может включать в себя экономические модели, модели роста населения, стратегии развития технологий и другие для учета фундаментальных трендов и изменений в инфраструктуре.
С точки зрения цели использования краткосрочное прогнозирование предназначено для оперативного управления сетью, оптимизации ресурсов, предотвращения перегрузок и обеспечения качества обслуживания в ближайшей перспективе. Долгосрочное прогнозирование направлено на стратегическое планирование, разработку долгосрочных инвестиционных проектов и развитие сети, а также на принятие решений по обновлению технологий.
Перспективным направлением прогнозирования трафика сетей 5G является применение методов искусственного интеллекта. Технологии искусственного интеллекта не только сократят ручное вмешательство в управление сетевым трафиком, но и позволят обеспечить более высокую производительность сети, более высокую надежность и более адаптивные системы за счет извлечения новой информации из сетей и прогнозирования условий сетевого трафика и поведения пользователей, что позволит принимать более разумные решения при минимальном участии человека.
Целью данного исследования является рассмотрение особенностей трафика 5G и его краткосрочное прогнозирование, а также анализ эффективности различных моделей прогнозирования интенсивности трафика, основывающихся на методах машинного обучения.
Особенности трафика телекоммуникационных систем
Мобильный трафик данных в сотовых сетях обладает следующими свойствами:
– высокой изменчивостью и нестационарностью трафика на длительных промежутках времени;
– тяжелыми хвостами распределения трафика, что указывает на наличие экстремальных событий и волатильности параметров трафика;
– сезонностью и зависимостью от времени суток, дня недели, праздников и других факторов;
– различиями в поведении трафика между различными географическими областями и типами событий (например, спортивные мероприятия, концерты и пр.).
В исследовании [3] показано, что мобильный трафик довольно хорошо представляется α-стабилmными моделями.
Альфа-стабильные модели – это класс вероятностных распределений, которые обладают свойством устойчивости относительно суммирования большого числа случайных величин. Это означает, что сумма α-стабильных случайных величин (при определенных условиях) имеет ту же самую форму распределения, что и исходные случайные величины. Эти модели широко используются для моделирования тяжелых хвостов и экстремальных событий, которые часто встречаются в современных телекоммуникационных сетях. Они обладают гибкостью и могут описывать различные статистические свойства данных, что делает их полезными инструментами для анализа и моделирования телекоммуникационных систем.
Случайная величина X имеет α-стабильное распределение, если существуют параметры 0 < α ≤ 2; −1 ≤ β ≤ 1; σ > 0; µ ∈ R, такие, что его характеристическая функция имеет следующий вид:
В характеристической функции используются четыре параметра: α, β, σ, µ. Эти параметры определяют характеристики α-стабильного распределения:
– α – параметр, определяющий стабильность (уровень пульсации) и управляющий тяжестью хвоста распределения. Значения α < 2 указывают на более тяжелый хвост, чем нормальное распределение;
– β – параметр асимметрии. Он находится в диапазоне от −1 до 1, где 0 указывает на симметричное распределение;
– σ – параметр масштаба, который контролирует ширину распределения, аналогично стандартному отклонению в нормальном распределении;
– µ – параметр местоположения, который сдвигает распределение влево или вправо аналогично среднему значению в нормальном распределении.
Использование α-стабильных моделей обусловлено их способностью адаптироваться к разнообразным особенностям трафика в телекоммуникационных сетях, что позволяет более точно и гибко описывать и предсказывать поведение сети.
Анализ параметров трафика
В исследовании использовались наборы данных трафика 5G от крупного оператора мобильной связи в Южной Корее (SK Telecom). Трафик измерялся
в течение суток последовательно для каждого приложения на двух стационарных терминалах (Samsung Galaxy A90 5G, с модемом Qualcomm Snapdragon X50 5G с установленной программой для анализа трафика PCAPdroid) без фонового трафика. Набор данных представляет собой видеотрафик (видеоконференции Google Meet, MS Teams и Zoom), оказывающий наибольшее влияние на планирование и управление сетью 5G.
Статистические параметры данных трафика опиcываются табл. 1, где приняты следующие обозначения: mean – среднее значение, STD – стандартное отклонение, min и max – минимальное и максимальное значения, Q 25 % – 25 % перцентиль, Q 50 % – 50 % перцентиль (медиана), Q 75 % – 75 % перцентиль.
Таблица 1
Table 1
Описательные характеристики
Descriptive characteristics
Тип |
Время между поступлением пакетов, мс |
||||||
mean |
STD |
min |
max |
Q 25 % |
Q 50 % |
Q 75 % |
|
Google Meet |
2,46 |
3,74 |
0,00 |
51,83 |
0,11 |
0,30 |
3,94 |
MS Teams |
2,50 |
4,00 |
0,01 |
35,97 |
0,07 |
0,16 |
4,08 |
Zoom |
3,64 |
5,08 |
0,01 |
37,90 |
0,10 |
0,84 |
6,13 |
В табл. 1 представлены данные о времени между поступлением информационных пакетов (в миллисекундах).
По экспериментальным данным были построены графики функции плотности вероятностей (Probability Density Function, PDF) (рис. 1) и интегральные функции распределения (Cumulative Distribution Function, CDF) (рис. 2) для промежутков между поступлениями пакетов.
Для исследуемого фрейма данных интервалов времени между поступлением пакетов были выполнены тесты Колмогорова – Смирнова.
Рис. 1. PDF – функции плотности вероятностей интервалов времени между поступлением пакетов
Fig. 1. PDF of the time intervals between the receipt of packages
Рис. 2. CDF – интегральные функции распределения интервалов времени между поступлением пакетов
Fig. 2. CDF of time intervals between packet arrival
Этот статистический тест используется для определения того, соответствует ли выборка указанному распределению, и в рамках работы был использован авторами для проверки степени соответствия исследуемых фреймов данных α-стабильным моделям. Во всех трех случаях гипотеза о соответствии экспериментальных данных α-стабильным распределениям подтвердилась
Для определения параметров α-стабильных распределений была использована библиотека Scipy. Реализация стабильного распределения вероятностей в Scipy использует метод Нолана, который разбивает пространство параметров (α, β) на несколько сегментов, некоторые из которых требуют вычисления сложных интегралов. Результаты представлены в табл. 2.
Таблица 2
Table 2
Параметры α-стабильных моделей
Parameters of α-stable models
Тип |
Параметры характеристической функции |
|||
α |
β |
μ |
σ |
|
Google Meet |
1,72 |
1,0 |
1,80 |
1,93 |
MS Teams |
1,66 |
1,0 |
2,14 |
1,99 |
Zoom |
2,00 |
1,0 |
0,84 |
3,16 |
На рис. 3 показана boxplot-диаграмма количества пакетов в единицу времени.
Рис. 3. Boxplot диаграмма
Fig. 3. Boxplot diagram
Временная диаграмма количества пакетов в единицу времени представлена на рис. 4.
Рис. 4. Временная диаграмма
Fig. 4. Time diagram
В табл. 3 представлены описательные характеристики интенсивности поступления пакетов в единицу времени.
Таблица 3
Table 3
Описательные характеристики
Descriptive characteristics
Тип |
Количество пакетов в 1 мс |
||||||
Mean |
STD |
Min |
Max |
Q 25 % |
Q 50 % |
Q 75 % |
|
Google Meet |
405,05 |
60,50 |
24 |
502 |
404,0 |
418,0 |
428,0 |
MS Teams |
398,04 |
60,37 |
11 |
487 |
392,0 |
404,0 |
423,0 |
Zoom |
273,98 |
43,42 |
72 |
364 |
246,0 |
269,0 |
312,0 |
График плотности распределения количества пакетов в единицу времени (PDF) показан на рис. 5.
Рис. 5. PDF интенсивности поступления пакетов
Fig. 5. PDF of the intensity of receipt of packages
Обзор методов прогнозирования
Прогнозирование трафика является важной составляющей управления современными телекоммуникационными системами и сетями. На основе подобных прогнозов своевременно выделяются и резервируются ресурсы оборудования, необходимые для поддержания надлежащего качества оказания услуг.
В исследовании [4], проведенным G. Aceto и кол-
легами, произведен анализ трафика мобильных приложений, который представлен общедоступным набором данных MIRAGE-2019. Для адаптации к данному контексту авторы применили два метода коррелированного моделирования, ориентируясь на знакомый методологический инструментарий марковских методов, таких как методы скрытых марковских цепей и цепей Маркова.
В работе [5] был использован метод анализа данных с целью поддержки сетевых операторов в повышении эффективности использования ресурсов.
В [6] Q. T. Tran и соавторы предложили метод экспоненциального сглаживания (Exponential Smoothing Method) для анализа трафика в сотовых сетях, в то время как N. Sapankevych и R. Sankar [7] воспользовались линейной регрессией (LR) для предсказания трафика сотовых сетей.
Анализ временных рядов сотового трафика представляет собой задачу, основанную на использовании линейных статистических моделей для прогнозирования его производительности. Среди таких моделей широко применяются авторегрессивная интегрированная скользящая средняя (ARIMA) [8], модель FARIMA [9] и альфа-стабильная модель [10].
ARIMA, представляющая собой комбинацию авторегрессии, интеграции и скользящей средней, учитывает автокорреляцию и тренды в данных, что делает ее полезной для моделирования временных рядов сотового трафика. FARIMA охватывает более широкий класс временных рядов с учетом долгосрочной зависимости и тяжелых хвостов распределения. Важно отметить, что в контексте анализа сотового трафика также привлекает внимание альфа-стабильная модель. Эта модель обладает способностью описывать тяжелые хвосты распределения данных, что делает ее ценным инструментом для учета редких, но важных событий в сотовых сетях. Такой подход позволяет более точно моделировать экстремальные значения трафика, что может быть критично для эффективного управления и планирования сотовых сетей.
Во многих исследованиях акцент был сделан на анализе динамических характеристик беспроводного трафика, таких как нестационарность и сезонность, путем применения интегрированных моделей авторегрессии скользящего среднего. Авторы, например в работе [11], представляют стратегии, направленные на оптимизацию качества обслуживания (QoS) абонентов телекоммуникационной системой. В данном исследовании модель ARIMA была использована для периодических прогнозов трафика мобильной широкополосной связи (eMBB). Система QoS, предварительно резервируя каналы для прогнозируемых потоков eMBB, стремится максимизировать общий объем трафика, обеспечивая тем самым оптимальную скорость передачи данных от источников до пунктов назначения.
Дополнительно в работе [12] поднимается вопрос прогнозирования трафика мобильных сетей, основанного на анализе реальных данных, собранных China Mobile Communications Corporation (CMCC). В этом контексте предлагается применение сезонных моделей ARIMA для точного прогнозирования трафика мобильной связи. Результаты экспериментов и испытаний подтвердили значительную эффективность данного подхода, что подчеркивает его перспективность в области прогнозирования и управления трафиком в мобильных сетях.
Исследование, представленное в работе [13], нацелено на сравнение эффективности двух моделей временных рядов, а именно ARIMA и K-средних, в контексте прогнозирования нагрузки облачной инфраструктуры.
В области прогнозирования временных рядов для трафика существует много работ, посвященных моделям глубокого обучения, включая рекуррентные нейронные сети (RNN), в том числе долгосрочную краткосрочную память (LSTM) и сверточные нейронные сети (CNN). Научные труды, такие как [14], представляют несколько моделей на основе RNN, используя унифицированный многозадачный метод обучения для улучшения прогнозирования трафика, взаимосвязанного пространственно-временными корреляциями между базовыми станциями.
В свою очередь, рекуррентная нейронная сеть Джордана (Jordan RNN), предложенная S. A. Abdulkarim и I. A. Lawal в работе [15], внедрена для прогнозирования сотового трафика данных с минимальной ошибкой. В другой работе, а именно [16], C. Zhang и коллеги представляют подход глубокого обучения для прогнозирования и моделирования нелинейной динамики беспроводного трафика с ис-
пользованием плотно связанных CNN.
Алгоритм многомерной LSTM был реализован K. Zhang и соавторами в исследовании [17] для прогнозирования сетевых трафиков с анализом данных записей подробностей вызовов (Call Detail Record, CDR). Однако в ходе анализа разработанный алгоритм не полностью удовлетворил требованиям больших объемов беспроводных данных и сложных типов данных для предсказания сетей.
В работе [18] выделяется использование способности модуля LSTM к многоэтапному прогнозированию для трафика мобильных данных. Характеристики временных рядов мобильного трафика успешно поддерживаются свойствами LSTM, способными улавливать временные тенденции данных.
В работе [19] представлен метод оптимизации облачной сети радиодоступа, основанный на глубоком обучении. Этот метод направлен на прогнозирование трафика с использованием многомерной модели LSTM и учетом временной зависимости и пространственной корреляции.
В другой работе, проведенной Alsaade и Hmoud Al-Adhaileh [20], предложен метод прогнозирования сотового трафика. Он основан на применении алгоритма долговременной краткосрочной памяти (SES-LSTM), который используется для сглаживания трафика и регулировки объема сетевого трафика.
Фокус исследования, представленного M. Chen и коллегами в [21], сосредотачивается на моделях искусственного интеллекта для управления потоками мобильного трафика. Авторы предлагают модель прогнозирования потока трафика, зависящую от алгоритма LSTM с механизмами внимания, предназначенными для обучения данных мобильного трафика в односайтовом режиме. Для сценариев с несколькими площадками они представляют интеллектуальную систему управления мобильным трафиком и прогнозирования на основе Интернета вещей, способную динамически распределять вычислительные и коммуникационные ресурсы.
Исследование, проведенное X. Wang и коллегами в [22], применяет глубокое обучение, основанное на графах, для прогнозирования трафика. Этот подход позволяет учесть пространственные зависимости и структуру графа в предсказании динамики трафика.
В работе [23] была предложена инновационная гибридная пространственно-временная сеть (HSTNet) как модель глубокого обучения (DL), основанная на использовании CNN для захвата пространственно-временных характеристик передаваемого трафика. В рамках данного исследования был применен метод деформируемой свертки с целью повышения точности прогнозирования. Основной особенностью предложенной в [23] модели является интеграция пространственных и временных атрибутов для эффективного анализа сложной структуры трафика. Использование CNN обеспечивает способность улавливать пространственные зависимости, тогда как временные атрибуты представлены в качестве вспомогательных данных, способствуя более глубокому пониманию динамических изменений в трафике.
Эти исследования свидетельствуют о множестве подходов к анализу и прогнозированию мобильного трафика, включая как традиционные статистические методы, так и передовые методы глубокого обучения, что может быть ценно для дальнейшего развития сетевых технологий и оптимизации облачных сетей радиодоступа.
Результаты краткосрочного прогнозирования
Многие модели прогнозирования (например, ARIMA) требуют стационарности временного ряда, поэтому до момента обучения моделей необходимо убедиться, что временные ряды являются стационарными. Стационарный временной ряд – это такой ряд, статистические свойства которого не зависят от времени наблюдения за этим рядом. Стационарность ряда определяется критерием Дики – Фуллера [24]. В нашем случае все три ряда являются стационарными на исследуемом промежутке времени.
Для анализа и прогноза были использованы следующие модели: наивная сезонная, экспоненциальное сглаживание, линейная регрессия, ARIMA, Theta и NBEATS. Обзор большинства моделей приведен в [25]. В качестве инструмента была использована библиотека Darts (для языка программирования Python). Она поддерживает различные подходы к прогнозированию временных рядов: от классических статистических моделей, таких как ARIMA
и экспоненциальное сглаживание, до методов, основанных на машинном и глубоком обучении. Помимо этого, библиотека Darts включает в себя функции анализа статистических свойств временных рядов, а также оценки точности моделей прогнозирования.
Наивная сезонная модель, как следует из названия, является довольно простой: она повторяет несколько последних значений временного ряда. При удачном подборе этих значений модель, несмотря на простоту, может давать неплохие результаты.
Ранее уже упоминавшееся экспоненциальное сглаживание – одна из самых популярных моделей как для сглаживания данных, так и для прогнозирования временных рядов. Этот метод был разработан Брауном и Холтом, и в его основе лежит расчет экспоненциальных скользящих средних сглаживаемого ряда.
Линейная регрессия также является одной из часто используемых моделей. Ее достоинством является относительная простота и, как следствие, хорошая скорость обработки данных и прогнозирования, зачастую это является определяющей характеристикой при использовании линейной регрессии.
Тета-метод (Theta), разработанный Ассимакопулосом и Николопулосом, находит все большее применение при прогнозировании временных рядов. Подробное описание метода представлено в работе [26], а его модификация обсуждается в работе [27]. Этот метод особенно хорошо показал себя в соревновании M3 [28] и поэтому представляет интерес для практиков-прогнозистов.
Метод NBEATS [29] относится к методам прогнозирования с использованием нейронных сетей. Архитектура нейронной сети NBEATS использует не рекуррентные, а полносвязные слои, и наиболее эффективно применяется для одномерных временных рядов.
Для оценки эффективности обучения использовались следующие показатели [30]:
– средняя абсолютная ошибка (MAE);
– квадратный корень из средней квадратичной ошибки (RMSE);
– средняя абсолютная процентная ошибка (MAPE);
– симметричная MAPE (SMAPE).
Результаты и сравнение различных методов прогнозирования представлены в табл. 4, а графики прогнозов для лучших для каждого набора данных методов – на рис. 6–8.
Таблица 4
Table 4
Метрики качества краткосрочного прогнозирования
Short-term forecasting quality metrics
Модель |
Метрика |
|||
MAE |
RMSE |
MAPE |
SMAPE |
|
Google meet |
||||
Наивная сезонная |
15,21 |
18,76 |
3,58 |
3,62 |
Exponential Smoothing |
12,58 |
15,50 |
2,95 |
2,99 |
Линейная регрессия |
10,19 |
14,23 |
2,41 |
2,41 |
Авто ARIMA |
11,53 |
15,75 |
2,69 |
2,73 |
Theta |
10,99 |
15,03 |
2,60 |
2,60 |
NBEATS |
15,40 |
20,26 |
2,70 |
3,60 |
MS Teams |
||||
Наивная сезонная |
15,82 |
20,77 |
3,99 |
3,96 |
Exponential Smoothing |
11,63 |
15,72 |
2,93 |
2,93 |
Линейная регрессия |
16,09 |
20,77 |
4,12 |
4,03 |
Авто ARIMA |
11,81 |
16,24 |
2,96 |
2,98 |
Theta |
11,86 |
16,47 |
2,98 |
2,99 |
Окончание табл. 4
Ending of table 4
Модель |
Метрика |
|||
MAE |
RMSE |
MAPE |
SMAPE |
|
NBEATS |
23,53 |
29,24 |
6,02 |
5,80 |
Zoom |
||||
Наивная сезонная |
18,44 |
25,49 |
7,82 |
7,47 |
Exponential Smoothing |
17,89 |
24,24 |
7,76 |
7,25 |
Линейная регрессия |
36,90 |
40,97 |
15,72 |
14,17 |
Авто ARIMA |
12,95 |
19,03 |
5,80 |
5,37 |
Theta |
10,78 |
16,33 |
4,73 |
4,52 |
NBEATS |
71,88 |
84,42 |
28,92 |
36,16 |
Для трафика Google Meet наилучшие показатели качества обеспечила линейная регрессия (см. табл. 4), для MS Teams лучшие показатели качества показал метод экспоненциального сглаживания, а для Zoom лучшие показатели у метода Theta.
Рис. 6. Прогнозирование Google Meet
Fig. 6. Google Meet Prediction
Рис. 7. Прогнозирование MS Teams
Fig. 7. MSTeams Prediction
Рис. 8. Прогнозирование Zoom
Fig. 8. Zoom Prediction
По результатам сравнения метрик качества обучения моделей (см. табл. 4) можно утверждать, что зачастую методы прогнозирования, имеющие небольшую вычислительную сложность, такие как линейная регрессия, могут давать приемлемые по качеству результаты краткосрочного прогнозирования.
Заключение
Прогнозирование параметров трафика [30] в современных телекоммуникационных системах играет ключевую роль в их будущем развитии и обеспечении высокого качества услуг для абонентов. Эти прогнозы не только определяют выделение ресурсов, таких как проводные и радиоканалы, полосы частот, но и влияют на автоматическую реконфигурацию оборудования в случае сбоев или внедрения новой аппаратуры связи.
Для исследуемых наборов данных линейная регрессия, экспоненциальное сглаживание и метод Theta показали наилучшие метрики качества обучения. Качество обучения моделей и прогнозирования зависит от характеристик исходного временного ряда, а также от качества и полноты данных, собранных для анализа. Заметим, что в ряде случаев относительно простые методы, такие как линейная регрессия, демонстрируют приемлемое качество краткосрочного прогноза, при этом обладая значительно более высокой скоростью работы по сравнению с более сложными и точными моделями.
1. Ericsson Mobility Report / Ericsson. SE-164 80 Stockholm, Sweden, 08/2022. P. 4. Q2 2022 Update. URL: https://www.ericsson.com/4a4be7/assets/local/reports-papers/mobility-report/documents/2022/ericsson-mobility-report-q2-2022.pdf (дата обращения: 17.02.2024).
2. Rongpeng Li, Zhifeng Zhao, Chen Qi, Honggang Zhang. Characterizing and Learning the Mobile Data Traffic in Cellular Network // 5G Networks: Fundamental Requirements, Enabling Technologies, and Operations Management. Hoboken: John Wiley & Sons, Inc., 2018. P. 453–498. DOI:https://doi.org/10.1002/9781119333142.ch12.
3. Xiaohu G., Guangxi Z., Yaoting Z. On the Testing for Alpha-Stable Distributions of Network Traffic // Computer Communications. 2004. Mar. V. 27. N. 5. P. 447–457. DOI:https://doi.org/10.1016/j.comcom.2003.10.004.
4. Aceto G., Bovenzi G., Ciuonzo D., Montieri A., Persico V., Pescapé A. Characterization and Prediction of Mobile-App Traffic Using Markov Modeling // Journal of Information and Communication Technology. 2021. V. 18. N. 1. P. 907–925. DOI:https://doi.org/10.1109/TNSM.2021.3051381.
5. Nikravesh A. Y., Ajila S. A., Lung C.-H., Ding W. Mobile Network Traffic Prediction Using MLP, MLPWD, and SVM // 2016 IEEE International Congress on Big Data (Big Data Congress). IEEE, 2016. P. 402–409. DOI:https://doi.org/10.1109/BigDataCongress.2016.63.
6. Tran Q. T., Hao L., Trinh Q. K. Cellular Network Traffic Prediction Using Exponential Smoothing Methods // Journal of Information and Communication Technology. 2018. Dec. V. 18. N. 1. P. 1–18. DOI:https://doi.org/10.32890/jict2019.18.1.1.
7. Sapankevych N. I., Sankar R. Spatiotemporal Modeling and Prediction in Cellular Networks: A Big Data Enabled Deep Learning Approach // IEEE computational intelligence magazine. 2009. V. 4. N. 2. P. 24–38. DOI:https://doi.org/10.1109/MCI.2009.932254.
8. Zhou B., He D., Sun Z., Ng W. H. Network Traffic Modeling and Prediction with ARIMA/GARCH // Proc. of HET-NETs Conference (Ilkley, UK, 09/11/2006 09/13/2006). P. 1–10. DOI:https://doi.org/10.1007/0-387-34167-6_5.
9. Cappe O., Moulines E., Pesquet J.-C., Petropulu A. P., Xueshi Yang. Long-Range Dependence and Heavy-Tail Modeling for Teletraffic Data // IEEE Signal Processing Magazine. 2002. May. V. 19. N. 3. P. 14–27. DOI:https://doi.org/10.1109/79.998079.
10. Xiaohu G., Yu S., Yoon W.-S., Kim Y.-D. A New Prediction Method of Alpha-Stable Processes for Self-Similar Traffic // IEEE Global Telecommunications Conference, 2004, GLOBECOM’04. IEEE, 2004. V. 2. P. 675–679. DOI: 10.1109/ GLOCOM.2004.1378047.
11. Guo J., Peng Y., Peng X., Chen Q., Yu J., Dai Y. Traffic Forecasting for Mobile Networks with Multiplicative Seasonal ARIMA Models // 2009 9th International Conference on Electronic Measurement & Instruments (Instruments (ICEMI)). Beijing, China: IEEE, 2009. P. 3-377–3-380. DOI:https://doi.org/10.1109/ICEMI.2009.5274287.
12. Mishra V. K., Mishra M., Tekale S., Praveena T. N., Venkatesh R., Dewangan B. K. ARIMA Time Series Model vs. K-Means Clustering for Cloud Workloads Performance // 2022 OPJU International Technology Conference on Emerging Technologies for Sustainable Development (OTCON). Raigarh, Chhattisgarh, India: IEEE, 2023. P. 1–6. DOI:https://doi.org/10.1109/OTCON56053.2023.10113979.
13. Shoorehdeli M. A., Teshnehlab M., Sedigh A. K. Training ANFIS as an Identifier with Intelligent Hybrid Stable Learning Algorithm Based on Particle Swarm Optimization and Extended Kalman Filter // Fuzzy Sets and Systems. An International Journal in Information Science and Engineering. 2009. V. 160. N. 7. P. 922–948. DOI:https://doi.org/10.1016/j.fss.2008.09.011.
14. Abdulkarim S. A., Lawal I. A. A Cooperative Neural Network Approach for Enhancing Data Traffic Prediction // Turkish Journal Of Elec Trical Engineering & Computer Sciences. 2017. V. 25. P. 4746–4756. DOI:https://doi.org/10.3906/elk1704-126.
15. Zhang C., Haixia Zhang, Dongfeng Yuan, Zhang M. Citywide Cellular Traffic Prediction Based on Densely Connected Convolutional Neural Networks // IEEE Communications Letters. 2018. Aug. V. 22. N. 8. P. 1656–1659. DOI:https://doi.org/10.1109/LCOMM.2018.2841832.
16. Zhang K., Chuai G., Gao W., Liu X., Maimaiti S., Si Z. A New Method for Traffic Forecasting in Urban Wireless Communication Network // EURASIP Journal on Wireless Communications and Networking. 2019. Dec. V. 2019. N. 1. P. 66. DOI:https://doi.org/10.1186/s13638-019-1392-6.
17. Trinh H. D., Giupponi L., Dini P. Mobile Traffic Prediction from Raw Data Using LSTM Networks // 2018 IEEE 29th Annual International Symposium on Personal, Indoor and Mobile Radio Communications (PIMRC). IEEE, 2018. P. 1827–1832. DOI:https://doi.org/10.1109/PIMRC.2018.8581000.
18. Chen L., Yang D., Zhang D., Wang C., Li J. Deep Mobile Traffic Forecast and Complementary Base Station Clustering for C-RAN Optimization // Journal of Network and Computer Applications. 2018. V. 121. P. 59–69. DOI:https://doi.org/10.1016/j.jnca.2018.07.015.
19. Alsaade F. W., Hmoud Al-Adhaileh M. Cellular Traffic Prediction Based on an Intelligent Model // Mobile information systems. 2021. V. 2021. N. 1. P. 1–15. DOI:https://doi.org/10.1155/2021/6050627.
20. Chen M., Miao Y., Gharavi H., Hu L., Humar I. In-telligent Traffic Adaptive Resource Allocation for Edge Computing-Based 5G Networks // IEEE transactions on cognitive communications and networking. 2019. V. 6. N. 2. P. 499–508. DOI:https://doi.org/10.1109/TCCN.2019.2953061.
21. Wang X., Zhou Z., Xiao F., Xing K., Yang Z., Liu Y., Peng C. Spatio-Temporal Analysis and Prediction of Cellular Traffic in Metropolis // IEEE Transactions on Mobile Computing. 2018. V. 18. N. 9. P. 2190–2202. DOI:https://doi.org/10.1109/TMC.2018.2870135.
22. Zhang D., Liu L., Xie C., Yang B., Liu Q. Citywide Cellular Traffic Prediction Based on a Hybrid Spatiotem-poral Network // Algorithms. 2020. Jan. 8. V. 13. N. 1. P. 20. DOI:https://doi.org/10.3390/a13010020.
23. Dickey D. A., Fuller W. A. Distribution of the Esti-mators for Autoregressive Time Series with a Unit Root // Journal of the American Statistical Association. 1979. V. 74. N. 366. P. 427–431. DOI:https://doi.org/10.2307/2286348.
24. Tsihrintzis G. A., Virvou M., Jain L. C. Advances in Machine Learning/Deep Learning-based Technologies // Selected Papers in Honour of Professor Nikolaos G. Bourbakis. V. 2. Cham: Springer International Publishing, 2022. DOI:https://doi.org/10.1007/978-3-030-76794-5.
25. Assimakopoulos V., Nikolopoulos K. The Theta Model: A Decomposition Approach to Forecasting // Inter-national Journal of Forecasting. 2000. Oct. V. 16. N. 4. P. 521–530. DOI:https://doi.org/10.1016/S0169-2070(00)00066-2.
26. Hyndman R. J., Billah B. Unmasking the Theta Method // International Journal of Forecasting. 2003. Apr. V. 19. N. 2. P. 287–290. DOI:https://doi.org/10.1016/S0169-2070(01)001431.
27. Makridakis S., Hibon M. The M3-Competition: Re-sults, Conclusions and Implications // International Journal of Forecasting. 2000. Oct. V. 16. N. 4. P. 451–476. DOI:https://doi.org/10.1016/S0169-2070(00)000571.
28. Oreshkin B. N. N-BEATS: Neural Basis Expansion Analysis for Interpretable Time Series Forecasting // ArXiv. 2019. DOI:https://doi.org/10.48550/arXiv.1905.10437.
29. Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. Sebastopol, CA: O’Reilly Media, Inc, 2019. 480 p.
30. Кутузов Д. В., Осовский А. В., Старов Д. В., Мальцева Н. С., Перова К. В. Анализ и прогнозирование трафика современных телекоммуникационных систем на основе методов искусственного интеллекта // Вестн. Астрахан. гос. техн. ун-та. Сер.: Управление, вычислительная техника и информатика. 2024. № 1. С. 73–87. DOIhttps://doi.org/10.24143/2072-9502-2024-1-73-87.