Текст (PDF):
Читать
Скачать
Введение Экономические субъекты и экономика в целом уделяют особое внимание изучению рисков. Существуют различные способы их минимизации. Одним из таких способов является прогнозирование экономических процессов и величин. Чем точнее будет построен прогноз, тем лучше субъекты экономики подстроятся к изменениям, что существенно поможет уменьшить риски или вовсе минимизировать их. В прогнозировании нуждаются, в частности, компании металлургического комплекса России. На мировом рынке металлов наша страна занимает лидирующие позиции, что свидетельствует об актуальности задач, стоящих перед компаниями данного сектора. Зачастую необходим прогноз с большим периодом упреждения (10 шагов и более). В качестве практического подтверждения данной потребности приведём пример. Самым распространённым вариантом реализации металлов является заключение договора на поставку, которая осуществляется через 14 дней после подписания контракта; цена будет та, которая сложится на момент отгрузки. Фактически при подписании данного контракта поставщик не знает стоимость партии. Так возникает задача прогнозирования с периодом упреждения, превышающим 10 дней. Очевидно, что при столь длинном периоде упреждения сложно добиться прогноза с маленькой погрешностью. Стандартные статистические методы и модели прогнозирования в основном распространяют выявленную на исторических данных закономерность на период упреждения, что является минусом, если речь идёт о долгосрочном прогнозировании [1]. Ведь вероятность того, что сформировавшаяся закономерность сохранится на длительный период упреждения, очень мала и убывает с ростом шага прогнозирования. Последнее отражается на качестве прогнозирования, показывая высокую погрешность. Таким образом, для данных целей необходимы иные методы, а возможно, и модификация широко распространённых статистических методов прогнозирования. Некоторые авторы для подобных целей предлагают различные модификации нейронных сетей, подчёркивая перспективность данного аппарата [2]. Однако встречаются также работы, в которых для прогнозирования используются классические эконометрические модели, такие как уравнение регрессии. Например, в работе [3] построены модели прогнозирования цены на медь; авторы предлагают несколько факторов, от которых зависит цена на данный металл, далее строят уравнение регрессии, которое описывает зависимость цены на медь от данных факторов. Предпосылки к усреднению прогнозных значений При детальном анализе качества прогнозирования как абсолютной погрешности, так и относительной можно заметить следующее: каждая модель имеет отрезки, на которых прогнозные значения практически равны фактическим, и отрезки, где расчётные значения существенно отклоняются от фактических. Другими словами, в разные промежутки времени одна и та же модель может показать как высокую точность прогнозирования, так и плохое качество. Предположим, что для каждого момента времени существует модель, которая позволяет рассчитать очень точный прогноз, то есть с практически нулевой погрешностью. Необходимо лишь разработать методику или функцию, зависящую от временного параметра (в какой момент времени рассчитывается прогноз), значением которой будет являться та или иная модель прогнозирования. Тогда для прогнозирования, во-первых, необходимо разработать модели, во-вторых, решить задачу выбора единственной из них в тот или иной момент времени. Фактически любая модель прогнозирования представляет собой закономерность, по которой изменяется исследуемая величина. Например, регрессионная модель, распространённая в эконометрике, объединяет широкий класс универсальных функций, которые описывают некоторую закономерность [4]. Таким образом, чтобы правильно выбрать нужную модель, необходимо знать, каким правилам будет соответствовать будущее изменение. Но во времена нестабильности экономики и её процессов невозможно дать точный ответ на этот вопрос. В настоящей работе предложен подход к повышению точности прогнозирования, отличающийся от поиска единственной «идеальной» модели. Предположим, что имеется определённое количество k прогнозных моделей, при этом применение каждой из них по отдельности не обеспечивает необходимую точность прогнозирования. В качестве критерия пригодности модели рассмотрим неравенство (1) где - средняя относительная ошибка прогнозирования, - средний темп роста временного ряда за длину периода упреждения прогноза, где - фактические значения временного ряда в момент времени t и t - i соответственно; i - длина периода упреждения, с которой будет делаться прогноз; - прогнозное значение на момент времени t; N - длина периода, для которой был рассчитан прогноз [5]. При выполнении неравенства (1) прогнозы принесут прибыль металлоторговым компаниям. Практически любая модель на каких-либо исторических промежутках данных показывает точный прогноз. Можно объединить прогнозные значения всех моделей в каждый момент времени в один показатель. В качестве такого обобщающего показателя в настоящей работе предлагается использовать среднюю прогнозных значений всех k моделей. Методика повышения качества прогнозирования Рассмотрим прогнозирование цен на никель на 14 дней вперёд. Для простоты и наглядности предположим, что k = 2, то есть исследователь имеет в своём арсенале две прогнозные модели. При этом результаты ни одной из них не удовлетворяют его. Пусть прогноз делается в момент времени t. Тогда - фактическое значение цены никеля в момент времени t + 14; - прогноз в момент времени t на момент времени t + 14 по первой модели; - аналогично прогноз на 14 дней вперёд в момент времени t по второй модели. Рассмотрим остатки после одной операции прогнозирования. У двух моделей одновременно они могут быть отрицательными, положительными и разного знака. Если в какой-то момент прогнозирования остатки будут иметь одинаковый знак, при этом неважно какой, то использование в качестве прогноза среднего расчётных значений покажет ошибку, которая меньше, чем у модели с наибольшей ошибкой, но при этом не меньше, чем у другой. Для наглядности положительные и отрицательные остатки у модели изобразим на графике (рис. 1). Рис. 1. Остатки после операции прогнозирования: а - положительные остатки у обеих моделей; б - отрицательные остатки у обеих моделей На графиках через обозначена средняя прогнозных значений двух моделей, которую и предлагается использовать в качестве расчётного значения. Рассмотрим ошибку прогнозирования: (2) где i = 1, 2 и является обозначением моделей прогнозирования, значения которых усредняются. Также обозначим: (3) Формула (3) демонстрирует ошибку прогнозирования, если в качестве расчётного значения будет выбрана средняя прогнозных значений двух моделей. Теперь, ссылаясь на графики, можно сравнить между собой А, А1, А2. Согласно рис. 1, а , тогда, сравнив числители в формулах (2) и (3), получим А1 < А < А2. Аналогично на рис. 1, б , откуда следует, что А2 < А < А1. Проанализировав полученные соотношения ошибок прогнозирования, можно сделать вывод о том, что при одинаковом знаке остатков двух моделей усреднение расчётных значений качественно улучшает результаты только худшей из них. Теперь рассмотрим случай, когда при прогнозировании по двум моделям их остатки имеют разные знаки. Для более подробного анализа данная ситуация изображена графически (рис. 2). Рис. 2. Прогнозирование по двум моделям: а - остатки разных знаков, различные по абсолютной величине; б - остатки разных знаков, приблизительно равные по абсолютной величине Изучив рис. 2, а, сравним ошибки прогнозирования. Так как согласно графику , то А1 < А < А2. Таким образом, в данном случае также были улучшены результаты только худшей по качеству модели. Большой интерес для рассмотрения представляет случай на рис. 2, б. Аналогично сравним остатки в абсолютном выражении. Согласно графику , что свидетельствует о том, что А < А1 < А2. То есть в данном случае были улучшены результаты обеих моделей. Если сравнить графики друг с другом, можно увидеть, что они отличаются: на рис. 2, б остатки от прогнозирования по обеим моделям примерно одинаковы по абсолютной величине. Таким образом, усреднение прогнозных значений двух моделей однозначно улучшит их результаты, если знаки остатков от прогнозирования у обеих моделей разного знака и при этом одинаковы по абсолютной величине. Что значит утверждение о том, что остатки должны быть одинаковы по абсолютной величине? Выявим интервал, при попадании фактической цены в который усреднение однозначно улучшит результаты. Пусть, как на рис. 2, б, В таком случае явно, что ошибка прогнозирования при усреднении меньше ошибки первой модели. Рассмотрим, в каком случае она будет также меньше и ошибки второй модели. Знаки модуля в формулах средней ошибки прогнозирования раскроем в соответствии с неравенствами Таким образом, Теперь рассмотрим случай, когда , , чтобы найти верхнюю границу. В этом случае необходимо рассмотреть случай, в котором ошибка от усреднения уже меньше ошибки первой модели. Тогда Усреднение прогнозных значений двух моделей однозначно улучшит их качество, если их остатки имеют разный знак и при этом. Помимо средней ошибки прогнозирования важную роль при определении качества модели играет доля правильно спрогнозированных направлений движения цены [5]. Рассмотрим, как эта величина изменится у двух моделей, если усреднить их прогнозные значения, определим отрезок, в который может попасть данная величина. Предположим, что возможность правильно спрогнозировать направление равна вероятности правильно спрогнозировать тренд. Тогда пусть у первой модели эта вероятность равна р1, у второй р2 соответственно. При этом данные события независимы, то есть верное прогнозирование тренда с помощью одной из двух моделей не влияет на вероятность наступления аналогичного события при использовании другой [6]. Рассмотрим одно событие прогнозирования. Очевидно, что если обе модели правильно спрогнозируют направление движения цены, то и средняя их расчётных значений также покажет верный тренд. При неверном определении направления одной из моделей усреднение может как верно определить тренд, так и показать противоположное движению фактической цены направление. И, наконец, если обе модели неверно спрогнозировали направление движения цены, то усреднение также не угадает тренд. Представим сделанные выводы в табл. 1. Таблица 1 Вероятность правильно спрогнозировать направление при усреднении Событие Модель 1 Модель 2 Вероятность угадать направление при усреднении 1 Направление предсказано верно Направление предсказано верно 2 Направление предсказано верно Направление предсказано неверно 3 Направление предсказано неверно Направление предсказано верно 4 Направление предсказано неверно Направление предсказано неверно Рассмотрим табл. 1. Как отмечено выше, при усреднении прогнозных значений однозначно направление движения цены будет предсказано верно при наступлении события 1 и, возможно, ещё при наступлении событий 2 и 3. Тогда вероятность верно спрогнозировать направление движения цены при усреднении будет не меньше , когда при наступлении событий 2 и 3 направление будет предсказано неверно, и не больше когда при наступлении событий 2 и 3 направление предсказано верно. Пусть , - вероятность правильно спрогнозировать направление при усреднении. Так как любая вероятность лежит в отрезке [0; 1], , тогда , следовательно, . Рассматриваемый показатель будет улучшен у обеих моделей при усреднении с вероятностью, равной , будет меньше с вероятностью и, наконец, будет лежать в отрезке с вероятностью При этом Пусть, например, для наглядности . Тогда Таким образом, можно как улучшить этот показатель у обеих моделей, так и ухудшить с одинаковой вероятностью. При этом есть большая вероятность не ухудшить этот показатель по сравнению с самой некачественной моделью из двух. Эта вероятность тем больше, чем больше разница . Выше был рассмотрен случай для одного события прогнозирования. Сделанные выводы верны и для некоторого ряда прогнозных значений. Другими словами, средняя ошибка прогнозирования для ряда прогнозных значений будет не меньше ошибки наихудшей по качеству модели. Также все выводы справедливы и для k моделей, где . Усреднение улучшает результаты при присутствии моделей с разными знаками остатков от прогнозирования. Чем больше моделей, тем больше вероятность того, что найдутся модели с разными знаками остатков, что увеличивает вероятность улучшения результатов прогнозирования при усреднении прогнозных значений по сравнению с самой качественной из моделей. Следующим шагом на пути к повышению точности прогнозирования является взвешенное усреднение расчётных значений прогнозных моделей. То есть, если до этого в качестве прогнозного значения была использована величина , где n - количество моделей, прогнозные значения которых усредняются, то теперь предлагается вниманию величина , где - вес, который присваивается i-й модели. Веса находятся таким образом, чтобы минимизировать среднюю ошибку прогнозирования, . На практике найти веса можно в программе Microsoft Excel с помощью оператора «Поиск решения». Практические результаты Представленная методика была реализована на практике. С помощью нескольких моделей прогнозировались биржевые котировки цен на никель на 14 дней вперёд в период с марта 2015 по март 2016 г. Для расчёта каждого прогнозного значения использовалось 100 значений уровней временного ряда, то есть расчёт проводился на основе примерно полугодовой статистики (котировки цен представлены только за рабочие дни). Использовались следующие модели: полиномы 1, 2, 3 и 4 степеней (), степенная модель (), гиперболическая модель (), показательная модель (), методика прогнозирования биржевых котировок путём комбинирования «медленной» и «быстрой» скользящих средних, основная суть которой состоит в том, что знак будущего тренда определяется в зависимости от положения относительно друг друга двух скользящих средних с большей и меньшей длиной активного участка [7]. Для наглядности представим все полученные результаты в табл. 2. Таблица 2 Изменение результатов от усреднения прогнозных значений Название модели Средняя ошибка прогнозирования, % Доля правильно спрогнозированных направлений движения цены, % Линейная модель (полином 1-й степени) 7,58 56,42 Полином 2-й степени 6,65 70,39 Полином 3-й степени 10,45 38,27 Полином 4-й степени 14,88 40,5 Гиперболическая модель 8,22 50,0 Степенная модель 7,68 52,23 Показательная модель 7,19 55,31 Комбинирование «медленной» и «быстрой» скользящих средних 6,48 48,6 Усреднение 6,01 55,87 Взвешенное усреднение 3,58 78,49 Котировки цен никеля были взяты из официального сайта брокера «Финам» [8]. Все результаты были рассчитаны с использованием программы Excel пакета Microsoft Office. Заключение Таким образом, усреднение прогнозных значений, рассчитанных с помощью восьми разных моделей, однозначно уменьшило среднюю ошибку прогнозирования, то есть этот показатель у всех моделей выше. Вероятность правильно определить направление движения цены оказалась больше этого показателя при усреднении прогнозных значений лишь у двух моделей из восьми. Что же касается взвешенного усреднения расчётных значений, то здесь результаты однозначно лучше по обоим качественным параметрам, также они лучше и результатов простого усреднения. Таким образом, сделанные выводы подтверждаются на практике: усреднение прогнозных значений нескольких моделей может улучшить качество прогнозирования каждой отдельной модели, при этом взвешенное усреднение с оптимальными весами однозначно улучшает качественные признаки самой точной модели, как следствие, улучшаются и результаты прогнозирования. С другой стороны, если рассматривать пригодность модели для целей металлоторговых компаний, основным критерием которой является неравенство , то ни одна из моделей, прогнозные значения которых усредняются, не удовлетворила данному критерию на рассмотренном периоде, т. к. . При этом результаты как простого усреднения, так и взвешенного удовлетворяют данному критерию (см. табл. 2). Следовательно, при прогнозировании биржевых цен никеля нужно построить как минимум две модели, а в качестве прогнозного значения использовать или простую, или взвешенную среднюю прогнозных значений этих моделей. Это повысит точность и даст качественный прогноз, на основе которого на практике металлотрейдеры могут принимать успешные решения. Стоит отметить, что данный подход универсален и может быть использован для других временных рядов.