Abstract and keywords
Abstract (English):
The aim of the research is to give a detailed and interval prognosis for 10 business days based on historical data about the final prices of Erste Bank Group shares on the Stock exchange in Prague. The results are joint into tables, represented graphically, compared and interpreted. The predictions are received while using models of trend functions and models based on time series analysis. To perform the numerical calculations such software as Excel, Statgraphics Plus and statistical system R have been used.

Keywords:
trend functions, time series analysis, predictions, prediction models, "Erste Group Bank", share prices, ARIMA models
Text
Введение В связи с углубляющейся всемирной экономической интеграцией в последние годы растёт интерес к научно обоснованным прогнозам и методам конструкции таких прогнозов. Прогнозируемый процесс развития цен на отслеживаемые акции описан посредством временнóго ряда, на который воздействуют противоречивые влияния. Все такие влияния по отдельности угадать невозможно. Несмотря на это, инвесторы и предприниматели должны проводить прогнозы будущей коммерческой деятельности, чтобы планировать время и финансовые средства, которые есть в их распоряжении. К наиболее часто используемым методам статистического прогнозирования принадлежат методы экстраполяции временных рядов, методы регрессивного анализа, структурного анализа и методы, основанные на системном подходе и комплексных моделях. В рамках данного исследования мы ограничимся только методами экстраполяции временных рядов. Сущность классических методов экстраполяции состоит в том, что изучается история прогнозируемого объекта, а закономерности его развития в прошлом и настоящем переносятся в будущее. Таким образом, они основаны на принципе стабильности временнóго ряда, которым изучаемый объект характеризуется. На методы принципиально влияет выбор модели. Тем не менее не существует что-то такое, что можно было бы назвать самой лучшей прогнозной моделью, которую можно применить в любой ситуации. Именно поэтому полученный прогноз необходимо сравнивать с прогнозами, полученными при помощи других методов (например, с прогнозами, проведёнными экспертами, так называемыми экспертными прогнозами). Экстраполяционные прогнозы используются прежде всего при кратковременном прогнозировании – на 1–3 периода вперёд. Вследствие этого одной из основных задач станет выбор подходящей прогнозной процедуры для определённой ситуации и данного комплекса данных. Для начала, чтобы можно было сравнить точность прогнозов, полученных различными методами, воспользуемся общим коэффициентом точности прогнозов, принятым в [1]. Такие прогнозы проявляются в итоговых показателях различных компьютерных программ. Из них наиболее часто используется средняя квадратичная ошибка MSE, рассчитываемая как средняя величина квадратичных погрешностей отдельных величин временнóго ряда от их выравненных параметров, или средняя квадратичная погрешность MSD, где квадратичные погрешности заменим абсолютными величинами этих погрешностей. Основная разница между MSE и MAD состоит в том, что возведением в степень прогнозной ошибки MSE мы пресекаем крупнейшие ошибки принципиально больше, чем при использовании MAD. В связи с этим MAD является подходящим коэффициентом точности прогноза в случае, если цены на прогнозные ошибки растут линейно с размером ошибки. Если ошибки исключительно дороги, то лучше воспользоваться MSE. Если же мы реализуем прогнозы с использованием регрессивного анализа (например, в трендовом анализе), то могут присутствовать показатели точности, а также соответствующие характеристики силы зависимости (например, коэффициент детерминации или стандартная ошибка регрессии). Соответствующие числовые расчёты проводим с помощью программ R и Statgraphics Plus. В программе Excel мы сможем выравнивать данные только посредством трендовых функций, которые являются линейными в параметрах, или же их можно перевести на линейную модель, например логарифмической трансформацией. Методика конструкции прогноза Рассмотрим прежде всего методы, основанные на прогнозировании тренда. Для трендового анализа воспользуемся программой R, которая умеет из обычно используемых трендовых функций для указанных данных выбрать самые подходящие, выровнять их методом наименьших квадратов и осуществить прогноз с точки зрения расчётов и графического отображения. В программу R загрузим данные о конечных ценах акций на Бирже ценных бумаг в Праге (БЦБП) и объёме сделок в «Erste Bank Group» (EBAG) в отдельные биржевые дни. Пронумеруем все использованные биржевые дни с помощью временнóй переменной t. Речь идёт о биржевых днях со 2.1.2007 по 29.4.2013. Не хватает данных с торгов 31.12.2010, 10.9.2012, 31.12.2012 и 29.3.2013. Эти биржевые дни мы исключим из дальнейшего анализа. Далее t проходит параметры 1, 2, …, 1589. Конечные цены акций в чешских кронах на БЦБП колебались в диапазоне от 202,50 до 1 741 чешских крон (далее – крон), средняя цена была 802,90 крон, a разброс составил 155 107,2 крон. Объём акций, с которыми проводились операции, в течение дня колебался от 11,92 млн крон до 1 398 млн крон. В среднем за биржевой день проводились операции в объеме 249,6 млн крон. В общем был проведён анализ 1 589 биржевых дней. Использованные данные взяты из файлa в [2]. На рис. 1 представлено изменение конечных цен на БЦБП после редукции данных в зависимости от времени t в программе R. Рис. 1. Зависимость конечных цен акций EBAG от БЦБП после сокращения данных за счёт отсутствующих значений Данные о конечных ценах для акций EBAG можно разделить в соответствии с экономической ситуацией на четыре периода. Первый период – систематического снижения цены акций до самого минимума – с 2.1.2007 (t = 1) по 24.2.2009 (t = 540). Второй период – возобновления роста цены акций – продолжался с 25.2.2009 (t = 541) по 28.2.2011 (t = 1 045). Третий период – возобновления снижения цен – с 1.3.2011 (t = 1046) по 23.11.2011 (t = 1 231). Четвёртый период умеренного оживления цен и их стагнации – с 24.11.2011 (t = 1 231) вплоть до прекращения мониторинга данных 29.4.2013 (t = 1 589). Из рис. 1 очевидно, что временнóй ряд содержит только тренд и случайную составляющую и не содержит сезонную составляющую. Поэтому мы можем получить прогнозы, например, выравниванием параметров временнóго ряда подходящей трендовой функцией. Дополнительные возможности выравнивания предоставляет нам экспоненциальное выравнивание или метод экспоненциально взвешенных скользящих средних величин. Качество этих методов мы можем оценить, сравнив с наивной моделью случайной прогулки. Если же мы докажем существование во временнóм ряде значительной автокорреляции (сильную линейную зависимость между отдельными параметрами временнóго ряда), то ещё лучшими особенностями обладают так называемые ARIMA-модели, использующие методологию Бокса – Дженкинсона (BJ-методологию). Вкратце опишем использованные модели. Подробное описание данных методов найдём в [3]. Нашей задачей будет показать с помощью подходящего софтвера, как обнаружить для присутствующих данных оптимальные прогнозы, численно их рассчитать (точечно и в интервалах), взаимно сравнить и проанализировать полученные результаты. Описание использования отдельных моделей Прогнозы, основанные на трендовых функциях. К обычным трендовым функциям, применяемым для получения прогнозов относятся: линейная, квадратичная модифицированная экспоненциальная (показательная), логистический тренд и кривая Гомперца. Выравнивание методом наименьших квадратов мы можем проводить в программе R [4] с использованием полного временнóго периода. В [5] этот трендовый анализ произведён только для данных последнего временнóго периода. Графические изображения выравниваний, полученные методом наименьших квадратов, включая рассчитанные коэффициенты точности MSE и MAE, приводятся на рис. 2. Рис. 2. Выравнивание временнóго ряда конечных цен акций EBAG основными трендовыми функциями Очевидно, что использование для выравнивания прямой экспоненциальной или логистической функций, а также кривой Гомперца не было бы разумным, поскольку тем самым во времени t = 1 590 мы пришли бы к внезапному резкому снижению цен акций. Другие две трендовые функции дают несколько лучшие результаты. Наименьшие коэффициенты точности даёт модифицированный тренд (на подходящую константу сдвинуто экспоненциальное выравнивание) с MSE = 40 867,45 и MAE = 169,64. Выровненная трендовая функция: 566,4 + 1453,5.0,9962t. Прогнозы окончательной цены на акции составляют около 570 крон. Но и эти параметры не вытекают прямо из последней цены на акции 621,50 крон и коэффициента точности. Они также относительно высокие. Вследствие этого, возможно, будет разумно не использовать для имеющихся данных выравнивание с помощью трендовых функций, а попробовать применить выравнивание одним из следующих методов. Предикционные модели, основанные на анализе временных рядов. Сравнение моделей. Используем в программе Statgraphics Plus в закладке Анализ временных рядов позицию Прогнозирование. Из моделей, основанных на анализе временных рядов, наилучшими представляются модели, приведённые в следующей выдержке из программы Statgraphics Plus: Models ------ (A) Random walk (B) Simple exponential smoothing with alpha = 0,9999 (C) Holt's linear exp. smoothing with alpha = 0,9999 and beta = 0,0365 (D) ARIMA(3,0,0) with constant Данные модели, описанные в [1, 3], дают принципиально более точные результаты. Довольно хорошие результаты мы получим уже при использовании простой наивной модели случайной прогулки с MSE = 472,3 (прогноз определён предыдущим параметром временнóго ряда), простого показательного выравнивания с MSE = 472,3 (все прогнозы определены последним выровненным параметром) и далее выравниванием Хольта с MSE = 488,4 (в данном случае прогнозы уже отличаются). Наиболее точные прогнозы определены авторегрессивной моделью ARIMA(3,0,0) с MSE = 470,7. Речь идёт уже о теоретически более сложных методах, объяснённых, например, в [3, 6]. Опишем результаты, полученные к прогнозам по отдельным моделям. Модель случайной прогулки. Эта модель принадлежит к элементарным методам прогнозирования, когда ближайшую будущую величину временнóго ряда мы предполагаем на основании имеющейся величины временнóго ряда. Из-за его простоты им можно воспользоваться в качестве сравнительного предположения в прогнозировании перед применением более сложной модели. Ряд точечных и интервальных прогнозов, полученных с помощью программы Statgraphics, приведен в табл. 1 и на рис. 3. Таблица 1 t Точечный прогноз Нижняя граница Верхняя граница 1590 621,5 664,094 578,906 1591 621,5 681,738 561,262 1592 621,5 695,276 547,724 1593 621,5 706,689 536,311 1594 621,5 716,744 526,256 1595 621,5 725,835 517,165 1596 621,5 734,194 508,806 1597 621,5 741,975 501,025 1598 621,5 749,283 493,717 1599 621,5 756,195 486,805 Рис. 3. Выравнивание данных и прогнозов с помощью модели случайной прогулки Модель простого экспоненциального выравнивания. Используя эту модель, предсказывающую величину временнóго ряда во времени t + 1, мы получим среднее взвешенное как наблюдаемого параметра ряда во времени t, так и предыдущего прогноза данного ряда во времени t. Для анализируемых данных модель даёт почти тождественные результаты, как и модель случайной прогулки, поэтому описывать данные результаты мы не будем. Выравнивание Хольта. Речь идёт об очень эффективном прогнозном методе, применимом к ряду с сезонными составляющими и известному под названием экспоненциального выравнивания Уинтерса или же, для ряда без сезонной составляющей, – выравнивания Хольта. Метод исходит из модели временнóго ряда, содержащей уровневый компонент (абсолютный член) и наращивание тренда (правило). В каждой точке времени отдельно предугадывается средний уровень и наращивание тренда, а при комбинации данных составляющих мы получим общий ответ. По аналогии с предыдущим методом каждый компонент рассчитываем как экспоненциально взвешенный скользящий средний параметр. В методе применим две выравнивающие постоянные, которые определим так, чтобы коэффициенты точности выравнивания были минимальными (подробнее см. [1, 3]). Точечные и интервальные прогнозы, определённые программой Statgraphics, приведены в табл. 2 и на рис. 4. Таблица 2 t Точечный прогноз Нижняя граница Верхняя граница 1590 622,133 665,445 578,821 1591 622,767 719,608 525,926 1592 623,4 785,441 461,36 1593 624,034 861,233 386,835 1594 624,667 945,832 303,503 1595 625,301 1038,41 212,193 1596 625,934 1138,33 113,54 1597 626,568 1245,09 8,04856 1598 627,202 1358,27 –103,869 1599 627,835 1477,54 –221,865 Рис. 4. Выравнивание данных и прогнозов с помощью выравнивания Хольта с константами: α = 0,9999; β = 0,0365 Выравнивание с помощью методологии Бокса – Дженкинса. BJ-методология, известная как ARIMA-модели, делает акцент на вероятностном и стохастическом анализе экономических временных рядов на основе философии «Пусть данные говорят сами за себя». Параметры временнóго ряда объясняются прошлыми или же сдвинутыми параметрами временнóго ряда и его случайными составляющими. BJ-методология рассматривает в качестве основного элемента конструкции модели временнóго ряда случайную составляющую, которая может состоять из коррелированных случайных величин. В основе метода лежит корреляционный анализ более или менее зависимых наблюдений, организованных в форме временнóго ряда. Другим преимуществом метода является его более высокая гибкость (реакция на изменяющийся характер развития ряда ещё более быстрая). Отрицательной стороной является то, что применение данного метода требует достаточно большого количества наблюдений, а работа с ARIMA-моделями очень сложна как с теоретической, так и с практической точки зрения. Поскольку большинство из предлагаемых статистических программ всё-таки включает ARIMA-модели, то их применение (прикладные программы) на компьютере приемлемы. BJ-методология пользуется различными прогнозными моделями. Вводит класс наиболее часто используемых авторегрессивных интегрированных моделей скользящего среднего статистического параметра, обозначаемых как модели ARIMA(p, d, q), в которых первые p + 1 члены называем авторегрессивной частью модели AR(p), последние q + 1 члены называем частями скользящего среднего числа случайных составляющих временнóго ряда MA(q). Чтобы выбрать лучшую модель ARIMA для имеющихся данных, нам нужно сначала устранить из временнóго ряда тренд с помощью подходящей трансформации. Чаще всего достаточно использовать подходящую степень дифференциации анализируемого временнóго ряда. Необходимая степень дифференциации обозначена здесь d. Основной проблемой при выборе модели является выбор параметров p, d, q. Определение этих параметров называем идентификацией модели. Для этого мы используем автокорреляционную и парциальную автокорреляционную функцию (ACF и PACF). ACF или же PACF определены корреляционными коэффициентами или же парциальными корреляционными коэффициентами, между изначальным рядом и запоздалым рядом. Модель содержит только авторегрессивную часть AR(p), если ACF постепенно снижается к нулю, а PACF сильно снижается только после p-сдвигов. Если же наоборот, то модель содержит только часть скользящих средних параметров MA(q). При неоднозначном результате модель содержит обе части. Далее производится прикидка параметров модели, диагностика модели и расчёт прогноза. При использовании программы Statgraphics большую часть из этих операций осуществит компьютер. Для расчёта прогнозов программа предлагает результаты по модели ARIMA(3,0,0). Выравнивание с помощью модели ARIMA (3,0,0). Ниже приведены наиболее существенные результаты, рассчитанные компьютером. Forecast Summary ---------------- Forecast model selected: ARIMA(3,0,0) with constant Number of forecasts generated: 10 Number of periods withheld for validation: 0 Estimation Validation Statistic Period Period -------------------------------------------------- MSE 470,688 MAE 14,9813 MAPE 2,16359 ME -0,570289 MPE -0,100664 ARIMA Model Summary Parameter Estimate Stnd. Error t P-value -------------------------------------------------------------------------------------- AR(1) 1,01377 0,0250879 40,4088 0,000000 AR(2) -0,0800597 0,0364157 -2,1985 0,027913 AR(3) 0,0664116 0,025098 2,64609 0,008143 Mean 1637,19 21,6455 75,6365 0,000000 Constant -0,201272 -------------------------------------------------------------------------------------- Backforecasting: no Estimated white noise variance = 470,688 with 1585 degrees of freedom Estimated white noise standard deviation = 21,6953 Number of iterations: 5 Точечные и интервальные прогнозы приведены в табл. 3 и на рис. 5. Таблица 3 t Точечный прогноз Нижняя граница Верхняя граница 1590 621,845 664,367 579,323 1591 621,506 682,057 560,955 1592 621,354 694,088 548,619 1593 621,249 704,365 538,133 1594 621,133 713,554 528,712 1595 621,013 721,89 520,137 1596 620,894 729,568 512,221 1597 620,776 736,724 504,827 1598 620,657 743,452 497,862 1599 620,538 749,819 491,258 Рис. 5. Выравнивание данных и прогнозов с помощью модели ARIMA(3,0,0) Результаты исследований Прогнозы, основанные на трендовых функциях, при большой вариабельности данных обременены крупными предикционными ошибками. Для таких данных наиболее точной представляется модель модифицированного показательного тренда (на рис. 2 мы видим, что результаты в данном случае оценены немного ниже), а второй наиболее точной является модель квадратичного тренда (результаты в данном случае оценены слегка выше). Поскольку в конце временнóго ряда данные почти не колеблются, то модели, основанные на анализе временных рядов, представляют прогнозы близкие последним параметрам временнóго ряда. Случайная прогулка и простое показательное выравнивание – это очень простые методы, относительно точные, но они рассчитывают только один прогноз – близкий к последнему измерению. Выравнивание Хольта – более сложный метод, для имеющихся данных несколько менее точный, но рассчитывающий большее количество ответов. При этом необходимо выбрать оптимальные выравнивающие константы. Наиболее точные результаты дают ARIMA-модели, которые по теории и расчётам относятся к наиболее сложным моделям. Для наших данных наиболее точные результаты даёт модель ARIMA(3,0,0). Вариативность данных высока, поэтому прогнозы можно считать надёжными лишь на краткий период в будущем. В табл. 4 приведён обзор точечных прогнозов цен (в чешских кронах) на акции EBAG на основании отдельных моделей в течение 6 последующих биржевых дней и реальная величина окончательных цен на акции на бирже ценных бумаг в Праге в таком виде, в каком они были дополнительно найдены в Интернете. В последних двух строках рассчитана и последующая степень точности предсказаний. Сравнение реально достигнутых цен с отдельными прогнозами показывает, что последняя модель итоговой цены прогнозируется с несколько большей точностью. Данные уже неактуальны. Если же мы посмотрим на реальное развитие цен, то узнаем, что цены со 2.5.2013 росли до 22.5.2013 от 601 до 670 крон, а потом снова падали до 3.7.2013 на 500,90 крон. В настоящее время цена акций (1.11.2013) составляет 669,70 крон. Интересно было бы провести такой анализ за последний актуальный месяц, но в момент выхода статьи, вероятно, данные уже снова будут неактуальными. Таблица 4 Дата Модифицированный экспоненциальный тренд Случайная прогулка Простое экспоненциальное выравнивание Выравнивание Хольта Модель AR(3,0) Реальные цены 30.04.13 569,99 621,5 621,5 622,133 621,845 614,90 02.05.13 569,98 621,5 621,5 622,767 621,506 601,00 03.05.13 569,97 621,5 621,5 623,4 621,354 605,00 06.05.13 469,95 621,5 621,5 624,034 621,249 615,80 07.05.13 569,94 621,5 621,5 624,667 621,133 619,40 09.05.13 569,93 621,5 621,5 625,301 621,013 623,30 MSE 5128,9 129,4 129,4 160,7 129,0 – MAE 59,9 8,9 8,9 10,5 8,9 – Дискуссия и некоторые заключения Используя приведённые методы, мы принимаем во внимание только прошлое временнóго ряда, не изучая, почему ряд приобрёл такие параметры. Данные параметры обычно находятся под влиянием множества других экономических, социальных, общественных и других аспектов, которые в используемых моделях не принимались во внимание. Вследствие этого необходимо воспринимать результаты прогнозов всегда с определённой осторожностью и сравнивать их с качественными прогнозами, полученными группами квалифицированных и опытных специалистов или же с результатами эконометрических анализов, которые включают в модель большее количество объясняющих переменных. Полезно также рассчитывать из полученных прогнозов средний результат. Если же мы анализируем данные, которые в соответствии с экономической ситуацией ведут себя принципиально иначе в различные периоды времени, то, прежде всего, при трендовом анализе более выгодно проводить анализ только с данными последнего периода времени.
References

1. Stuchlý J. Statistické metody pro manažerské rozhodování / J. Stuchlý. Jindřichův Hradec: VŠE, Fakulta managementu, 2004. 188 s.

2. Datový soubor erba.xls viz [Elektronický zdroj]: https://is.vstecb.cz/auth/dok/rfmgr.pl?upload_id=4380872.

3. Cipra T. Analýza časových řad s aplikacemi v ekonomii / T. Cipra. Praha: SNTL a Alfa, 1986. 248 s.

4. Stuchlý J. Statistika. Studijní opora pro kombinované studium / J. Stuchlý. České Budějovice: VŠTEČB, 2011. 197 s.

5. Stuchlý J. Analýza závislostí a předpovědi v modelech cenných papírů / J. Stuchlý, R. Zeman // Tvůrčí činnost jako proces vnímání, poznání a seberealizace. České Budějovice, 2013. S. 336-346.

6. Arlt J. Finanční časové řady / J. Arlt, M. Arltová. Praha: Grada, 2003. 220 s.


Login or Create
* Forgot password?