"Чистая"
и прикладная математика

Показатели рядов динамики: прогнозирование

Модели на основе средних значений могут быть использованы, когда значение уровня ряда динамики колеблется вокруг среднего значения и в ряде нет какой-либо ярко выраженной тенденции (тренда).

Метод скользящей средней

В прогнозировании значение скользящей средней (обозначим её Mt) вычисляется по формуле

,

где N - длина интервала сглаживания.

В этом случае среднее значение, которое используется для прогноза, является адаптивным средним. При пронозировании принимается, что это адаптивное среднее значение является самым лучшим (наиболее вероятным) значением для следующего периода. Обозначим прогнозируемое значение через Ft. Тогда

Ft+1 = Mt.


Пример 1. Рассмотрим пример с данными об объёмах продаж холодильников предприятия "Х" по месяцам.

При рассмотрении графика объёма продаж видно, что изменения объёма не подвержены какой-либо долгосрочной тенденции или тренду, объёмы продаж колеблются вокруг среднего значения.

Поэтому при расчёте прогноза можно использовать среднее значение. Вычислим значения скользящей средней по приведённой выше формуле:

для третьего месяца - ,

для четвёртого месяца -

и так далее.

Результаты даны в третьем столбце таблицы (для первых двух месяцев по этой формуле скользящие средние вычислить невозможно).

Месяцы tОбъёмы продажи холодильников ytСкользящая средняя Mt
1113-
2117-
3112114
4113114
5108111
6112111
7116112
8120116
9121119
10113118
11111115
12118114
Прогноз FtПогрешность прогноза εt
--
--
--
114-1
114-6
1111
1115
1128
1165
119-6
118-7
1153

Наиболее вероятные прогнозы на каждый месяц по соответствующей формуле даны в четвёртом столбце таблицы. Прогноз на первый месяц следующего года F13 = 114 можно сделать по данным трёх последних месяцев.


При использовании модели среднего значения прогнозы зависят от длины интервала сглаживания. Поэтому закономерен вопрос: как выбрать интервал и какая величина - "лучшая" для интервала? Для ответа на этот вопрос нужно оценить погрешность прогноза среднего для различных интервалов сглаживания и выбрать тот, у которого случайная ошибка прогноза - наименьшая.

Погрешность прогноза для каждого момента времени вычисляется по формуле

εt = yt − Ft.

Среднюю погрешность прогноза на основе скользящей средней обычно вычисляется как среднее абсолютное отклонение, которое обозначается MAD (Mean Absolute Deviation):

,

где n - число вычисленных ошибок.

При оценке прогноза можно использовать также среднюю квадратическую погрешность и среднюю абсолютную процентную ошибку.

Средняя квадратическая погрешность MSE (Mean Squared Error) вычисляется по формуле

.

Средняя абсолютная процентная ошибка MAPE (Mean Absolute Percenting Error) вычисляется по формуле

.


Пример 2. В нашем случае, когда N=3, MAD=4,67. Для значений N от 2 до 6 значения MAD следующие:

NMAD
24,50
34,67
44,78
54,11
64,42

На основе этих значений погрешности можем сделать вывод, что при использовании интервала сглаживания длиной в пять периодов можно получить наилучший прогноз с точки зрения минимального среднего абсолютного отклонения. С использованием такого интервала сглаживания получаем прогноз: наиболее вероятно, что в первый месяц следующего года будут проданы 116 холодильников:

F13 = (118 + 111 + 113 + 121 + 120)/5 = 116,6.


При использовании формулы значения скользящей средней каждому уровню ряда динамики в границах периода сглаживания присваивается один и тот же вес. Так, если N=3, то вес соответствует 1/3, поэтому формулу в этом случае можно записать так:

Mt = (1/3)yt + (1/3)yt−1 + (1/3)yt−2.

Но можно использовать и скользящие средние значения с различными весами - так называемые скользящие средневзвешенные. При этом нужно соблюдать условие: сумма весов равна единице. Например, при N=3 можно использовать весы 3/5, 1/5, 1/5. В этом случае

Mt = (3/5)yt + (1/5)yt−1 + (1/5)yt−2.

Модели прогнозирования на основе скользящей средней и скользящей средневзвешенной имеют существенный недостаток: для вычисления пронозируемого значения используются только последние N уровней ряда динамики и только для вычисления погрешности используются предыдущие n − N уровней. Поэтому для прогнозирования средних значений рядов динамики используются и другие методы.

Метод экспоненциальной средней (экспоненциального сглаживания)

Основная формула значения экспоненциальной средней:

Ft+1 = αyt + (1 − α)Ft,

где α - параметр экспоненциального сглаживания, который может принимать значения от 0 до 1.

Таким образом, прогноз для каждого следующего периода строится на среднем взвешенном значении предыдущего уровня ряда динамики и значении предыдущего прогноза. Например, для прогноза значения четвёртого уровня ряда динамики формула будет следующей:

F4 = αy3 + (1 − α)F3,

для прогноза третьего уровня

F3 = αy2 + (1 − α)F2,

для прогноза второго уровня

F2 = αy1 + (1 − α)F1.,

То есть в прогнозе используется среднее взвешенное значение от y3 и F3 с весами α и 1 − α.

В общем случае прогноз на каждый следующий период является средней взвешенной величиной от всех предыдущих уровней ряда динамики.

Вернёмся к уравнениям прогноза значений третьего и четвёртого уровней ряда динамики. Подставляя каждое следующее уравнение в предыдущее, получаем

или в общем виде

.

Таким образом, в общем случае прогнозируемое значение вычисляется с использованием всех уровней ряда динамики путём их умножения на соответствующие коэффициенты (весы): или .

Так как параметр экспоненциального сглаживания α принимает значения от 0 до 1, эти коэффициенты образуют убывающую геометрическую прогрессию с первым членом a1 = α и квоциентом q = 1 − α. То есть они подчинены экспоненциальному закону распределения. Например, если α = 0,5, то α(1 − α) = 0,25, α(1 − α)² = 0,125 и так далее. Если α = 0,2, то α(1 − α) = 0,16, α(1 − α)² = 0,128 и так далее. На графике можно видеть, что весы экспоненциально убывают, но в первом случае более стремительно, а во втором - медленнее.

В зависимости от величины параметра экспоненциального сглаживания α различным уровням ряда динамики можно присвоить различные весы. Например, если о прогнозируемом показателе известно, что на его будущие значения больше влияют более близкие из предыдущих уровней ряда, то параметр α должен быть больше, чем в случае, когда бОльшее влияние оказывают более ранние значения ряда динамики. А если бОльшее влияние оказывают более ранние значения, то параметр α должен быть меньше.

В практических вычислениях принимают, что F1 = y1, так как необходимые для вычисления F1 значения y0 и F0 неизвестны.


Пример 3. Сделаем прогноз методом экспоненциального сглаживания для ряда динамики, содержащего данные об объёмах продажи холодильников предприятия "Х" из предыдущих примеров.

F1 = y1 = 113,0

F2 = 0,2⋅113 + (1 − 0,2)⋅113,0 = 113,0

F3 = 0,2⋅117 + (1 − 0,2)⋅113,0 = 113,8

F4 = 0,2⋅112 + (1 − 0,2)⋅113,8 = 113,44

и так далее.

Прогноз на первый месяц следующего года:

F13 = 0,2⋅118 + (1 − 0,2)⋅114,33 = 115,06.

Значения экспоненциальной средней, если принимаем, что α = 0,2, даны в третьем столбце таблицы.

Месяцы tОбъёмы продажи холодильников yt
1113
2117
3112
4113
5108
6112
7116
8120
9121
10113
11111
12118
Прогноз (α = 0,2) FtПогрешность прогноза εt
113,00
113,04
113,8-1,8
113,44-0,44
114,35-6,35
112,28-0,28
112,233,77
112,987,02
114,386,62
115,71-2,71
115,17-4,17
114,333,67

Прогноз можно уточнить, если выбрать более оптимальное значение α: такое, при использовании которого средняя погрешность прогноза - наименьшая. Выберем MSE в качестве величины, характеризующей погрешность. Эта погрешность для различных значений α следующая:

αMSE
0,014,01
0,024,00
0,053,97
0,103,97
0,153,98
0,204,02
0,254,05
0,304,08
0,354,13
0,404,16
0,454,20
0,504,23

Видим, что наименьшая погрешность прогноза для данного ряда динамики при использовании метода экспоненциального выравнивания соответствует значениям α от 0,05 до 0,15. Примем за оптимальное значение в середине между этими двумя, то есть 0,1. Тогда получим следующий прогноз объёма продаж: 114,3.


Формулу экспоненциальной средней можно преобразовать, чтобы в прогнозе учитывалась погрешность прогноза для предыдущего периода:

Ft+1 = αyt + (1 − α)Ft

Ft+1 = αyt + Ft − αFt

Ft+1 = Ft + α(yt − Ft)

Ft+1 = Ft + αεt).

Как показывает последнее выражение, прогноз по методу экспоненциальной средней образуется из прогноза с экспоненциальным средним значением прошлого периода с прибавлением погрешности ошибки, умноженной на параметр сглаживания α. Если погрешность больше нуля, это означает, что предыдущий прогноз был меньше фактического значения и следующий прогноз будет соответственно увеличен. Если погрешность меньше нуля, то прогноз был меньше фактического значения и прогноз на следующий период будет соответственно уменьшен.

Доверительный интервал для прогнозов на основе средних значений

Доверительный интервал прогноза определяется путём вычисления стандартной погрешности sε.

Фактически можно принять, что в 68 % случаев прогнозы находятся в интервале Ft ± sε, а в 95 % случаев - в интервале Ft ± 2sε.

Чтобы вычислить sε, можно использовать значение средней абсолютной погрешности MAD или значение средней квадратической погрешности MSE:

или

.


Пример 4. В нашем примере с объёмами продажи холодильников стандартная прогрешность для прогноза по методу скользящей средней, если N=5, равна . Это означает, что для 8 месяцев (0,68⋅12) прогноз должен быть с округлением в пределах от 112 до 122 (116,6±5,1), а для 11 месяцев (0,95⋅12) - в пределах от 106 до 127 (116,6±2⋅5,1).

Стандартная погрешность прогноза по методу экспоненциального сглаживания, если α=0,1, составляет . Это означает, что в 68 % случаях прогноз с округлением должен находиться в границах от 110 до 118 (114,3±4,1), а в 95 % - в границах от 106 до 123 (114,3±2⋅4,1).