Автокорреляционная функция и аддитивная модель временного ряда

Краткая теория

При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше .

Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.

Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.

Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного рада. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , ряд содержит циклические колебания с периодичностью в  моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты ( ) и циклической (сезонной) компоненты ( ).

Существует несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Простейший подход - расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий:

Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой , сезонной  и случайной  компонент. Общий вид мультипликативный модели выглядит так:

Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой , сезонной  и случайной  компонент. Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.

Построение аддитивной и мультипликативной моделей сводится к расчету значений  и  для каждого уровня ряда.

Процесс построения модели включает в себя следующие шаги.

1. Выравнивание исходного ряда методом скользящей средней.

2. Расчет значений сезонной компоненты .

3. Устранение сезонной компоненты из исходных уровней ряда и получение выравненных данных  в аддитивной или  в мультипликативной модели.

4. Аналитическое выравнивание уровней  или  и расчет значений  с использованием полученного уравнения тренда.

5. Расчет полученных по модели значений  или .

6. Расчет абсолютных и/или относительных ошибок.

Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок  для анализа взаимосвязи исходного ряда и других временных рядов.

Пример решения задачи

Задача

Имеются условные данные об объемах потребления электроэнергии  жителями региона за 16 кварталов.

Требуется:

1. Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.

2. Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).

3. Сделать прогноз на 2 квартала вперед.

Исходные данные

1 5.5 9 8.2
2 4.8 10 5.5
3 5.1 11 6.5
4 9.0 12 11.0
5 7.1 13 8.9
6 4.9 14 6.5
7 6.1 15 7.3
8 10.0 16 11.2

Решение

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

1) Построим поле корреляции:

Поле корреляции

Уже исходя из графика видно, что значения  образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу:

Вспомогательная таблица 1

1 5.5 --- --- --- --- --- ---
2 4.8 5.5 -2.673 -1.593 4.260 7.147 2.539
3 5.1 4.8 -2.373 -2.293 5.443 5.633 5.259
4 9 5.1 1.527 -1.993 -3.043 2.331 3.973
5 7.1 9 -0.373 1.907 -0.712 0.139 3.635
6 4.9 7.1 -2.573 0.007 -0.017 6.622 0.000
7 6.1 4.9 -1.373 -2.193 3.012 1.886 4.811
8 10 6.1 2.527 -0.993 -2.510 6.384 0.987
9 8.2 10 0.727 2.907 2.112 0.528 8.449
10 5.5 8.2 -1.973 1.107 -2.184 3.894 1.225
11 6.5 5.5 -0.973 -1.593 1.551 0.947 2.539
12 11 6.5 3.527 -0.593 -2.092 12.437 0.352
13 8.9 11 1.427 3.907 5.574 2.035 15.262
14 6.5 8.9 -0.973 1.807 -1.758 0.947 3.264
15 7.3 6.5 -0.173 -0.593 0.103 0.030 0.352
16 11.2 7.3 3.727 0.207 0.770 13.888 0.043
Сумма 112.1 106.4 0 0 10.507 64.849 52.689
Среднее значение 7.473 7.093          

 

Следует заметить. что среднее значение получается путем деления не на 16, а на 15, так как у нас теперь на одно наблюдение меньше.

Коэффициент автокорреляции первого порядка:

 

Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка:

Вспомогательная таблица 2

1 5.5 --- --- --- --- --- ---
2 4.8 --- --- --- --- --- ---
3 5.1 5.5 -2.564 -1.579 4.048 6.576 2.492
4 9 4.8 1.336 -2.279 -3.044 1.784 5.192
5 7.1 5.1 -0.564 -1.979 1.116 0.318 3.915
6 4.9 9 -2.764 1.921 -5.311 7.641 3.692
7 6.1 7.1 -1.564 0.021 -0.034 2.447 0.000
8 10 4.9 2.336 -2.179 -5.089 5.456 4.746
9 8.2 6.1 0.536 -0.979 -0.524 0.287 0.958
10 5.5 10 -2.164 2.921 -6.323 4.684 8.535
11 6.5 8.2 -1.164 1.121 -1.306 1.356 1.258
12 11 5.5 3.336 -1.579 -5.266 11.127 2.492
13 8.9 6.5 1.236 -0.579 -0.715 1.527 0.335
14 6.5 11 -1.164 3.921 -4.566 1.356 15.378
15 7.3 8.9 -0.364 1.821 -0.664 0.133 3.318
16 11.2 6.5 3.536 -0.579 -2.046 12.501 0.335
Сумма 107.3 99.1 0 0 -29.721 57.192 52.644
Среднее значение 7.664 7.079          

Следовательно:

 

Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу:

Коэффициенты автокорреляции

Лаг Коэффициент автокорреляции уровней
1 0.180
2 -0.542
3 0.129
4 0.980
5 0.987
6 -0.686
7 0.019
8 0.958
9 0.117
10 -0.707
11 -0.086
12 0.937

 

Коррелограмма

 

Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать выводы о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.

 

2)  Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:

Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии.

Разделив полученные суммы на 4, найдем скользящие средние. Полученные таким образом выровненные значения уже не содержат сезонной компоненты.

Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние.

Расчет сезонной компоненты

Итого за четыре квартала Скользящая средняя за четыре квартала Центрированая скользящая средняя Оценка сезонной компоненты
1 5.5 -- -- -- --
2 4.8 24.4 6.1 -- --
3 5.1 26 6.5 6.300 -1.200
4 9 26.1 6.525 6.513 2.488
5 7.1 27.1 6.775 6.650 0.450
6 4.9 28.1 7.025 6.900 -2.000
7 6.1 29.2 7.3 7.163 -1.063
8 10 29.8 7.45 7.375 2.625
9 8.2 30.2 7.55 7.500 0.700
10 5.5 31.2 7.8 7.675 -2.175
11 6.5 31.9 7.975 7.888 -1.388
12 11 32.9 8.225 8.100 2.900
13 8.9 33.7 8.425 8.325 0.575
14 6.5 33.9 8.475 8.450 -1.950
15 7.3 --- --- --- ---
16 11.2 --- --- --- ---

 

Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими среднеми. Используем эти оценки для расчета значений сезонной компоненты . Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты :

Расчет скорректированной сезонной компоненты

Показатели Год № квартала,
I II III IV
  1 --- --- -1.2 2.488
2 0.45 -2 -1.063 2.625
3 0.7 -2.175 -1.388 2.9
4 0.575 -1.95 --- ---
Всего за i-й квартал   1.725 -6.125 -3.651 8.013
Средняя оценка сезонной компоненты для -го квартала,   0.575 -2.042 -1.217 2.671
Скорректированная сезонная компонента,   0.578 -2.039 -1.213 2.674

 

В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должны быть равна нулю.

Для данной модели имеем:

Корректирующий коэффициент:

Рассчитываем скорректированные значения сезонной компоненты  и заносим полученные данные в таблицу.

Проверим равенство нулю суммы значений сезонной компоненты:

 

Исключим  влияние сезонной компоненты, вычитая ее значения из каждого уровня исходного временного ряда. Получим величины . Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

Вспомогательная таблица 3

1 5.5 0.578 4.922 5.853 6.431 -0.931 0.867 3.423
2 4.8 -2.039 6.839 6.053 4.014 0.786 0.618 6.503
3 5.1 -1.213 6.313 6.253 5.040 0.060 0.004 5.063
4 9 2.674 6.326 6.453 9.127 -0.127 0.016 2.723
5 7.1 0.578 6.522 6.653 7.231 -0.131 0.017 0.063
6 4.9 -2.039 6.939 6.853 4.814 0.086 0.007 6.003
7 6.1 -1.213 7.313 7.053 5.840 0.260 0.068 1.563
8 10 2.674 7.326 7.253 9.927 0.073 0.005 7.023
9 8.2 0.578 7.622 7.453 8.031 0.169 0.029 0.722
10 5.5 -2.039 7.539 7.653 5.614 -0.114 0.013 3.423
11 6.5 -1.213 7.713 7.853 6.640 -0.140 0.020 0.723
12 11 2.674 8.326 8.053 10.727 0.273 0.075 13.323
13 8.9 0.578 8.322 8.253 8.831 0.069 0.005 2.403
14 6.5 -2.039 8.539 8.453 6.414 0.086 0.007 0.723
15 7.3 -1.213 8.513 8.653 7.440 -0.140 0.020 0.003
16 11.2 2.674 8.526 8.853 11.527 -0.327 0.107 14.823
Итого             1.876 68.500

 

Определим компоненту  данной модели. Для этого проведем аналитическое выравнивание ряда  с помощью линейного тренда. Результаты аналитического выравнивания следующие:

Подставляя в это уравнение значения , найдем уровни  для каждого момента времени

Найлем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням  значения сезонной компоненты для соответствующих кварталов.

На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.

Фактические и теоретические уровни

 

Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок:

Следовательно, можно сказать, что аддитивная модель объясняет 99.3% общей вариации уровней временного ряда.

 

3) Прогнозное значение  уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда:

Получим:

Значения сезонных компонент за соответствующие кварталы равны:

Таким образом: