Автокорреляционная функция и аддитивная модель временного ряда
При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше .
Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.
Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.
Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного рада. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.
Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты ( ) и циклической (сезонной) компоненты ( ).
Существует несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Простейший подход - расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий:
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой , сезонной и случайной компонент. Общий вид мультипликативный модели выглядит так:
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой , сезонной и случайной компонент. Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету значений и для каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги.
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты .
3. Устранение сезонной компоненты из исходных уровней ряда и получение выравненных данных в аддитивной или в мультипликативной модели.
4. Аналитическое выравнивание уровней или и расчет значений с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений или .
6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.
Задача
Имеются условные данные об объемах потребления электроэнергии жителями региона за 16 кварталов.
Требуется:
1. Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.
2. Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).
3. Сделать прогноз на 2 квартала вперед.
Исходные данные
1 | 5.5 | 9 | 8.2 |
2 | 4.8 | 10 | 5.5 |
3 | 5.1 | 11 | 6.5 |
4 | 9.0 | 12 | 11.0 |
5 | 7.1 | 13 | 8.9 |
6 | 4.9 | 14 | 6.5 |
7 | 6.1 | 15 | 7.3 |
8 | 10.0 | 16 | 11.2 |
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
1) Построим поле корреляции:
Поле корреляции
Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу:
Вспомогательная таблица 1
1 | 5.5 | --- | --- | --- | --- | --- | --- |
2 | 4.8 | 5.5 | -2.673 | -1.593 | 4.260 | 7.147 | 2.539 |
3 | 5.1 | 4.8 | -2.373 | -2.293 | 5.443 | 5.633 | 5.259 |
4 | 9 | 5.1 | 1.527 | -1.993 | -3.043 | 2.331 | 3.973 |
5 | 7.1 | 9 | -0.373 | 1.907 | -0.712 | 0.139 | 3.635 |
6 | 4.9 | 7.1 | -2.573 | 0.007 | -0.017 | 6.622 | 0.000 |
7 | 6.1 | 4.9 | -1.373 | -2.193 | 3.012 | 1.886 | 4.811 |
8 | 10 | 6.1 | 2.527 | -0.993 | -2.510 | 6.384 | 0.987 |
9 | 8.2 | 10 | 0.727 | 2.907 | 2.112 | 0.528 | 8.449 |
10 | 5.5 | 8.2 | -1.973 | 1.107 | -2.184 | 3.894 | 1.225 |
11 | 6.5 | 5.5 | -0.973 | -1.593 | 1.551 | 0.947 | 2.539 |
12 | 11 | 6.5 | 3.527 | -0.593 | -2.092 | 12.437 | 0.352 |
13 | 8.9 | 11 | 1.427 | 3.907 | 5.574 | 2.035 | 15.262 |
14 | 6.5 | 8.9 | -0.973 | 1.807 | -1.758 | 0.947 | 3.264 |
15 | 7.3 | 6.5 | -0.173 | -0.593 | 0.103 | 0.030 | 0.352 |
16 | 11.2 | 7.3 | 3.727 | 0.207 | 0.770 | 13.888 | 0.043 |
Сумма | 112.1 | 106.4 | 0 | 0 | 10.507 | 64.849 | 52.689 |
Среднее значение | 7.473 | 7.093 |
Следует заметить. что среднее значение получается путем деления не на 16, а на 15, так как у нас теперь на одно наблюдение меньше.
Коэффициент автокорреляции первого порядка:
Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка:
Вспомогательная таблица 2
1 | 5.5 | --- | --- | --- | --- | --- | --- |
2 | 4.8 | --- | --- | --- | --- | --- | --- |
3 | 5.1 | 5.5 | -2.564 | -1.579 | 4.048 | 6.576 | 2.492 |
4 | 9 | 4.8 | 1.336 | -2.279 | -3.044 | 1.784 | 5.192 |
5 | 7.1 | 5.1 | -0.564 | -1.979 | 1.116 | 0.318 | 3.915 |
6 | 4.9 | 9 | -2.764 | 1.921 | -5.311 | 7.641 | 3.692 |
7 | 6.1 | 7.1 | -1.564 | 0.021 | -0.034 | 2.447 | 0.000 |
8 | 10 | 4.9 | 2.336 | -2.179 | -5.089 | 5.456 | 4.746 |
9 | 8.2 | 6.1 | 0.536 | -0.979 | -0.524 | 0.287 | 0.958 |
10 | 5.5 | 10 | -2.164 | 2.921 | -6.323 | 4.684 | 8.535 |
11 | 6.5 | 8.2 | -1.164 | 1.121 | -1.306 | 1.356 | 1.258 |
12 | 11 | 5.5 | 3.336 | -1.579 | -5.266 | 11.127 | 2.492 |
13 | 8.9 | 6.5 | 1.236 | -0.579 | -0.715 | 1.527 | 0.335 |
14 | 6.5 | 11 | -1.164 | 3.921 | -4.566 | 1.356 | 15.378 |
15 | 7.3 | 8.9 | -0.364 | 1.821 | -0.664 | 0.133 | 3.318 |
16 | 11.2 | 6.5 | 3.536 | -0.579 | -2.046 | 12.501 | 0.335 |
Сумма | 107.3 | 99.1 | 0 | 0 | -29.721 | 57.192 | 52.644 |
Среднее значение | 7.664 | 7.079 |
Следовательно:
Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу:
Коэффициенты автокорреляции
Лаг | Коэффициент автокорреляции уровней |
1 | 0.180 |
2 | -0.542 |
3 | 0.129 |
4 | 0.980 |
5 | 0.987 |
6 | -0.686 |
7 | 0.019 |
8 | 0.958 |
9 | 0.117 |
10 | -0.707 |
11 | -0.086 |
12 | 0.937 |
Коррелограмма
Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать выводы о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.
2) Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии.
Разделив полученные суммы на 4, найдем скользящие средние. Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние.
Расчет сезонной компоненты
Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированая скользящая средняя | Оценка сезонной компоненты | ||
1 | 5.5 | -- | -- | -- | -- |
2 | 4.8 | 24.4 | 6.1 | -- | -- |
3 | 5.1 | 26 | 6.5 | 6.300 | -1.200 |
4 | 9 | 26.1 | 6.525 | 6.513 | 2.488 |
5 | 7.1 | 27.1 | 6.775 | 6.650 | 0.450 |
6 | 4.9 | 28.1 | 7.025 | 6.900 | -2.000 |
7 | 6.1 | 29.2 | 7.3 | 7.163 | -1.063 |
8 | 10 | 29.8 | 7.45 | 7.375 | 2.625 |
9 | 8.2 | 30.2 | 7.55 | 7.500 | 0.700 |
10 | 5.5 | 31.2 | 7.8 | 7.675 | -2.175 |
11 | 6.5 | 31.9 | 7.975 | 7.888 | -1.388 |
12 | 11 | 32.9 | 8.225 | 8.100 | 2.900 |
13 | 8.9 | 33.7 | 8.425 | 8.325 | 0.575 |
14 | 6.5 | 33.9 | 8.475 | 8.450 | -1.950 |
15 | 7.3 | --- | --- | --- | --- |
16 | 11.2 | --- | --- | --- | --- |
Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими среднеми. Используем эти оценки для расчета значений сезонной компоненты . Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты :
Расчет скорректированной сезонной компоненты
Показатели | Год | № квартала, | |||
I | II | III | IV | ||
1 | --- | --- | -1.2 | 2.488 | |
2 | 0.45 | -2 | -1.063 | 2.625 | |
3 | 0.7 | -2.175 | -1.388 | 2.9 | |
4 | 0.575 | -1.95 | --- | --- | |
Всего за i-й квартал | 1.725 | -6.125 | -3.651 | 8.013 | |
Средняя оценка сезонной компоненты для -го квартала, | 0.575 | -2.042 | -1.217 | 2.671 | |
Скорректированная сезонная компонента, | 0.578 | -2.039 | -1.213 | 2.674 |
В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должны быть равна нулю.
Для данной модели имеем:
Корректирующий коэффициент:
Рассчитываем скорректированные значения сезонной компоненты и заносим полученные данные в таблицу.
Проверим равенство нулю суммы значений сезонной компоненты:
Исключим влияние сезонной компоненты, вычитая ее значения из каждого уровня исходного временного ряда. Получим величины . Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Вспомогательная таблица 3
1 | 5.5 | 0.578 | 4.922 | 5.853 | 6.431 | -0.931 | 0.867 | 3.423 |
2 | 4.8 | -2.039 | 6.839 | 6.053 | 4.014 | 0.786 | 0.618 | 6.503 |
3 | 5.1 | -1.213 | 6.313 | 6.253 | 5.040 | 0.060 | 0.004 | 5.063 |
4 | 9 | 2.674 | 6.326 | 6.453 | 9.127 | -0.127 | 0.016 | 2.723 |
5 | 7.1 | 0.578 | 6.522 | 6.653 | 7.231 | -0.131 | 0.017 | 0.063 |
6 | 4.9 | -2.039 | 6.939 | 6.853 | 4.814 | 0.086 | 0.007 | 6.003 |
7 | 6.1 | -1.213 | 7.313 | 7.053 | 5.840 | 0.260 | 0.068 | 1.563 |
8 | 10 | 2.674 | 7.326 | 7.253 | 9.927 | 0.073 | 0.005 | 7.023 |
9 | 8.2 | 0.578 | 7.622 | 7.453 | 8.031 | 0.169 | 0.029 | 0.722 |
10 | 5.5 | -2.039 | 7.539 | 7.653 | 5.614 | -0.114 | 0.013 | 3.423 |
11 | 6.5 | -1.213 | 7.713 | 7.853 | 6.640 | -0.140 | 0.020 | 0.723 |
12 | 11 | 2.674 | 8.326 | 8.053 | 10.727 | 0.273 | 0.075 | 13.323 |
13 | 8.9 | 0.578 | 8.322 | 8.253 | 8.831 | 0.069 | 0.005 | 2.403 |
14 | 6.5 | -2.039 | 8.539 | 8.453 | 6.414 | 0.086 | 0.007 | 0.723 |
15 | 7.3 | -1.213 | 8.513 | 8.653 | 7.440 | -0.140 | 0.020 | 0.003 |
16 | 11.2 | 2.674 | 8.526 | 8.853 | 11.527 | -0.327 | 0.107 | 14.823 |
Итого | 1.876 | 68.500 |
Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда с помощью линейного тренда. Результаты аналитического выравнивания следующие:
Подставляя в это уравнение значения , найдем уровни для каждого момента времени
Найлем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов.
На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.
Фактические и теоретические уровни
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок:
Следовательно, можно сказать, что аддитивная модель объясняет 99.3% общей вариации уровней временного ряда.
3) Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда:
Получим:
Значения сезонных компонент за соответствующие кварталы равны:
Таким образом: