Изучение временных рядов

Сезонность, тренд и прогноз: что нужно знать

A
Автор: Anthony Cabos
Обновлено больше недели назад

этой статье подробно рассматривается исследование временных рядов. Цель этого исследования - проанализировать поведение этих рядов, чтобы понять их составляющие и сделать прогнозы.

Определение

Временной ряд - это набор данных, который представляет эволюцию явления во времени. Он характеризуется:

  • Компонент 1, тенденция: общая эволюция серии

  • Компонент 2, сезонность: изменение значений за определенный период времени (неделя / месяц / год).

  • Компонент 3, шум (или остаток): события, которые невозможно предсказать.

Из трех вышеперечисленных компонентов и правильного выбора статистической модели можно обобщить данные и спрогнозировать будущее.

Как выбрать свою модель?

Существует два основных типа моделей:

  • Аддитивная модель, в которой мы суммируем три компонента.

  • Мультипликативная модель, в которой мы умножаем три компонента.

Чтобы выбрать, какую модель использовать, вы должны наблюдать, увеличивается или уменьшается сезон по тренду.

Это наблюдение можно сделать следующим образом:

  • Соедините максимумы между ними.

  • Соедините минимумы между ними.

  • Изучите параллелизм между двумя линиями.

  • Если линии параллельны, аддитивная модель является наиболее подходящей, если линии расходятся, следует выбрать мультипликативную модель.

Примеры применения этих моделей:

В приведенном выше примере мы видим для примера слева, разница между двумя строками остается примерно такой же. Так что аддитивная модель является наиболее подходящей.

Статистическая методология разложения

Таким образом, временной ряд можно разбить на 3 компонента.
В аддитивной модели мы начинаем с вычисления тренда. Его можно оценить несколькими способами с помощью параметрического метода (введите расчет методом наименьших квадратов ). Линия тренда может, в зависимости от модели, быть:

  • линейный: y = a t + b

  • квадратичный / порядок 2: y = a t² + bt + c

  • экспоненциальный: y = a exp (wt)

  • ARIMA : для нестационарных рядов.

Для сезонности цель состоит в том, чтобы найти закономерность, которая повторяется с временной частотой. Мы должны удалить составляющую тренда и различать период сезона и его причину.

Шум, в котором остаток - это то, что осталось после удаления тренда и сезонных компонентов. Обычно оценивается как гауссовский белый шум .

Примечание. Для мультипликативной модели мы можем уменьшить до аддитивной модели, взяв натуральный логарифм временного ряда и, таким образом, до его предыдущего разложения

Мы можем оценить долю каждого из этих компонентов, вычислив дисперсию последнего и дисперсии временного ряда. Математически дисперсия объясняет отклонение кривой от среднего. Из дисперсии временного ряда и его компонентов, мы можем вычислить долю дисперсии каждого из этих компонентов. Чем больше доля дисперсии компонента, тем лучше он объяснит явление. Таким образом, рынок с сильной сезонностью будет иметь сезонную составляющую с высокой дисперсией.
Примечание. Сумма частей дисперсии трех компонентов не равна 100% (сумма квадратов не обязательно равна квадрату суммы). Однако его можно перебазировать до 100%.

Применение прогнозной модели

Когда три компонента временного ряда определены, теперь можно построить прогнозную модель.
Определены три части временного ряда, можно рассчитать его, прокручивая дни (мы рассчитываем модель на один день после даты окончания).
Очень важно выполнить декомпозицию временного ряда, чтобы впоследствии добиться наиболее точного прогноза.

Нашли ответ на свой вопрос?