본문 바로가기
모두의 인공지능 AI/인공지능 논문리뷰

시계열 데이터 예측 알고리즘 ARIMA vs. SARIMA

by 짠테크파이어족 2023. 5. 26.
반응형

시계열 데이터 예측 알고리즘 ARIMA vs. SARIMA

 




시계열 데이터 예측은 통계 및 데이터 과학의 핵심 문제 중 일부입니다. 일, 월, 년과 같이 일정 시간 간격으로 샘플링한 데이터를 시계열 데이터라고 합니다.시계열 데이터를 기반으로 미래의 가치를 예측할 수 있습니다.

ARIMA와 SARIMA는 둘다 예측을 위한 알고리즘입니다. ARIMA는 과거 값(자기회귀, 이동 평균)을 기반으로 미래 값을 예측합니다. SARIMA는 과거 값을 유사하게 사용하지만 계절성 패턴도 고려합니다. SARIMA는 계절성을 매개 변수로 사용하기 때문에 사이클이 포함된 복잡한 데이터를 예측하는 데 ARIMA보다 더 유리합니다.

 

시계열 데이터 예측 알고리즘 ARIMA vs. SARIMA
시계열 데이터 예측 알고리즘 ARIMA vs. SARIMA [출처: https://commons.wikimedia.org/wiki/File:Random-data-plus-trend-r2.png]


시계열 데이터 예측을 위한 데이터 전처리의 중요성


실제 프로젝트에서는 많은 데이터 전처리와 준비가 필요합니다. 시계열 데이터는 일반적으로 굉장히 지저분합니다. 시계열 데이터 분석을 통한 예측을 하려면 데이터를 먼저 잘 정리해야 합니다. 특히 데이터의 outlier 들은 예측 결과를 왜곡할 수 있으므로 예측으로 넘어가기 전에 outlier 를 식별하고 정규화하는 것이 좋습니다.


* ARIMA: AutoRegressive Integrated Moving Average (이동 평균을 누적한 자기회귀)
* SARIMA: Seasonal ARIMA의 약자로 계절성 부분을 포함한 ARIMA 모형이라고 볼 수 있습니다.


ARIMA 의 한계 

자기 회귀 통합 이동 평균(ARIMA)은 일변량 시계열 데이터를 예측하는 방법입니다. ARIMA의 문제는 반복 주기가 있는 Seasonal 데이터를 지원하지 않는다는 것입니다. Seasonal 데이터는 반복 주기가 있는 시계열입니다. ARIMA는 Seasonal 특성이 없거나 Seasonal 성분이 제거된 데이터(예: 계절적 차이와 같은 방법을 통해 계절적으로 조정)에 적용 가능 합니다.

 


SARIMA는 무엇인가

계절적 자기 회귀 통합 이동 평균(SARIMA 또는 계절적 ARIMA)은 계절 성분이 있는 일변량 시계열 데이터를 지원하는 ARIMA의 확장입니다.  또한 반복주기가 있는 시계열 데이터에 대한 자동 회귀(AR), 차분(I) 및 이동 평균(MA)을 지정하는 세 가지 새로운 하이퍼 파라미터와 계절성 기간에 대한 추가 파라미터를 추가합니다. Seasonal ARIMA 모형은 ARIMA에 추가 Seasonal 항을 포함하여 형성됩니다. 

 

 

SARIMA 구성 방법

SARIMA를 구성하려면 시계열 데이터의 추세 및 Seasonal 요소에 대한 하이퍼 파라미터를 선택해야 합니다.


Trend Elements: Trend Elements 에 관한 파라미터는 ARIMA 모델과 동일합니다. 

  • p: Trend autoregression order.
  • d: Trend difference order.
  • q: Trend moving average order.


Seasonal Elements: ARIMA에 포함되지 않은 4개의 파라미터는 다음과 같습니다:

  • P: Seasonal autoregressive order.
  • D: Seasonal difference order.
  • Q: Seasonal moving average order.
  • m: The number of time steps for a single seasonal period.

SARIMA(p,d,q)(P,D,Q)m


참고문헌


Introductory Time Series with R

https://machinelearningmastery.com/sarima-for-time-series-forecasting-in-python/

https://neptune.ai/blog/arima-sarima-real-world-time-series-forecasting-guide

https://otexts.com/fpp2/seasonal-arima.html

반응형

댓글