딥러닝 / Pytorch 교과서 Ch 7.1/7.2 내용 정리
시계열 문제란?
시간에 따라 변하는 데이터를 사용하여 추이 분석.
고전적 방법 : AR, MA, ARMA, ARIMA 사용
최근의 방법 : 딥러닝을 이용한 방법
AR, MA, ARMA, ARIMA
각각에 대한 정확한 이해 보다는, 어떤 개념인지만 간단하게 알아보고 실습을 통해 파악하는데에 중점을 둔다.
AR (Auto Regressive)
자기회귀 모델은, 이전 관측값이 이후 관측 값에 영향을 준다는 아이디어에서 출발한다.
식의 형태를 보면 알수 있듯이, t 시점을 예측하기 위해 t-1 ~ t-p 총 p개의 시점을 활용한다.
MA (Moving Average)
이동 평균의 경우는 오차를 활용하게 된다. 이전 데이터의 오차에서 현재 데이터의 상태를 추론하는 방법이다.
왜 굳이 오차를 생각할까?
시계열에서 보고자 하는 변수의 평균값의 추세를 보는 것 또한 유용하다. 즉, 평균값의 지속적 증가나 감소 상태를 보고자 하는 것이며, 이를 오차를 통해 보게 된다.
즉, 이전 값들의 오차가 다음 데이터에 영향을 준다고 가정하게 된다.
ARMA 모델
AR모델과, MA모델을 더한 것.
ARIMA 모델
위의 모델들은 모두, 정상성이라는 개념을 전제한 상태에서 모델이 설계되어있다.
ARIMA 모델은, 이를 위해 "차분"이라는 개념을 도입한다. 차분은 현재 상태에서 이전 상태를 빼주는 것을 의미한다.
* ARIMA(p, d, q)
- p : 자기 회귀 차수
- d : 차분 차수
- q : 이동 평균 차수
'Archive > 데이터 분석 관련' 카테고리의 다른 글
[Data] Logistic Regression의 이탈도, 성능 측정 (0) | 2022.07.27 |
---|---|
[Data] 군집화 결과 평가 (0) | 2022.07.15 |
[Data] 이상탐지 문제 소개 (0) | 2022.03.27 |
[Data] Imbalanced Data 다루는 Technique 정리 (0) | 2022.03.20 |
[Data] 군집분석 - Gaussian Mixture Model (0) | 2022.03.19 |