개요
회귀모델이 정말 적절했는지를 따져보기 위한 검토 방법중의 하나로 회귀 모델의 기본 가설이 잘 성립했는지를 확인해 보는것이 그 방법이 될 수 있을 것이다 회귀 분석의 기본 가정 4가지에 대해 알아보고 이에 대한 여러 검증 방법 및 시각화 방법에 대해 정리해본다.
선형회귀분석의 가정
선형회귀분석의 기본 4가지 가정은 다음과 같다.
(1) 정규성 : 잔차가 평균이 0인 정규분포를 띈다.
(2) 독립성 : 잔차 사이에는 상관관계가 없이 독립이어야 한다.
(3) 등분산성 : 잔차의 분산은 입력변수와 무관하게 일정해야 한다.
(4) 선형성 : 입력변수와 출력변수 사이에는 선형적인 관계를 띄어야 한다.
주의사항! 여기서 독립변수의 정규성이나 독립성 등을 따지는 것이 아니라 잔차의 정규성, 독립성을 따져야 한다. 조금 직관적으로 생각해보면 잔차에 대해 따지는 것이 회귀분석이 잘 되었는지에 대해 검토하는 과정을 확인하는 것이 조금 더 자연스럽다.
* 자세한 근거를 조금 더 통계적으로 조사 필요.
각각을 확인하는 방법
정규성 - Q-Q Plot 및 각종 정규분포임을 확인하는 통계 test 들..
독립성 - Durbin - Watson 통계량이 있다고 한다... 자세한 학습 필요.
'Archive > TIL' 카테고리의 다른 글
[TIL] N 과제/면접후기 (0) | 2021.12.28 |
---|---|
[TIL] Python으로 시간 다루기 (0) | 2021.11.02 |
[TIL] 나이브 베이즈 다시 이해하기 (0) | 2021.10.05 |
[TIL] Gradient Vanishing 문제와 활성화 함수 (0) | 2021.09.20 |
[TIL] JSON 파일 읽기 (0) | 2021.09.06 |