면접 오답노트를 만든다. 찾아보면서, 충분히 알 수 있던 건데 참 후회스러운 답변도 많다.
두 번 실책하지 않으면 되는거긴 하니까. (근데 카카오 판에서 이런 실책을 하다니)
1. 로지스틱 회귀 계수, x값 의미.
증명 다 해놓고 나 뭐했어.
라고 분명히 대답했으면 x값이 1 증가하면 오즈비가 e만큼 늘어나겠지... 나 뭐한거야... ㅠㅠㅠ
침착하자. 충분히 답할 수 있는 문제였다. 이건. 두번 다신 이런 실수 하지 말자.
2. 중심극한 정리의 의미
큰 수의 법칙과, 중심극한 정리를 완전히 잘못 알고 있었다. 두 개를 거의 동일한 개념으로 이해하고 있었다. 오개념 하나를 드디어 잡을 수 있다!
큰 수의 법칙 : 모집단에서, 무작위로 표본을 뽑을 때, 표본의 크기가 클 수록 그 평균은 전체 모집단의 평균에 가까워진다.
중심극한 정리 : 동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다는 정리이다.
즉, 다시 말해. 모집단에서 표본의 크기가 n인 표본을 여러번 반복해서 추출한다면, 각각의 표본 평균이 이루는 분포는 정규 분포에 가까워 진다. 이 때, 평균은 모집단의 평균으로, 표준편차는 모집단의 평균 / (표본 개수의 제곱근)에 가까워진다...
(설마 아직도 틀렸나)
3. 검정력과 p-value의 관계
검정력과 p-value는 반비례가 아니라고? 음..?
주의해야 한다. 제 1종 오류를 낼 확률이 높아지면, 제 2종 오류를 낼 확률이 낮아지는거다.
실전에서는 그래프를 반대로 연상해서... 검정력과 제 1종 오류의 관계를 반비례라고 대답해버렸다.
제발 그러지 말자. 침착하라고.
4. ROC, AUC
이건 내가 아직 익숙하지 않아 대답하지 못한 부분으로, 아직도 이해가 부족한 부분이다. 별도의 실습 예제와 함께 추가로 정리가 필요하다. 이 부분은 추가 조사 필요.
여담> Feature Selection 기법에 대해 조금 더 알아보고, 규제화도 이런 방법 중 하나가 될 수 있음을 잊지말자.
여담2> SQL 공부의 필요성을 알았다. 바로 공부하자. 먼저.
'Archive > TIL' 카테고리의 다른 글
[0607] TIL (0) | 2021.06.07 |
---|---|
[TIL] 0603 TIL (0) | 2021.06.03 |
[TIL] 0528 TIL (0) | 2021.05.28 |
[DevCourse] 0514 TIL (0) | 2021.05.14 |
[DevCourse] 인공지능 모델의 배포 (0) | 2021.05.09 |