본문 바로가기
TIL

[TIL] 220118 면접 오답노트 정리

by 다람이도토리 2022. 1. 18.

- 표본오차 (sampling error) : 모집단 전체에 대해서 측정을 할 수 없을때 표본을 뽑아서 데이터를 측정하는데, 이에 의해 생긴 오차를 표본오차라고 한다.

- 신뢰도 : 기본적으로 신뢰도는 표본 평균이, 모평균으로부터 표준 오차 범위 내에 들어갈 가능성을 의미한다.
그런데 모평균을 모른다. 따라서, 이를 관점을 바꿔서 해석하면, 표번 평균으로부터 표준오차 이내의 구간에 모평균이 들어갈 확률을 신뢰도라고 생각하면 된다.

- 카이제곱 검정 다시 이해하기
뭔가, 분포에 대해서 이해를 제대로 하지 못하고 있는 느낌이다.
서비스의 개선이 이루어졌는지, 실제 이어졌는지 확인을 위해서 '동질성 검정'을 실시할 수 있을 것이다...

동질성 검정은 기본적으로 두 개 이상의 범주형 자료가 동일한 분포를 갖는 집단에서 추출되었는가를 본다.!

즉 예를 들어, 서비스 개선 이후 평점의 변화 등을 분석할 때 유의미하게 변화하였는지 보기 위해 동질성 검정등을 적용할 수 있을 것이다.

- (추가) SVM에 대해 간단하게 설명 복습

SVM은 분류 문제에 사용할 수 있는 모델로, 분류를 위한 기준 선을 결정한다.

결정 경계의 경우는, 데이터군들로부터 최대한 멀리 떨어지는 것이 좋다. 
Support Vector Machine, SVM에서 Support Vector 의미 자체가 결정 경계와 가장 가까이 있는 데이터 포인트 들을 의미한다. 데이터군들로부터 최대한 멀리 떨어진 정도는 Margin으로 표현되며, Margin이란 결정 경계와 서포트 벡터 사이의 거리를 의미한다. 즉, 최적의 결정 경계는 마진을 최대화한다.

 

'TIL' 카테고리의 다른 글

[TIL] 토큰 기반 인증, JWT 개념  (0) 2022.02.15
[TIL] 220119 O 면접 후기  (0) 2022.01.19
[TIL] Y 1차 면접 후기  (0) 2022.01.18
[TIL] N 과제/면접후기  (0) 2021.12.28
[TIL] Python으로 시간 다루기  (0) 2021.11.02