표본추출 방법의 가장 큰 분류
- 확률 표본추출 : 모든 대상이 표본으로 선정될 확률을 "동일하게 한 후" 무작위로 표본을 추출
- 비확률 표본추출 : 비확률적 방법으로 표본 추출.
확률표본추출
단순무작위 표본추출(Simple Random Sampling)
- 표본을 균등한 확률로 임의로 추출
체계 표본추출(Systematic Sampling)
- 하나의 표본을 랜덤으로 고른 후, k번째마다 추출
층화 표본추출(Stratified Random Sampling)
- 모집단을 여러개의 층으로 분류, 각 층에서 표본을 임의추출.
- 각 계층은, 게층끼리는 이질성이 있으나, 계층 내에서는 동질성을 유지해야 함.
군집 표본추출(Clustering Sampling)
- 모집단을 군집으로 나눈 뒤, 군집을 추출하는 방식.(군집에서도 일부 또는 전체 추출)
* 층화 표본추출의 경우는 TVT split에서 stratify option을 생각하면 편하다.
비확률표본추출
편의 표본추출(Convenience Sampling)
- 모집단에 대한 정보가 전혀 없거나 구성요소간 차이가 없다고 판단시, 조사자가 임의로 표본 추출.
판단 표본추출(Judgement Sampling)
- 조사에 필요한 대상만을 추출, 조사. (대표성 신뢰도 낮음)
- 표본이 적을 때 사용하기 좋은 방식.
누적 표본추출(Snowball Sampling)
- 조사 대상을 조사 후, 그 사람의 주변까지 조사하는 방식
할당 표본추출(Quota Sampling)
- 특정 기준에 따라 모집단을 분리 후, 필요한 대상을 추출. (보통 인구통게적 특성을 고려한 분리)
파이썬으로 샘플링하기 / 랜덤추출
'Archive > TIL' 카테고리의 다른 글
[TIL] 0713 아침스터디 - hyperparameter tuning(2) (0) | 2022.07.13 |
---|---|
[TIL] 0711 아침스터디 - Hyper Parameter tuning(1) (0) | 2022.07.11 |
[TIL] 0706 아침 스터디 / t-SNE (0) | 2022.07.06 |
[TIL] 0704 아침스터디 / VIF, LDA (0) | 2022.07.04 |
[TIL] Transformer 간단정리. (0) | 2022.06.08 |