본문 바로가기
Archive/TIL

[TIL] 0708 아침스터디 / 표본추출 + Python의 랜덤

by 다람이도토리 2022. 7. 8.
표본추출 방법의 가장 큰 분류
- 확률 표본추출 : 모든 대상이 표본으로 선정될 확률을 "동일하게 한 후" 무작위로 표본을 추출
- 비확률 표본추출 : 비확률적 방법으로 표본 추출. 

확률표본추출

단순무작위 표본추출(Simple Random Sampling)
  - 표본을 균등한 확률로 임의로 추출
체계 표본추출(Systematic Sampling)
  - 하나의 표본을 랜덤으로 고른 후, k번째마다 추출
층화 표본추출(Stratified Random Sampling)
  - 모집단을 여러개의 층으로 분류, 각 층에서 표본을 임의추출. 
  - 각 계층은, 게층끼리는 이질성이 있으나, 계층 내에서는 동질성을 유지해야 함.
군집 표본추출(Clustering Sampling)
  - 모집단을 군집으로 나눈 뒤, 군집을 추출하는 방식.(군집에서도 일부 또는 전체 추출)

* 층화 표본추출의 경우는 TVT split에서 stratify option을 생각하면 편하다.

 

비확률표본추출

편의 표본추출(Convenience Sampling)
  - 모집단에 대한 정보가 전혀 없거나 구성요소간 차이가 없다고 판단시, 조사자가 임의로 표본 추출.
판단 표본추출(Judgement Sampling)
  - 조사에 필요한 대상만을 추출, 조사. (대표성 신뢰도 낮음)
  - 표본이 적을 때 사용하기 좋은 방식.
누적 표본추출(Snowball Sampling)
  -  조사 대상을 조사 후, 그 사람의 주변까지 조사하는 방식
할당 표본추출(Quota Sampling)
  -  특정 기준에 따라 모집단을 분리 후, 필요한 대상을 추출. (보통 인구통게적 특성을 고려한 분리)

 

파이썬으로 샘플링하기 / 랜덤추출

https://github.com/SeongwonTak/TIL_swtak/blob/master/DataScience/2022_TIL/0708%20sampling%2C%20random%20number.ipynb

 

GitHub - SeongwonTak/TIL_swtak: Today, I learned.

Today, I learned. Contribute to SeongwonTak/TIL_swtak development by creating an account on GitHub.

github.com