[데이터자격시험용-필수요약정리]

빅데이터 탐색 - 통계기법이해(표본추출 방법)

indongspace 2024. 3. 31. 21:46

 

표본추출 방법

 

1. 단순랜덤추출(Simple Random Sampling)

모집단에서 샘플링을 무작위로 함. 규칙없이 랜덤으로

 

2. 층화추출(Stratified Random Sampling)

각각의 층에서 일정비율로 뽑음. ex) 50:50으로 4개 sampling -> 초2 빨2

 

3. 계통추출(Systematic Sampling)

일정한 간격을 두고 데이터를 추출하는 방법

 

4. 집락추출(Cluster Random Sampling)

특정 집락을 선택해서 그 집락을 전수조사 or 일부를 sampling 하는 방법

 

 

 

표본추출 방법(예시)

완제품 표본을 10개 뽑는다고 생각해보자.

1. 단순랜덤추출 : 무작위로 10개 샘플링

2. 층화추출 : 생산 1라인에서 5개, 생산 2라인에서 5개

3. 계통추출 : 생산품 5개 당 1개씩 샘플링해서 10개 샘플링

4. 집락추출 : 생산 1라인에서만 10개 샘플링

 

* 층화추출과 집락추출의 차이

- 층화추출은 집단 내 동질적, 집단 간 이질적

- 집락추출은 집단 내 이질적, 집단 간 동질적