[데이터자격시험용-필수요약정리]

빅데이터 탐색 - 통계기법이해

indongspace 2024. 3. 31. 21:39

 

기술통계와 추론통계

 

1) 기술통계 : 데이터의 모습을 정리/요약/묘사

2) 추론통계 : 표본의 통계량을 기초로 모집단의 특성을 추론/검정

 

기술통계(descriptive statistics)

데이터의 중심(중심경향도)

- 평균(mean)

- 중앙값(median)

- 최빈값(mode)

 

데이터의 산포(산포도)

- 분산

- 표준편차

- 사분위범위(IQR)

- 범위

- 변동계수

 

데이터의 퍼진 모양

- 왜도(비대칭도)

- 첨도(뾰족한 정도)

 

 

추론통계(Inferential statistics)

추정

- 점 추정

- 구간 추정

 

가설검정

- 귀무/대립가설

- 제1종, 제2종 오류

- 유의수준, 유의확률 등

 

 

모집단과 표본

대표성 : 표본이 모집단을 잘 대표하려면 대표성을 가져야 함

1. 표본의 수 ↑

2. 표본추출 방법

    1) 단순랜덤추출(Simple Random Sampling)

    2) 층화추출(Stratified Random Sampling)

    3) 계통추출(Systematic Sampling)

    4) 집락추출(Cluster Random Sampling)