[데이터자격시험용-필수요약정리]

빅데이터 탐색 - 통계기법이해(사건/확률/베이즈정리)

indongspace 2024. 3. 31. 22:46

 

확률과 확률변수

 

1. 표본공간(Sample space) : 실험에 의해 나타날 수 있는 가능한 모든 결과의 집합

 

2. 사건(Events) : 표본 공간의 부분집합

 

3. 확률의 개념

- 표본공간의 부분집합인 사건 A의 확률은 표본공간의 원소 개수에 대한 사건 A의 원소 개수의 비율

즉, P(A) = n(A) / n(표본공간), n은 집합에 있는 원소의 수(혹은 경우의 수)

앞 예시에서 앞면이 1번 나올 확률은 P(A) = 2 / 4 = 0.5

 

4. 확률의 공리

- 확률실험에서 S를 표본공간, A를 사건이라고 하면

 

5. 확률의 계산

1) 덧셈 법칙 : P(A∪B) = P(A) + P(B) – P(A∩B)

    * 서로 배반사건이면 P(A∪B) = P(A) + P(B)

2) 곱셈 법칙

   - 사건 A와 B가 독립이면 P(A∩B) = P(A) x P(B)

3) 기타 : P( Ac) = 1-P(A)

 

6. 조건부 확률 : 한 사건 A가 일어났을 때(표본공간이 바뀜), 사건 B가 일어날 확률

- A가 일어났을 때 B가 일어날 확률 : P(B|A) = P(A∩B) / P(A)

- B가 일어났을 때 A가 일어날 확률 : P(A|B) = P(A∩B) / P(B)

 

7. 독립사건과 종속사건

1) 독립사건 : 각 사건이 서로 영향을 주지 않음

   - 사건 A와 B가 독립이면

    P(A∩B) = P(A) x P(B)

    P(A|B) = P(A)

    P(B|A) = P(B)

2) 종속사건 : 각 사건이 서로 영향을 줌

    P(A∩B) = P(B|A)P(A) = P(A|B)P(B)

 

8. 베이즈 정리 : 사전확률을 사후확률로 전환할 수 있음(사전확률/사후확률의 관계를 나타냄)

P(Ak) : 사건 B가 일어나기 전에 가지고 있던 사건 A의 확률(사전확률)

P( Ak|B) : 사건 B가 발생한 후 갱신된 사건 A의 확률(사후확률)

P(B|Ak) : 사건 A가 발생한 경우 사건 B의 확률

 

보충설명 : 사건 B가 발생함으로써 사건 A의 확률이 어떻게 변하는지를 표현한 것

                 새로운 정보가 기존의 추론에 어떻게 영향을 주는지 계속 갱신이 가능함