확률과 확률변수
1. 표본공간(Sample space) : 실험에 의해 나타날 수 있는 가능한 모든 결과의 집합
2. 사건(Events) : 표본 공간의 부분집합
3. 확률의 개념
- 표본공간의 부분집합인 사건 A의 확률은 표본공간의 원소 개수에 대한 사건 A의 원소 개수의 비율
즉, P(A) = n(A) / n(표본공간), n은 집합에 있는 원소의 수(혹은 경우의 수)
앞 예시에서 앞면이 1번 나올 확률은 P(A) = 2 / 4 = 0.5
4. 확률의 공리
- 확률실험에서 S를 표본공간, A를 사건이라고 하면
5. 확률의 계산
1) 덧셈 법칙 : P(A∪B) = P(A) + P(B) – P(A∩B)
* 서로 배반사건이면 P(A∪B) = P(A) + P(B)
2) 곱셈 법칙
- 사건 A와 B가 독립이면 P(A∩B) = P(A) x P(B)
3) 기타 : P( Ac) = 1-P(A)
6. 조건부 확률 : 한 사건 A가 일어났을 때(표본공간이 바뀜), 사건 B가 일어날 확률
- A가 일어났을 때 B가 일어날 확률 : P(B|A) = P(A∩B) / P(A)
- B가 일어났을 때 A가 일어날 확률 : P(A|B) = P(A∩B) / P(B)
7. 독립사건과 종속사건
1) 독립사건 : 각 사건이 서로 영향을 주지 않음
- 사건 A와 B가 독립이면
P(A∩B) = P(A) x P(B)
P(A|B) = P(A)
P(B|A) = P(B)
2) 종속사건 : 각 사건이 서로 영향을 줌
P(A∩B) = P(B|A)P(A) = P(A|B)P(B)
8. 베이즈 정리 : 사전확률을 사후확률로 전환할 수 있음(사전확률/사후확률의 관계를 나타냄)
P(Ak) : 사건 B가 일어나기 전에 가지고 있던 사건 A의 확률(사전확률)
P( Ak|B) : 사건 B가 발생한 후 갱신된 사건 A의 확률(사후확률)
P(B|Ak) : 사건 A가 발생한 경우 사건 B의 확률
보충설명 : 사건 B가 발생함으로써 사건 A의 확률이 어떻게 변하는지를 표현한 것
새로운 정보가 기존의 추론에 어떻게 영향을 주는지 계속 갱신이 가능함
'[데이터자격시험용-필수요약정리]' 카테고리의 다른 글
빅데이터 탐색 - 통계기법이해(포아송분포/정규분포/균일분포/표본분포) (4) | 2024.04.01 |
---|---|
빅데이터 탐색 - 통계기법이해(확률변수/이산확률분포/베르누이실행) (0) | 2024.03.31 |
빅데이터 탐색 - 통계기법이해(확률표본과 비확률표본/데이터의 중심) (0) | 2024.03.31 |
빅데이터 탐색 - 통계기법이해(표본추출 방법) (0) | 2024.03.31 |
빅데이터 탐색 - 통계기법이해 (0) | 2024.03.31 |