이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다.
메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다.
메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고,
좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다.
메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.
1. 가설검정 - 카이제곱검정
1. 적합성 검정 : 각 범주에 속할 확률이 같은지?
chisquare(f_obs=a, f_exp=b)
■ 예제로 이해하기 1
랜덤박스에 상품 A, B, C, D가 들어있다고 한다.
랜덤박스에서 100번 상품을 꺼냈을 때, 아래와 같이 상품이 나왔다고 한다면 랜덤 박스에는 상품이 동일한 비율로 들어있다고 할 수 있을까?
가설설정
H0 : 동일한 비율로 들어있다.
H1 : 동일한 비율로 들어있지 않다.
검정통계량
Oi : 관측빈도
Ei : 기대빈도
χ² = 1 + 1 + 4 + 4 = 10
df(자유도) = n - 1 = 3
*n은 항목의 수
p-value 계산
자유도가 3인 χ²분포에서 검정통계량이 10일 때 p-value 값은?
- 0.0186 -> 유의수준 5% 하에서 H0 기각
Q. 검정통계량 χ² 값의 변화는 어떤 의미를 가질까?
가설설정
p1 = p2 = p3 = ...
H0 : 상품 A, B, C, D가 동일한 비율로 들어있다
H1 : not H0 (적어도 하나는 같지 않다)
검정통계량
Oi : 관측빈도
Ei : 기대빈도
χ² 값이 커진다는 건 -> 관측빈도와 기대빈도 값의 차이가 커진다는 의미
1. 검정통계량(χ²) 값이 증가하면 p-value 값이 작아짐
2. 검정통계량(χ²) 값이 증가하면 H0 기각
*참고로 적합성, 독립성 검정은 우측 검정
2. 독립성 검정 : 두 개의 범주형 변수가 서로 독립인지?
chi2_contingency()
■ 예제로 이해하기 2
연령대에 따라 먹는 아이스크림의 차이가 있는지 독립성 검정을 실시하시오.
가설설정
H0 : 두 변수는 서로 독립이다.
H1 : 두 변수는 서로 독립이 아니다.
검정통계량
Oi : 관측빈도
Ei : 기대빈도
χ² = 1.708
df(자유도) = (행 - 1)(열 - 1) = 2
p-value 계산
자유도가 2인 χ² 분포에서 검정통계량이 1.708일 때 p-value 값은?
- 0.426 -> 유의수준 5% 하에서 H0 채택
Q. 검정통계량 χ² 값의 변화는 어떤 의미를 가질까?
가설설정
H0 : 두 변수는 서로 독립이다.
H1 : 두 변수는 서로 독립이 아니다.
검정통계량
Oi : 관측빈도
Ei : 기대빈도
χ² 값이 커진다는 건 -> 관측빈도와 기대빈도 값의 차이가 커진다는 의미
1. 검정통계량(χ²) 값이 증가하면 p-value 값은 작아짐
2. 검정통계량(χ²) 값이 증가하면 H0 기각
*참고로 적합성, 독립성 검정은 우측 검정
이번 강의에서는 범주형 변수들끼리의 관계를 검정할 수 있는 카이제곱 검정방법에 대한 공부를 진행했다.
빅분기 강의를 들으면서 좋았던 부분은 핵심적인 내용들을 이해하기 쉽게 간결하게 잘 설명해 준다는 점이다.
'[데이터자격시험용-필수요약정리]' 카테고리의 다른 글
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (완) - 회귀분석 (0) | 2024.06.20 |
---|---|
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (5) - 상관분석 (0) | 2024.06.19 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (3) - 모평균검정 (2) | 2024.06.17 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (2) (0) | 2024.06.16 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (1) (2) | 2024.06.16 |