이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다.
메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다.
메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고,
좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다.
메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.
2. 상관분석
■ 상관관계 분석
- 정의 : 두 변수간의 선형관계를 분석하는 기법
- 표현방법 : 공분산, 상관계수
1. 공분산
단점 : 두 변수의 단위에 따라 값의 차이가 크다
이를 개선하기 위해 표준화된 값이 필요함
-> 피어슨 상관계수!
2. 상관계수
- 피어슨 상관계수 : -1 <= r <= 1 값을 가짐(연속형 데이터 사용)
- 절대값이 1에 가까울수록 강한 선형관계를 가짐(+ 양의 상관관계, - 음의 상관관계)
- "상관계수가 0이다"의 의미는 선형관계(직선관계)가 없다 라는 의미(O)
"상관계수가 0이다"의 의미가 두 변수간에 관계가 없다(X) - 틀린 말
*상관계수가 0이지만 비선형관계(2차식 등)의 관계가 있을 수 있음
※ 피어슨 상관계수의 유의성 검정(가설검정)
pearsonr(a, b)
1. 가설설정
- 귀무가설(H0) : 상관계수가 0이다(상관관계가 없다)
- 대립가설(H1) : 상관계수가 0이 아니다(상관관계가 있다)
ρ = 0
ρ != 0
ρ : 모상관계수
2. 유의수준(α) 설정 (일반적으로 5%, 0.05)
3. 귀무가설 하에 검정통계량 계산
4. 검정통계량으로 p-value 계산
5. 귀무가설(H0) 기각여부 결정(채택/기각)
- 유의수준 5% 하에서 P-value 값이 0.05보다 크면 귀무가설 채택
P-value 값이 0.05보다 작으면 귀무가설 기각
즉, 상관관계가 있으려면 P-value 값이 유의수준(α) 보다 작아야 함
이번 강의는 상관분석에 대한 내용이다. 이전 강의와 같이 검정통계량을 구하는 공식과 분석방법에 대한 이해를 돕는 그래프를 보며 공부를 진행하였다.
'[데이터자격시험용-필수요약정리]' 카테고리의 다른 글
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (완) - 회귀분석 (0) | 2024.06.20 |
---|---|
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (4) - 카이제곱검정 (0) | 2024.06.18 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (3) - 모평균검정 (2) | 2024.06.17 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (2) (0) | 2024.06.16 |
[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (1) (2) | 2024.06.16 |