[데이터자격시험용-필수요약정리]

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (5) - 상관분석

indongspace 2024. 6. 19. 20:32

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다.
메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다.
메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고,
좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다.
메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.

 

 

 

 

 

 

 

2. 상관분석

■ 상관관계 분석

  - 정의 : 두 변수간의 선형관계를 분석하는 기법

  - 표현방법 : 공분산, 상관계수

  1. 공분산

 

단점 : 두 변수의 단위에 따라 값의 차이가 크다

이를 개선하기 위해 표준화된 값이 필요함

-> 피어슨 상관계수!

 

 

 

  2. 상관계수

    - 피어슨 상관계수 : -1 <= r <= 1 값을 가짐(연속형 데이터 사용)

    - 절대값이 1에 가까울수록 강한 선형관계를 가짐(+ 양의 상관관계, - 음의 상관관계)

    - "상관계수가 0이다"의 의미는 선형관계(직선관계)가 없다 라는 의미(O)

      "상관계수가 0이다"의 의미가 두 변수간에 관계가 없다(X) - 틀린 말

      *상관계수가 0이지만 비선형관계(2차식 등)의 관계가 있을 수 있음

 

 

※ 피어슨 상관계수의 유의성 검정(가설검정)

pearsonr(a, b)

 

1. 가설설정

  - 귀무가설(H0) : 상관계수가 0이다(상관관계가 없다)

  - 대립가설(H1) : 상관계수가 0이 아니다(상관관계가 있다)

  ρ = 0  

  ρ != 0

 

  ρ : 모상관계수

 

2. 유의수준(α) 설정 (일반적으로 5%, 0.05)

 

3. 귀무가설 하에 검정통계량 계산

 

4. 검정통계량으로 p-value 계산

 

5. 귀무가설(H0) 기각여부 결정(채택/기각)

  - 유의수준 5% 하에서 P-value 값이 0.05보다 크면 귀무가설 채택

                                     P-value 값이 0.05보다 작으면 귀무가설 기각

즉, 상관관계가 있으려면 P-value 값이 유의수준(α) 보다 작아야 함

 

 

 

 

 

 

이번 강의는 상관분석에 대한 내용이다. 이전 강의와 같이 검정통계량을 구하는 공식과 분석방법에 대한 이해를 돕는 그래프를 보며 공부를 진행하였다.

 

 

 

 

 

 

 

https://www.metacodes.co.kr/edu/read2.nx?M2_IDX=30659&page=1&sc_is_discount=&sc_is_new=&EP_IDX=8343&EM_IDX=8169

 

24년 빅분기 (필기+실기 Python) 최단기 합격패스

 

www.metacodes.co.kr