[데이터자격시험용-필수요약정리]

빅데이터 모델링 - 분석기법적용 (연관분석)

indongspace 2024. 3. 17. 17:48

 

연관분석(비지도학습)

 

설명

- 장바구니 분석이라고도 함

- if(조건)-then(반응)으로 이루어져 있음

- 물건배열, 카탈로그, 교차판매 등에 활용

 

장단점

- 장점 : 분석결과 쉽게 이해 가능, 사용이 편리함

- 단점 : 품목수가 증가하면 계산이 기하급수적으로 증가함

  1세대 알고리즘(Apriori)개선 -> FP-Growth 알고리즘

 

연관규칙 측도

1. 지지도(Support) : 전체 거래 중, A와 B가 동시에 포함된 거래 비율

 

2. 신뢰도(Confidence) : 항목 A를 포함한 거래 중, A와 B가 동시에 포함된 거래 비율

 

3. 향상도(lift) : 품목 B를 구매한 고객대비 품목 A를 구매하고 품목 B를 구매하는 고객에 대한 확률

 * 향상도 1 : 두 품목 간에 연관성이 없음(A와 B가 서로 독립)

   향상도 1보다 크다 : 품목 B를 구매할 확률보다 A를 구매하고 B를 구매할 확률이 더 높음(연관성)

   향상도 1보다 작다 : A를 구매하고 B를 구매할 확률이 낮음