[데이터자격시험용-필수요약정리]

빅데이터 결과해석 - 분석모형평가(군집분석 및 기타 성능지표)

indongspace 2024. 3. 23. 23:13

 

군집분석 평가지표

 

군집 내 데이터는 거리가 짧아야 하고, 군집 간 거리는 멀어야 함

- 던지수 : (군집간 거리의 최소값) / (군집 내 거리의 최대값), 값이 클수록 좋음

- 실루엣 계수는 -1~1 값을 가지며 1에 가까울수록 좋은 군집 모형

 

카파 상관계수

- 두 평가자의 결과값이 일치하는지에 대한 척도로 개발되었다

- 0~1사이 값을 가지며 1에 가까울수록 모델의 성능이 좋다고 할 수 있다

- 모델의 예측값과 실제값이 얼마나 일치하는지 확인할 수 있는 지표이다

- 모형의 평가결과가 우연히 나온 결과가 아니라는 것을 보여주는 지표이다

- 범주형 데이터에 사용

- k값에 따라(0~1사이 값)

   0.8~1.0 : 매우 높은 일치

   0.6~0.8 : 높은 일치

   0.4~0.6 : 보통 일치

   0.2~0.4 : 어느정도 일치

   0.0~0.2 : 일치하지 않음