군집분석 평가지표
군집 내 데이터는 거리가 짧아야 하고, 군집 간 거리는 멀어야 함
- 던지수 : (군집간 거리의 최소값) / (군집 내 거리의 최대값), 값이 클수록 좋음
- 실루엣 계수는 -1~1 값을 가지며 1에 가까울수록 좋은 군집 모형
카파 상관계수
- 두 평가자의 결과값이 일치하는지에 대한 척도로 개발되었다
- 0~1사이 값을 가지며 1에 가까울수록 모델의 성능이 좋다고 할 수 있다
- 모델의 예측값과 실제값이 얼마나 일치하는지 확인할 수 있는 지표이다
- 모형의 평가결과가 우연히 나온 결과가 아니라는 것을 보여주는 지표이다
- 범주형 데이터에 사용
- k값에 따라(0~1사이 값)
0.8~1.0 : 매우 높은 일치
0.6~0.8 : 높은 일치
0.4~0.6 : 보통 일치
0.2~0.4 : 어느정도 일치
0.0~0.2 : 일치하지 않음
'[데이터자격시험용-필수요약정리]' 카테고리의 다른 글
빅데이터 결과해석 - 분석모형평가(교차검증 & 분석모형개선-과적합방지) (0) | 2024.03.24 |
---|---|
빅데이터 결과해석 - 분석모형평가(분석모형진단) (1) | 2024.03.23 |
빅데이터 결과해석 - 분석모형평가(분류성능 ROC curve) (0) | 2024.03.23 |
빅데이터 결과해석 - 분석모형평가(분류성능) (0) | 2024.03.23 |
빅데이터 결과해석 - 분석모형평가(회귀성능) (1) | 2024.03.23 |