728x90 반응형 군집분석1 [머신러닝][개념]K-means clustering Clustering Analysis이란? - 여러 집단의 데이터들이 섞여 있고 각 데이터의 소속집단을 모르는 경우 유사한 속성을 갖는 데이터의 군집을 찾는 기법 - 주어진 개체 중에서 유사한 것들을 몇몇의 집단으로 그룹화하여, 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 데이터 분석 방법 목적 * 주어진 데이터를 통해 군집을 잘 구분하는 것이 분석의 최대 목적 - 동일한 군집의 개체들은 유사한 성격을 갖도록한다. - 서로 다른 군집에 속한 개체들 사이에는 상대적으로 서로 다른 성격을 갖도록한다. 유사성과 거리. 군집분석에서는 유사성의 척도로 거리를 사용한다 거리의 종류는 크게 세 가지로 유크리드 거리, 민코우스키 거리, 마할라노비스 거리가 있고 통상적으로 유클리드 .. 2022. 1. 13. 이전 1 다음 728x90 반응형