기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

인공지능/머신러닝

머신러닝: Hierarchical clustering,계층적 클러스터링,덴드로그램,Dendrogram

하늘.98 2021. 11. 25. 18:12

Hierarchical clustering (한글 : 계층적 군집 분석) 은 비슷한 군집끼리 묶어 가면서 최종 적으로는 하나의 케이스가 될때까지 군집을 묶는 클러스터링 알고리즘이다

군집간의 거리를 기반으로 클러스터링을 하는 알고리즘이며, K Means와는 다르게 군집의 수를 미리 정해주지 않아도 된다. 

출처 https://guzene.tistory.com/364

위에 그림은 파일을 불러온 뒤 덴드로그램까지의 코드를 적어놓은 것 이다.

import scipy.cluster.hierarchy as sch 

라이브러리를 불러와 덴드로그램을 불러 사용하면 된다. 

클러스터의 갯수의 경우 임의자(사람)가 임의로 정하기 때문에 

덴드로그램을 보고 임의자가 판단하여 클러스터의 갯수를 정하면 된다 . 

정한 클러스터의 따라 맞는 데이터들이 정해진 클러스터에 들어가게 된다.

정해진 클러스터를 다시 데이터 프레임에 넣어주면 된다.