기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

언어/python

판다스 seaborn 히트맵, heatmap 히트맵 사용하기, 여러 데이터프레임 수치화 하기

하늘.98 2021. 11. 26. 17:30

히트맵(Heat map)은 2차원 데이터 안에 대응하는 숫자값을 단순하게 보여주는것 뿐만 아니라 

색상의 진한 정도 와 옅은 정도를 이용해 숫자값을 눈으로도 쉽게 비교할 수 있는 차트 모양이다.

 

annot=True로 표기되어 있다.

원하는 서로다른 변수 값을 corr()를 통해 

상관계수를 따져본 뒤 heatmap 상관 관계를 따져본다. 

0.7보다 클경우 강한 양의 상관관계이며

-0.7보다 작을 경우는 강한 음의 상관과계라고 판단한다.

 

주의할 점

1. 연속형(숫자로 표현 가능한) 데이터에 대해서만 상관관계 분석이 가능한점

2. -1부터 1까지의 값으로 상관관계의 크기를 보여준다는 점

3. 증가하는 방향성에 대한 것인지. 인과관계를 의미하지는 않다는 점.

 

corr(),annot=True)   로 표기 되어 있다.

plt.figure(figsize= ()  표의 사이즈 크기를 설정하는 것 

내부 속성중 annot 은 annotation. 각 셀의 값을 표시할지 결정하는 것이고,

fmt 는 annot=True 인 경우에, 숫자 표시를 어떻게 할지에요.

(.2f 는 소수 두번째자리까지 표시하라는 의미입니다.)