import numpy as np import matplotlib.pyplot as plt import pandas as pd 등을 통해 라이브러리를 가져온 뒤 저장되어있는 csv 파일을 read 로 읽어온다 데이터 프레임에 있는 문자열들이 카테고리컬 데이터 인지 확인해준다. NaN를 두가지의 방법 중 하나로 처리해준다. 카테고리컬 데이터는 컬럼이 2개일 경우 Label-Encoding, 3개 이상일 경우 One-Hot-Encoding을 사용해 Dummy variable trap 하였습니다. Label Encoding Label Encoding 이란 알파벳 오더순으로 숫자를 할당해주는 것을 말한다. 글자니까 당연히 알파벳순으로 정렬이 가능 할 것이고... 그 정렬된 기준으로 번호를 매긴다는 뜻. 각설하고..