(1) Page 필독!!
NaN를 제거 한 후
3개 이상의 카케고리컬 데이터가 있을 경우 레이블 인코딩으로 학습 시키면 학습이 잘 안되것을 확인하여
One Hot Encoding 을 사용하면 성능이 좋아 사용되고 있다.
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer
라이브러리를 가져온다.
loc 또는 iloc를 통해 원하는 값(X=> 학습시킬 데이터)을 X의 변수로 만들어준다.
아래그럼처럼 하면 쉽게 스케일링 할수 있다.