(1) Page 필독!! NaN를 제거 한 후 3개 이상의 카케고리컬 데이터가 있을 경우 레이블 인코딩으로 학습 시키면 학습이 잘 안되것을 확인하여 One Hot Encoding 을 사용하면 성능이 좋아 사용되고 있다. from sklearn.preprocessing import LabelEncoder, OneHotEncoder from sklearn.compose import ColumnTransformer 라이브러리를 가져온다. loc 또는 iloc를 통해 원하는 값(X=> 학습시킬 데이터)을 X의 변수로 만들어준다. 아래그럼처럼 하면 쉽게 스케일링 할수 있다.