기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

인공지능/머신러닝

고쳐야 되는 것 머신러닝 : (2)Page 원 핫 인코딩 One Hot Encoding , 문자열를 숫자로 변환해주기 , 머신러닝을 위해 숫자 변환

하늘.98 2021. 11. 23. 18:05

(1) Page 필독!! 

NaN를 제거 한 후 

3개 이상의 카케고리컬 데이터가 있을 경우 레이블 인코딩으로 학습 시키면 학습이 잘 안되것을 확인하여 

One Hot Encoding 을 사용하면 성능이 좋아 사용되고 있다.

from sklearn.preprocessing import LabelEncoder, OneHotEncoder

from sklearn.compose import ColumnTransformer

라이브러리를 가져온다.

loc 또는 iloc를 통해 원하는 값(X=> 학습시킬 데이터)을 X의 변수로 만들어준다.

 

아래그럼처럼 하면 쉽게 스케일링 할수 있다.