기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

인공지능/머신러닝

머신러닝 : (2)Page 레이블 인코딩 , Label Encoding , 문자열를 숫자로 변환해주기 , 머신러닝을 위해 숫자 변환

하늘.98 2021. 11. 23. 18:02

(1) page를 확인하고 올 것 

(1) page 의 NaN를 없애주는 방법 후 

X 축과 y축 값을 나눠준다.

X(대문자로 쓸것) =>종속변수로 학습시킬 데이터라고 생각하면 된다.

y(소문자로 쓸것) =>독립변수로 학습시킨 후  얻고 싶은 값이라고 생각하면 된다.

카테고리컬 데이터를 확인해준다.

카테리고리컬 데이터를 확인해준 뒤 , 문자되어 있는 데이터를 숫자로 바꿔 줘야하는데 

sorted 함수를 통해 문자열을 정렬해준 뒤, 0으로 시작해 순서대로 숫자들을 변환해준다.

from sklearn.preprocessing import LabelEncoder, OneHotEncoder

from sklearn.compose import ColumnTransformer

라이브러리를 가져온 뒤 

LabelEncoder()가 들어있는 변수를 만들어 준 뒤 , 

fit_transform() 안에 문자열 칼럼을 넣어 숫자로 변환 해준 뒤  원래의 컬럼의 저장하여준다.