(1) page를 확인하고 올 것
(1) page 의 NaN를 없애주는 방법 후
X 축과 y축 값을 나눠준다.
X(대문자로 쓸것) =>종속변수로 학습시킬 데이터라고 생각하면 된다.
y(소문자로 쓸것) =>독립변수로 학습시킨 후 얻고 싶은 값이라고 생각하면 된다.
카테고리컬 데이터를 확인해준다.
카테리고리컬 데이터를 확인해준 뒤 , 문자되어 있는 데이터를 숫자로 바꿔 줘야하는데
sorted 함수를 통해 문자열을 정렬해준 뒤, 0으로 시작해 순서대로 숫자들을 변환해준다.
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer
라이브러리를 가져온 뒤
LabelEncoder()가 들어있는 변수를 만들어 준 뒤 ,
fit_transform() 안에 문자열 칼럼을 넣어 숫자로 변환 해준 뒤 원래의 컬럼의 저장하여준다.