기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

Axis 3

파이썬 : NaN 파악, NaN개수, NaN컬럼, NaN 삭제, NaN변경

.isna() 를 사용하면 값들 중 NaN이 있다면 True 로 표시해준다. 컬럼별로 NaN의 갯수를 확인하려면 .isna().sum()을 이용하면 컬럼별로 NaN을 확인할 수 있으면 데이터 프레임 전체로 비어있는 항목의 갯수를 알고 싶을때는 isna(),sum().sum()을 통해 전체의 비어있는 갯수를 알수있다. NaN을 삭제하는 방법 중 하나로 .dropna()를 통해 삭제할 수 있으며, .dropna()를 통해 삭제시 NaN이 포함된 행의 경우는 표시되지 않는다. .dropna(axis=(0또는 1)) 등을 통해 행과 열 중에 선택하여 표시하지 않을 수 있다. 2번째 방법으로는 fillna()가 존재한다. fillna()의 경우 NaN을 다른 문자열 또는 정수로 대체하여 대입할 수 있다.

언어/python 2021.11.19

파이썬 데이터 가공[{인덱스:추가 삭제}, {컬럼 :추가,삭제,변경 }]

행 즉 인덱스를 이용하여 데이터 값을 찾고싶은 경우 .loc[index, columm] (행,열) 을 넣어서 데이터 값을 알아 낼 수 있으며 그 데이터 값에서 바로 데이터 가공이 가능하다. 새로운 Columm을 만드는 경우에는 변수['new columm']=[data(값)] 를 넣어주면 생성되며 새로운 칼럼을 만들 때 사용 되면 data 값을 데이터 가공을 통해서 구할 수 있다. 두개의 데이터프레임을 합치는 경우에는 한개의 데이터프레임에 .append (두번째 데이터프레임) 을 대입하면 된다. ex df=df.append(new_store) axis= 란 행과 열을 표시할 때 사용되며 axis= 0 은 행을 axis = 1 은 열을 뜻한다. .drop()이란 행과 열 중 원하는 부분을 잘라내는 것을 말하..

언어/python 2021.11.18

파이썬: Numpy 정규 분포, random.normal

np.random.normal란 정규 분포를 기반으로 랜덤의 값 중 하나가 나오게 되며 정규 분포의 중간에 가까운 값이 대부분이 나온다. 위에 그림처럼 .max()는 값의 최대값 .min()은 값의 최솟값 .sum() 값을 모두 더한 값 .mean()값의 평균값 .std 위에 그림의 경우 axis은 축을 뜻하며 axis=0은 행을 axis=1은 행을 뜻한다. 예를 들어 X.max (axis=1)는 열의 최댓값을 구하는 뜻으로 나열하게 된다면 array([49,76,92,99]) 라는 값이 나오게 된다. .max() .min() .sum() .mean() .std (axis=)

언어/python 2021.11.17