기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

언어 65

파이썬 데이터 프레임 / 데이터 억세스, 하는 방법

데이터 프레임에서 데이터 억세스 하는 방법은 크게 3가지를 가지고 있다. 첫번째 방법!!!!!!!!!!!!!!! 인 데이터 변수 앞에 ['원하는 컬럼이름']를 쓰는 방법 또한 컬럼 억세스는 변수 앞에 점을 찍고 컬럼이름을 사용하여도 된다. 가지고 오고 싶은 데이터 억세스가 2개 이상일 경우 리스트[]로 묶어서 불러주면 된다. 데이터 억세스를 가져오는 2번째 방법!!!!!!!! 진한 글씨로 적혀있는 사람이 볼 수있는 인덱스와 칼럼을 이용하여 데이터를 가져오는 방법이 있다. .loc['index(원하는 행)','columms(원하는열)'] 을 사용하면 원하는 자리의 값을 받아 올 수 있다. 원하는 행의 값 전부를 가져오고 싶으면 행만 적으면 된다. ex) df.loc['store1','pants'] 값은 3..

언어/python 2021.11.18

파이썬: 데이터프레임-인덱스 .set_index() , .reset_index()

.set_index()란 기존 데이터프레임에 있는 컬럼 (columms)을 인덱스로 셋팅하는 것을 뜻하며 컬럼이 인덱스로 들어가게 되면 지정한 컬럼을 통해서 값을 알아 낼 수 있다. .reset_index()란 인덱스로 들어간 컬럼을 다시 컬럼으로 빼내오는 함수이다. 컬럼의 순서를 바꾸는 방법! 컬럼의 순서를 바꾸는 방법은 변수[[원하는 값들]]을 넣으면 된다. 이때 첫번째를 감싸고 있는 [] 대괄호는 데이터의 컬럼을 불러오는 것을 뜻하며 두번째 있는 [] 대괄호는 불러온 컬럼들이 두개 이상이여서 리스트 [] 로 묶은 것을 의미한다.

언어/python 2021.11.18

파이썬 데이터 가공[{인덱스:추가 삭제}, {컬럼 :추가,삭제,변경 }]

행 즉 인덱스를 이용하여 데이터 값을 찾고싶은 경우 .loc[index, columm] (행,열) 을 넣어서 데이터 값을 알아 낼 수 있으며 그 데이터 값에서 바로 데이터 가공이 가능하다. 새로운 Columm을 만드는 경우에는 변수['new columm']=[data(값)] 를 넣어주면 생성되며 새로운 칼럼을 만들 때 사용 되면 data 값을 데이터 가공을 통해서 구할 수 있다. 두개의 데이터프레임을 합치는 경우에는 한개의 데이터프레임에 .append (두번째 데이터프레임) 을 대입하면 된다. ex df=df.append(new_store) axis= 란 행과 열을 표시할 때 사용되며 axis= 0 은 행을 axis = 1 은 열을 뜻한다. .drop()이란 행과 열 중 원하는 부분을 잘라내는 것을 말하..

언어/python 2021.11.18

파이썬 | Pandas 인덱스

Pandas 의 장점 Allows the use of labels for rows and columns 기본적인 통계데이터 제공 NaN values 를 알아서 처리함. 숫자 문자열을 알아서 로드함. 데이터셋들을 merge 할 수 있음. It integrates with NumPy and Matplotlib Pandas는 라이브러리로 import dandas as pd 를 통해 불러와서 사용하면 된다. 위에 그림은 1차원 데이터인 series(시리즈)이다. series에는 대입 할 수 있으며 인덱스와 벨류 값을 통해서 위치와 갯수 또한 알 수 있다.

언어/python 2021.11.18

파이썬 : FUNCTIONS 함수

FUNCTIONS 함수란, 재사용 되는 코드 블럭 입니다. Data or arguments 가 전달되고, 결과가 return 됩니다. 우리가 프로그래밍 하다가, 반복되거나 재사용 되는 코드 블럭이 있으면, 이를 함수로 만들면 됩니다. 남들이 이렇게 재사용 잘 되는 함수들을 미리 만들어 놓은 것들도 많습니다. 이를 라이브러리라고 합니다. 함수를 나타내는 정의 def 함수이름 파라미터의 의미 위에 사진과 같이 반복하거나 재사용하는 코드가 있다고 이를 def 를 이용해 함수를 만들어준다. 코드를 만들어 놓으면 1가지의 함수를 통해 편하게 사용할 수 있다.

언어/python 2021.11.18

파이썬: Numpy 정규 분포, random.normal

np.random.normal란 정규 분포를 기반으로 랜덤의 값 중 하나가 나오게 되며 정규 분포의 중간에 가까운 값이 대부분이 나온다. 위에 그림처럼 .max()는 값의 최대값 .min()은 값의 최솟값 .sum() 값을 모두 더한 값 .mean()값의 평균값 .std 위에 그림의 경우 axis은 축을 뜻하며 axis=0은 행을 axis=1은 행을 뜻한다. 예를 들어 X.max (axis=1)는 열의 최댓값을 구하는 뜻으로 나열하게 된다면 array([49,76,92,99]) 라는 값이 나오게 된다. .max() .min() .sum() .mean() .std (axis=)

언어/python 2021.11.17