파이썬 판다스 : 시간, 문자열을 시간 단위로, datetime,dateutil from datetime import datetime 를 통해 라이브러리를 불러온 뒤 datetime()에 정수를 넣어 변수 넣으면 datetime으로 시간과 날짜로 표시된다. %Y 년 , %m 달 , % d 날 ,%A 요일 을 뜻하며 문자열에서는 사용 할 수 없다. datetime 또는 문자열은 type으로 확인가능하며 from dateutil import parser 의 라이브러리를 가져오면 문자열을 datetime으로 바꿀 수 있다. 언어/python 2021.11.23
파이썬 판다스 :plot import matplotlib.pyplot as plt import numpy as np 예시) import numpy as np 등을 통해서 라이브러리를 불러온 뒤 np.arange() 를 통해 숫자를 배열 한다. y= 2*x 라는 값을 만들어 준뒤 plt.plot(x,y)등을 통해 위에 그래프를 볼수 있으며 plt.show()를 통해 설명값들을 지워준다. 언어/python 2021.11.22
파이썬 판다스 :시간 문자를 숫자로 변환, datetime, 시간 계산 순차적인 시간을 계산 하고 싶은 경우 pd.date_range() 함수를 통해 문자열상태인 년도/날짜/일 등을 datetime 타입으로 바꿔 순차적으로 일수등을 나타낼 수 있다. datetime 타입으로 바꾼 값을 index로 설정하여 년도/월/일 등을 입력하면 그 날의 값들 또한 알 수 있다. 언어/python 2021.11.22
파이썬 판다스 .head .tail 원하는데이터 판다스 데이터 프레임에서 인덱스 기준으로 맨 앞쪽의 데이터만 보구싶으면 .head () 를 입력하면 5개의 데이터를 보여주며 () 안에 넣는 숫자에 따라 원하는 만큼의 값을 불러 올 수 있다, .tail () 를 입력하면 맨 뒤에 5개의 값을 보여주며 () 안에 넣는 수자에 따라 원하는 만큼의 맨 뒤 기준으로 값을 불러온다. 언어/python 2021.11.22
파이썬 판다스 CSV 가져오기 저장하기 pd.read_csv, pd.to_csv Import pandas as pd를 통해 라이브러리를 가져온 뒤 pd.read_csv('찾는 데이터') 를 통해서 csv데이터를 가져올 수 있다. index_col = 숫자 를 통해 인덱스를 맞출 수 있으며 숫자에 따라 컬럼에서의 값을 가져온다. .to_csv('저장하려는 값') 을 통해 csv를 저장할 수 있다. 언어/python 2021.11.22
Pandas 판다스 # 데이터 타입 알기 # 데이터 행과 열 # 데이터 중앙 값 # 데이터 평균 # 데이터 앞,뒤 #shape #describe #median#info .shape 데이터프레임의 각 행과 열이 몇개를 가지고 있는지 알 수 있으면 첫번째가 행 두번째가 열을 뜻한다. .describe() 각 모든 데이터들의 갯수,평균값,표준편차,최소값,25%,50%,75%,최댓값을 알수있다. .median() 각 컬럼 데이터들의 중앙값을 알 수 있다. .info() 데이터 프레임의 타입을 알 수 있다. 언어/python 2021.11.19
파이썬 : 컬럼의 합, 컬럼의 최댓값, 컬럼의 최솟값, 컬럼의 평균값, 컬럼의 표준편차.sum(), .min(), .max(), .mean(), .std() .sum() 각 컬럼의 최댓값을 알수있다. .sum() 각 컬럼의 합을 알수있다. .max() 각 컬럼의 최댓값을 알수있다. .min() 각 컬럼의 최솟값을 알수있다. .mean() 각 컬럼의 평균값을 알수있다. .std() 각 컬럼의 표준편차 값을 알수있다. -------연습 문제------------- 언어/python 2021.11.19
파이썬 : NaN 파악, NaN개수, NaN컬럼, NaN 삭제, NaN변경 .isna() 를 사용하면 값들 중 NaN이 있다면 True 로 표시해준다. 컬럼별로 NaN의 갯수를 확인하려면 .isna().sum()을 이용하면 컬럼별로 NaN을 확인할 수 있으면 데이터 프레임 전체로 비어있는 항목의 갯수를 알고 싶을때는 isna(),sum().sum()을 통해 전체의 비어있는 갯수를 알수있다. NaN을 삭제하는 방법 중 하나로 .dropna()를 통해 삭제할 수 있으며, .dropna()를 통해 삭제시 NaN이 포함된 행의 경우는 표시되지 않는다. .dropna(axis=(0또는 1)) 등을 통해 행과 열 중에 선택하여 표시하지 않을 수 있다. 2번째 방법으로는 fillna()가 존재한다. fillna()의 경우 NaN을 다른 문자열 또는 정수로 대체하여 대입할 수 있다. 언어/python 2021.11.19