기억 저장소

클라우드 기반 인공지능 개발과 DevOps 실무

머신러닝 5

머신러닝: Hierarchical clustering,계층적 클러스터링,덴드로그램,Dendrogram

Hierarchical clustering (한글 : 계층적 군집 분석) 은 비슷한 군집끼리 묶어 가면서 최종 적으로는 하나의 케이스가 될때까지 군집을 묶는 클러스터링 알고리즘이다 군집간의 거리를 기반으로 클러스터링을 하는 알고리즘이며, K Means와는 다르게 군집의 수를 미리 정해주지 않아도 된다. 위에 그림은 파일을 불러온 뒤 덴드로그램까지의 코드를 적어놓은 것 이다. import scipy.cluster.hierarchy as sch 라이브러리를 불러와 덴드로그램을 불러 사용하면 된다. 클러스터의 갯수의 경우 임의자(사람)가 임의로 정하기 때문에 덴드로그램을 보고 임의자가 판단하여 클러스터의 갯수를 정하면 된다 . 정한 클러스터의 따라 맞는 데이터들이 정해진 클러스터에 들어가게 된다. 정해진 클러..

머신러닝 : Random Forest , 랜덤 포레스트, 머신러닝 2차원 배열, 1차원,2차원으로 바꾸기 ,

랜덤 포레스트(영어: random forest)는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종으로, 훈련 과정에서 구성한 다수의 결정 트리로부터 부류(분류) 또는 평균 예측치(회귀 분석)를 출력함으로써 동작한다. ** Random Forest 는 결정 트리(Decision Tree) 상위 버전을 생각하면 쉽다. from sklearn.ensemble import RandomForestRegressor 라이브러리 불러오기 1차원인 시리즈 값이 있으면 2차원으로 바꾸준다. 머신러닝,딥러닝은 무조건 2차원인 넘파이를 사용한다. 일반적인 reshape을 사용하면 아래와 같이 에러가 뜨게 된다. (시리즈안에는 reshape 이란 함수를 가지고 있지않다) 그러므로 values 값만 따로 사용한 !!!!..

머신러닝: 기본 설명 , 인공지능&머신러닝&딥러닝

머신러닝으로 할 수 있는 것 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 # supervised 인공지능한테 정답을 알려주며 학습시키는 것. # unsupervised 인공지능이 정답을 모르는 상태로 학습 시키는 것 (고객 분석에 많이 사용 ) # classification =분류 (분류가 가능한거) # prediction = 예측 (수치가 나오는 값) # regression (수치가 나오는 값) # clustering (군집화 (큰 데이터에서 원하는 데이터끼리 묶어서 사용하는 것))