군집분석 썸네일형 리스트형 [python] k-means clustering 데이터 분석 공부 정리 k- means 군집 분석의 특징 - 연속형 변수에 활용 가능 - 초기 중심값은 임의로 선택가능 - 장점 : 알고리즘 단순, 빠름, 계층보다 많은 데이터 가능 - 단점 : 군집 수 , 가중치 ,거리 정의 어렵, 결과 해석 어렵, 이상값 영향 큼 from sklearn.datasets import make_blobs # 가상의 데이터셋을 만들어주는 함수 # 필요 데이터 로딩 import pandas as pd import numpy as np import math import scipy as sp import seaborn as sns import matplotlib.pyplot as plt sns.set_palette("Set2") # make_blobx : 보통 클러스링 용 가상데이터를 생성하는데 사용.. 더보기 머신러닝 모형(Machine Learning) 구분 머신러닝(Machine Learning) 모형 구분 지도학습(Supervised Learning) 종속 및 독립변수를 이용하여 주어진 독립변수를 바탕으로 종속 변수 예측 모형 제시 target 라벨값(y값)이 있는 모형 ex) 회귀/ 분류 모형 decision tree , logistic regression [decision tree] [logistic regression] 비지도학습(Unsupervised Learning) Target (종속변수/ 반응변수) 가 없고 독립(설명)변수 간의 관계나 이를 바탕으로 개체를 구분하여 의미 있는 결과 제시 ex) 군집분석, 연관성 분석 [Clustering Analysis] 더보기 이전 1 다음