데이터분석독학 썸네일형 리스트형 [python] k-means clustering 데이터 분석 공부 정리 k- means 군집 분석의 특징 - 연속형 변수에 활용 가능 - 초기 중심값은 임의로 선택가능 - 장점 : 알고리즘 단순, 빠름, 계층보다 많은 데이터 가능 - 단점 : 군집 수 , 가중치 ,거리 정의 어렵, 결과 해석 어렵, 이상값 영향 큼 from sklearn.datasets import make_blobs # 가상의 데이터셋을 만들어주는 함수 # 필요 데이터 로딩 import pandas as pd import numpy as np import math import scipy as sp import seaborn as sns import matplotlib.pyplot as plt sns.set_palette("Set2") # make_blobx : 보통 클러스링 용 가상데이터를 생성하는데 사용.. 더보기 이전 1 다음