본문 바로가기

반응형

파이썬공부

[Python] describe() 결과값 해석하는 법 | 기술 통계량 파이썬 공부를 하다보면 자주 만나게 되는 describe 함수 데이터 분석에서 유용하게 사용되는 메소드이다. 이 describe 메소드가 반환하는 결과를 해석하는 법을 공부했다. 인터넷의 예제를 따라치면서 공부하다가 describe를 해서 dataset 결과를 확인했다. 아 이게 뭐야.. 대체 모르겠다. 보통 describe를 실행하면 count, min, max, sum 등이 나올걸 예상했는데 신기한 feature 들이 있다. 각각의 의미를 살펴보자 count : 말그대로 각 필드값의 개수이다. unique : 각 필드의 고유값의 개수이다. 이 개 맞는 말이면 class 라는 필드는 딱 2개의 고유값을 가진 것이 된다. dataset.head() dataset['class'] # class 행만 가져오.. 더보기
해쉬 함수 HASH FUNCTION 해시(Hash) - 검색 키를 통해 배열에서 값을 찾는 함수 - 임의의 길이의 데이터를 고정된 길이의 데이터로 매핑 하는 함수 - 해시 테이블 : 해시가 사용하는 키와 값이 저장된 데이터 자료 구조 ex ) index가 키 값이 되는 Hash Table - 큰 파일에서 중복되는 레코드를 찾을 수 있기 때문에 매우 빠른 데이터 검색을 위한 소프트웨어에 사용됨 #hash table 나머지법 size = 500 hashtable = [] import random random.seed(40) for i in range(tablesize): hashtable.append(random.randint(1000,9999)) ht = [0]*tablesize * 충돌처리 #Code 나머지법 #Hash Function d.. 더보기
지도학습 tree 분류기 #Decision Tree Review from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier import pandas as pd iris = load_iris() #iris.target=pd.get_dummies(iris.target) #iris.target=iris.target.idxmax(axis=1) X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=11) # 학습 mod.. 더보기
[파이썬 머신러닝 완벽가이드] 파이썬 머신러닝 개요 및 SW 설치 * 파이썬 기반 머신러닝의 특징 및 장점과 구성요소 1) R과 Python 비교 - 통계 분석 관점 R : 통계분석 측면에서 더 나음. Python : 라이브러리가 굉장히 많음 이제 머신러닝을 시작하려는 사람이라면, R보다는 파이썬 권장 2) ML(Maching Learning) + Python 강점 - 뛰어난 확장성, 연계, 호환성 - 분석 영역을 넘어서 ML 기반의 Application 개발이 쉽게 가능 - 기존 Application 과의 연계도 쉬움 (서로 다른 언어로 개발된 Application의 경우 REST API) * REST API(RESTful API, 레스트풀 API)란 REST 아키텍처의 제약 조건을 준수하는 애플리케이션 프로그래밍 인터페이스를 뜻함 3) Deep Learning 으로.. 더보기

반응형