본문 바로가기

반응형

it

[python] k-means clustering 데이터 분석 공부 정리 k- means 군집 분석의 특징 - 연속형 변수에 활용 가능 - 초기 중심값은 임의로 선택가능 - 장점 : 알고리즘 단순, 빠름, 계층보다 많은 데이터 가능 - 단점 : 군집 수 , 가중치 ,거리 정의 어렵, 결과 해석 어렵, 이상값 영향 큼 from sklearn.datasets import make_blobs # 가상의 데이터셋을 만들어주는 함수 # 필요 데이터 로딩 import pandas as pd import numpy as np import math import scipy as sp import seaborn as sns import matplotlib.pyplot as plt sns.set_palette("Set2") # make_blobx : 보통 클러스링 용 가상데이터를 생성하는데 사용.. 더보기
[colab] 코랩 노트에 이미지를 넣는 간단한 방법 Python 구현 환경을 지원해주는 colab markdown을 이용해서 이미지를 넣는 방법을 알게 되서 공유하려고 합니다. 요런식으로 이미지를 colab 노트에 띄우고 싶었어요. 이미지 : ![이미지](이미지위치) 찾아보니까 markdown에 요런식으로 입력해주면 바로 적용됩니다. 여기서 이미지 위치는 다른 tistory의 이미지 주소 복사 버튼을 클릭해서 발췌한 주소를 이용했어요. ![이미지](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcmxhbl%2FbtqEtOGAD1R%2FyGAtV6r4n6IvgpuoKxXAD1%2Fimg.png) 위와 같이 코드를 입력해주고 .. 더보기
[Python] describe() 결과값 해석하는 법 | 기술 통계량 파이썬 공부를 하다보면 자주 만나게 되는 describe 함수 데이터 분석에서 유용하게 사용되는 메소드이다. 이 describe 메소드가 반환하는 결과를 해석하는 법을 공부했다. 인터넷의 예제를 따라치면서 공부하다가 describe를 해서 dataset 결과를 확인했다. 아 이게 뭐야.. 대체 모르겠다. 보통 describe를 실행하면 count, min, max, sum 등이 나올걸 예상했는데 신기한 feature 들이 있다. 각각의 의미를 살펴보자 count : 말그대로 각 필드값의 개수이다. unique : 각 필드의 고유값의 개수이다. 이 개 맞는 말이면 class 라는 필드는 딱 2개의 고유값을 가진 것이 된다. dataset.head() dataset['class'] # class 행만 가져오.. 더보기
w3school 코딩 공부 사이트 추천, 야 ! 너두 코딩 공부할 수 있어 https://www.w3schools.com/ W3Schools Free Online Web Tutorials W3Schools offers free online tutorials, references and exercises in all the major languages of the web. Covering popular subjects like HTML, CSS, JavaScript, Python, SQL, Java, and many, many more. www.w3schools.com w3school 이라는 사이트가 있습니다. HTML, Python, SQL 등 왠만한 프로그래밍 언어의 튜토리얼을 통해 코딩공부를 할 수 있는 사이트입니다. W3School 활용법 1. Tutorials 각 언어의.. 더보기
이미지 인식의 꽃, CNN 학습 데이터 전처리 과정 CNN 데이터 전처리 과정을 정리해보자 ! from keras.datasets import mnist # 케라스 이용 mnist 데이터셋 가져오기 MNIST 데이터 셋 : 손글씨 데이터셋 머신러닝 계의 HELLO WORLD 같은 데이터 셋 데이터 전처리 케라스를 이용해서 간단히 불러올 수 있다. mnist.load_data() 함수로 사용할 데이터를 불러온다 이때 불러온 이미지 데이터를 X로, 이 이미지에 0~9까지 붙인 이름표를 Y_Class로 구분하여 명명 - 학습에 사용될 부분 : X_train, Y_class_train - 테스트에 사용될 부분 : X_test , Y_class_test 1. 케라스 이용하여 mnist 데이터셋 가져오고 제대로 가져왔는지 확인 from keras.datasets i.. 더보기
잠재요인 협업 필터링의 원리를 정리해보자 잠재요인 협업 필터링 : 사용자 - 아이템 평점 행렬에 잠재된 어떤 요인이 있다고 가정하고, 행렬 분해를 통해 그 요인을 찾아내는 방식을 말함 잠재요인이 뭔지 구체적 정의는 어렵다 행렬 분해 ? 원본행렬을 분해한 후 내적 곱 결과를 구한다. 사용자 - 잠재 요인 행렬 / 아이템 -잠재요인 행렬의 전치 행렬 (잠재요인 - 아이템 행렬) 로 분해된 데이터셋을 다시 내적 곱으로 결합하면서 사용자가 예측하지 않은 아이템에 대한 평점을 도출하는 방식을 이용한다. 행렬 분해로 추출되는 잠재요인이 어떤 것인지는 알 수 없지만, 예를 들어 영화 평점 기반의 사용자 - 아이템 행렬 데이터라면 영화가 가지는 장르별 특정 선호도로 가정할 수 있다. 즉, 사용자 - 잠재 요인 행렬은 사용자의 영화에 대한 선호도로, 아이템- .. 더보기
머신러닝 왕초보 - 붓꽃 품종 예측 import sklearn 파이썬에서 가장 만만하게 사용하는 붓꽃 데이터셋 사이킷런을 통해 해당 데이터로 머신러닝 모델을 만들어보자 붓꽃 데이터셋으로 붓꽃의 품종을 classification 해보자 ! 분류는 대표적인 지도학습이다 그러니까 예측하려는 애 (피처: feature) 가 정해져있는 머신러닝이다. 지도학습은 쉽게 말하면 정답이 주어져 있는 데이터로 먼저 컴퓨터를 학습 시킨 다음에 미지의 정답을 예측하는 방법이다. 데이터 세트를 아래 처럼 분류 한다 - 학습을 위한 학습 데이터 set - 머신러닝 모델의 예측 성능 평가를 위한 테스트 데이터 set 바로 코드를 처보자 ! import sklearn 1. sklearn 모듈을 import 한다 from sklearn.datasets import lo.. 더보기
ORACLE JOB 깔짝이기 DBMS_JOB 패키지의 특징 - DBA 권한 필요 없이 사용 가능 - JOB을 추가 또는 변경하는 경우 커밋 실행 없이 자동 커밋 [BROKEN] 특히 오늘은 BROKEN 이라는 키워드를 배웠다 DBMS_JOB.BROKEN ( job IN BINARY_INTEGER, broken IN BOOLEAN, next_date IN DATE DEFAULT SYSDATE ); * 파라미터 설명 JOB : 실행할 JOB의 번호 BROKEN : TRUE - JOB이 BROEKN 된 경우 , FALSE: 정상 상태인 경우 NEXT_DATE : BROKEN이 TRUE 인 경우 무시하고 FALSE 인 경우 다음 실행 시각을 설정 한다 * 예제 BEGIN -- JOB 번호는 100 -- broken된 JOB을 정상 상태로 .. 더보기

반응형