본문 바로가기

반응형

it

Computer vision - Object Detection (객체탐지) Computer Vision 이란 ? 시각적 세계를 이해하고 컴퓨터를 학습시키는 인공지능 분야 컴퓨터가 카메라와 동영상에서 디지털 이미지와 딥러닝 모델을 사용하여 객체를 정확하게 식별하고 분류하는 학습을 마치면 '관찰' 대상에 반응할 수 있다. Computer Vision 연구 분야 1) 영상의 화질 개선 2) 객체 탐지(Object Detection) : 영상처리와 컴퓨터 비전 분양에서 기본적이면서 많이 활용되는 기술 중 하나 3) 영상 분할(Image Segmentation) 4) 인식(Recognition) 5) 머신 비전 6) 인공지능 서비스 7) 분류 (Classification) Classification : Single object에 대해서 object의 클래스를 분류 Object Detec.. 더보기
해쉬 함수 HASH FUNCTION 해시(Hash) - 검색 키를 통해 배열에서 값을 찾는 함수 - 임의의 길이의 데이터를 고정된 길이의 데이터로 매핑 하는 함수 - 해시 테이블 : 해시가 사용하는 키와 값이 저장된 데이터 자료 구조 ex ) index가 키 값이 되는 Hash Table - 큰 파일에서 중복되는 레코드를 찾을 수 있기 때문에 매우 빠른 데이터 검색을 위한 소프트웨어에 사용됨 #hash table 나머지법 size = 500 hashtable = [] import random random.seed(40) for i in range(tablesize): hashtable.append(random.randint(1000,9999)) ht = [0]*tablesize * 충돌처리 #Code 나머지법 #Hash Function d.. 더보기
Machine Learning - 비지도학습 1. 패턴 : Association Rule 2. 군집 : Classifiacation 3. 그래프 : graph 4. 추천 : recommendation Machine Learning 모형 구분 지도학습 비지도학습 (Unsupervised Learning) target x 1. Association Rule 기저기와 맥주 ? 다수의 거래 내역 각각에 포함된 품목(ITEM)의 관찰을 통해 규칙 발견 인과관계가 있을 수 있지만 해석은 그렇게 하면 안됨 모든 데이터를 Categorical 가정 ( Numeric data에는 적절하지 않음 ) 장바구니 분석에 처음 사용됨 예 : Bread > Milk Lift (향상도) , support, confidence 향상도 의미 : A를 고려한 b의 구매확률을 A를 .. 더보기
지도학습 tree 분류기 #Decision Tree Review from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier import pandas as pd iris = load_iris() #iris.target=pd.get_dummies(iris.target) #iris.target=iris.target.idxmax(axis=1) X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=11) # 학습 mod.. 더보기
텍스트 분석과 데이터 크롤링(Data Crawling) 텍스트 분석 - 텍스트 분석에서는 전처리가 90% 이다 (머신러닝에서는 70% 정도) 텍스트 마이닝 의미있는 패턴을 찾아내거나 통찰력을 얻어내는 방법 구조화 과정이 필수적임 비구조화 텍스트에서 구조화된 데이터 변환 프로세스 텍스트 데이터 / 문서 / 문단 / 문장 / 단어 를 다룸 원-핫 인코딩(One -Hot Encoding) 단어 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 단어의 인덱스에 1의 값을 부여하고, 다른 인덱스에 0을 부여하는 단어의 벡터 표현 방식 전처리 개행문자, 특수문자, 공백 제거 중복표현 제어 이메일, 링크 제거 제목 제거 불용어 (의미가 없는 용어) 제거 조사 제거 한국어의 전처리 전처리 Tokenizing 자연어를 어떤 단위로 살펴볼 것인가 어절 형태소 n-gram W.. 더보기

반응형