본문 바로가기

IT 로그

Kaggle Datast Google Colab으로 불러오기 (우당탕탕)

728x90
반응형

Kaggle에 있는 데이터셋을 직접 다운로드 해서 업로드하기엔 불편하다

 

코드로 연결할 수 있는 방법이 없을까 ?

 

1. 본인 캐글 계정에서 API Token download 

Create New API Token 클릭 

누르면 kaggle.json 파일이 다운로드 됨 

 

2. colab으로 가서 코드 실행 

 

!pip install kaggle
from google.colab import files
files.upload()

파일선택에서 앞서 받은 kaggle.josn  파일을 업로드 

* 파일 업로드 정상 처리 확인 

ls -1ha kaggle.json

다운받은 kaggle.json 파일이 나오면 정상임 

!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
# Permission Warning 이 일어나지 않도록 
!chmod 600 ~/.kaggle/kaggle.json
# 본인이 참가한 모든 대회 보기 
!kaggle competitions list

리눅스 명령어는 정확히 모르겠다 

뭔가 경로를 만들고 

내가 참가한 대회까지 조회해볼 수 있다 

https://www.kaggle.com/yhuan95/face-recognition-with-facenet

 

Face Recognition with FaceNet

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

www.kaggle.com

내가 불러오려는 Face Recognition with FaceNet 이라는 kaggle 주소인데

이상하게 Data 에 API 가 안보였다 

능력자 선배님께 여쭤보니 

INPUT 아래 Data Sources 아래 있는 리스트를 누르면 

요런게 보이는데 알고보니 해당 kaggle 예제에서 쓰는 원본 dataset이 여기에 있나보다 

5 Celebrity Faces Dataset 클릭하면

 

https://www.kaggle.com/dansbecker/5-celebrity-faces-dataset

 

5 Celebrity Faces Dataset

Can you identify faces based on very few photos?

www.kaggle.com

이 링크로 넘어가고

 

New Notebook 옆에 땡땡표시가 있다 그걸 누르면 Copy API command 를 클릭하면 API 가 복사된다 

요렇게 제대로 다운 된걸 확인할 수 있다 

이제 unzip으로 데이터를 내려받기만 하면 된다 

!unzip  5-celebrity-faces-dataset.zip

데이터 압축풀기로 끝 !! 

반응형

'IT 로그' 카테고리의 다른 글

머신러닝 왕초보 - 붓꽃 품종 예측  (1) 2021.12.10
ORACLE JOB 깔짝이기  (0) 2021.12.03
Computer vision - Object Detection (객체탐지)  (0) 2021.12.01
해쉬 함수 HASH FUNCTION  (0) 2021.11.15
기계학습 분류모형  (0) 2021.11.11