Kaggle에 있는 데이터셋을 직접 다운로드 해서 업로드하기엔 불편하다
코드로 연결할 수 있는 방법이 없을까 ?
1. 본인 캐글 계정에서 API Token download
Create New API Token 클릭
누르면 kaggle.json 파일이 다운로드 됨
2. colab으로 가서 코드 실행
!pip install kaggle
from google.colab import files
files.upload()
파일선택에서 앞서 받은 kaggle.josn 파일을 업로드
* 파일 업로드 정상 처리 확인
ls -1ha kaggle.json
다운받은 kaggle.json 파일이 나오면 정상임
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
# Permission Warning 이 일어나지 않도록
!chmod 600 ~/.kaggle/kaggle.json
# 본인이 참가한 모든 대회 보기
!kaggle competitions list
리눅스 명령어는 정확히 모르겠다
뭔가 경로를 만들고
내가 참가한 대회까지 조회해볼 수 있다
https://www.kaggle.com/yhuan95/face-recognition-with-facenet
내가 불러오려는 Face Recognition with FaceNet 이라는 kaggle 주소인데
이상하게 Data 에 API 가 안보였다
능력자 선배님께 여쭤보니
INPUT 아래 Data Sources 아래 있는 리스트를 누르면
요런게 보이는데 알고보니 해당 kaggle 예제에서 쓰는 원본 dataset이 여기에 있나보다
5 Celebrity Faces Dataset 클릭하면
https://www.kaggle.com/dansbecker/5-celebrity-faces-dataset
이 링크로 넘어가고
New Notebook 옆에 땡땡표시가 있다 그걸 누르면 Copy API command 를 클릭하면 API 가 복사된다
요렇게 제대로 다운 된걸 확인할 수 있다
이제 unzip으로 데이터를 내려받기만 하면 된다
!unzip 5-celebrity-faces-dataset.zip
데이터 압축풀기로 끝 !!
'IT 로그' 카테고리의 다른 글
머신러닝 왕초보 - 붓꽃 품종 예측 (1) | 2021.12.10 |
---|---|
ORACLE JOB 깔짝이기 (0) | 2021.12.03 |
Computer vision - Object Detection (객체탐지) (0) | 2021.12.01 |
해쉬 함수 HASH FUNCTION (0) | 2021.11.15 |
기계학습 분류모형 (0) | 2021.11.11 |