접속은 그냥 생성된 VM 아래에 SSH 버튼누르면되고

 

다운로드및 업로드는 저위에 업로드,다운로드 아이콘 누르면됨. 

엄청 간단..!

(파일안에 파일들이 많을때 다운로드가 안되고 그냥 집파일로 만든다음 집파일 절대경로(pwd) 입력해줬더니 다운로드됨)

sudo apt-get install zip unzip
zip test.zip ./*

 

GPU(all region) quota 0->1로 설정했다고 끝이아님. 

 

문제는 다음과같았는데

1) A100 GPU 쓰기위해  기본 아이오와 리전을 선택했더니 이미 꽉 찼다고 안됨

2) 그외 리전을 선택했더니 quota limit 0 이라고 안됨

 

살펴봤더니 앞에서 GPU(all region) quota 0->1로 설정한게 모든 리전에서 할당량이 0->1로 바뀐게 아니였음. 

 

**A100 GPU를 사용할수 있는 리전이 다음과같다고 뜬다.

 

 

IAM -> 할당량 -> 필터 누르고 -> 할당량 : nvidia A100 GPUS 검색하면 아래그림과같이 어떤건 한도가 0 , 어떤간 무제한인걸 확인할수 있다. 

( 아래 그림은 할당 요청한상태라 몇몇개가 1로 바꿔져있는것임. )

할당량 증가해야하는 리전만 선택한다음 -> 위에 할당량 수정 클릭 -> 할당량1 입력한다음 제출하면, 5분안에 할당완료 메일이 온다. 

 

 

GCP에서 처음으로 GPU 인스턴스가 생성되었다. 맨날 용량부족만 보다가 감격......

CLI 연결하기

https://cloud.google.com/sdk/docs/quickstart?hl=ko#linux 참조

  1. 맥 : google-cloud-sdk-367.0.0-darwin-x86_64.tar.gz 다운로드
  2. ./google-cloud-sdk/install.sh 로 설치
  3. ./google-cloud-sdk/bin/gcloud init 로 초기화
  4. gcloud init
  5. 확인용 gcloud auth list / gcloud config list / gcloud info

(** region : 본인은 us-central1-a 사용 )

 

 

이미지 찾기

https://cloud.google.com/deep-learning-vm/docs/images 참조

gcloud compute images list \
        --project deeplearning-platform-release \
        --no-standard-images

ㄴ결과값 너무많아서 보기 힘듬

 

 

cu100-ubuntu-1804 를 검색 (cuda10, ubuntu18 )

⇒ ‘common-cu100-ubuntu-1804’

아래 명령어로 해당 인스턴스 검색 (cuda10 깔려있고, 텐서플로우는 없는듯하다)

gcloud compute images describe-from-family common-cu100-ubuntu-1804 \
    --project deeplearning-platform-release

 

 

GCP 는 region 마다 사용가능한 GPU가 모두 다르다. 아래 링크에서 확인가능

https://cloud.google.com/compute/docs/gpus/gpu-regions-zones

 

 

사용하기 앞서서 본인 GPU quotas 할당량을 살펴보면 , 그와중에 어디는 허용이고 어디는 허용 불가능이고 해서 region -> 사용가능한 GPU 뭐있나 -> 해당리전의 GPU quotas =1 인지  하나하나 맞춰보기 너무 헷갈리고 에러도 나고 해서

리전에서 사용가능한 GPU를 모두 사용할수있게 신청했다.

 

 

 

IAM -> Quotas 들어가서 GPU(all region) 검색후 선택 -> 할당량 수정 누름된다.

사용하려는 이유를 함꼐 써서 제출하면 된다.

 

보냈는데 1분안에 답이 왔다.

 

 

그럼 전에는 한도가 0 이였던게 요청후에는 1로 늘어나있는거러 확인가능하다.

+ Recent posts