AWS Sagemaker Studio Data Wangler 실습

<Cloud>/AWS|2022. 12. 27. 22:11
반응형

AWS 가서 10-5시까지 Sagemaker 강의?워크샵? 듣고 왔다.

 

Workshop Studio

 

catalog.us-east-1.prod.workshops.aws

ㄴ 실습링크

 

강의순서는 다음과같았다.

1. Sagemaker Canvas

2. Feature Engineering

3. Bring Your Own Script

4. Bring Your Own Container

 

Sagemaker Canvas는 이전에 해봤던거라 중복이라 패쓰

 

2. Feature Engineering 부분에서 Sagemaker Data Wangler를 사용해서 실습을 진행했어서 이부분만 위주로 살펴보고자함

 

워크샵에서 아래 실습으로 진행했다. 그런데 리뉴얼되면서 중간중간 사진이랑 다른부분이 꽤 많았음. 달랐던 부분만 사진 첨부했다.

 

Workshop Studio

 

catalog.us-east-1.prod.workshops.aws

 

DATA Wrangler가 어디있나 한참 찾았음..ㅋㅋ
아이콘이랑 우클릭이 좀다른데 기본적인 기능은 동일한거같다.
add analysis 하고 저장하면 저렇게 가지가지 생긴다.
설명서에는 줄줄이 소세지처럼 보이지않고 뒤에 4개가 다 모여있다. 그냥 제일긴줄에서 맨뒤에있는거 플러스 클릭하고 진행하면된다

 

데이터 분석은 아래 예시처럼 피처별로, 여러 방식대로 선택해서 볼수 있다.

또 아테나에서 쿼리날려서 볼수도 있음.

 

 

[ Data Wangler 개인적으로 느꼈던점 ]

장점 :

  • 데이터 전처리할때 클릭으로만으로도 진행가능한게 (원핫인코딩,컬럼빼기,데이터합치기등등) 간단해서 좋다.
  • 히스토그램이나 scatter 일일히 피처마다 그리기 귀찮은데 그걸 알아서 클릭만하면 그려주기 때문에 데이터 분석할때 시간적으로 가성비가 진짜 최고인듯하다. (클릭클릭만 하면 꽤 괜찮아보이는 그래프 그려주고 한눈에 보기에도 좋음)

단점 : 

  • 파이썬 코드를 집어넣어서 진행하는 전처리는 사실 쥬피터에서 하는게 더 나아보였다.  
  • 데이터 분석까지는 최고인데 데이터 전처리부분은 사실 완벽하지는 않은 느낌이였음.

 

 

 

그외에 3. Bring Your Own Script, 4. Bring Your Own Container 시간에는 아래 실습을 진행했다.

일단 하라는대로 돌리긴 다돌렸는데 100% 다 이해하진 못했음.

 

Workshop Studio

 

catalog.us-east-1.prod.workshops.aws

 

아직까지는 연구실 서버는 공짜인데 sagemaker 쥬피터랑 콘솔을 쓰면 하나부터 열까지 돈이라 부담스럽고 비싸서 실제로 서버대용으로 사용하지는 못할거같다...

 

 

 

 

[ 그리고 강의에서 공유해주신것들 ]

  • 앵간한 코드는 여기서 복붙하면된다고 알려주신 사이트
 

1. Introduction — Dive into Deep Learning 1.0.0-beta0 documentation

 

d2l.ai

  • 실습링크보다 더 다양한 example이 있어서 참고하라고 알려주심
 

GitHub - aws/amazon-sagemaker-examples: Example 📓 Jupyter notebooks that demonstrate how to build, train, and deploy machine

Example 📓 Jupyter notebooks that demonstrate how to build, train, and deploy machine learning models using 🧠 Amazon SageMaker. - GitHub - aws/amazon-sagemaker-examples: Example 📓 Jupyter notebooks...

github.com

 

반응형

'<Cloud> > AWS' 카테고리의 다른 글

AWS Spot Instance Start  (0) 2024.03.29
[EC2 CLI] aws ec2 run-instances  (0) 2022.07.11
AWS 보안서비스 종류들  (0) 2022.05.19
AWS ECS 간단이해  (0) 2022.05.18
Lamdba Cold start 예방하는 방법 2가지  (0) 2022.05.18

댓글()