AWS 가서 10-5시까지 Sagemaker 강의?워크샵? 듣고 왔다.
ㄴ 실습링크
강의순서는 다음과같았다.
1. Sagemaker Canvas
2. Feature Engineering
3. Bring Your Own Script
4. Bring Your Own Container
Sagemaker Canvas는 이전에 해봤던거라 중복이라 패쓰
2. Feature Engineering 부분에서 Sagemaker Data Wangler를 사용해서 실습을 진행했어서 이부분만 위주로 살펴보고자함
워크샵에서 아래 실습으로 진행했다. 그런데 리뉴얼되면서 중간중간 사진이랑 다른부분이 꽤 많았음. 달랐던 부분만 사진 첨부했다.
데이터 분석은 아래 예시처럼 피처별로, 여러 방식대로 선택해서 볼수 있다.
또 아테나에서 쿼리날려서 볼수도 있음.
[ Data Wangler 개인적으로 느꼈던점 ]
장점 :
- 데이터 전처리할때 클릭으로만으로도 진행가능한게 (원핫인코딩,컬럼빼기,데이터합치기등등) 간단해서 좋다.
- 히스토그램이나 scatter 일일히 피처마다 그리기 귀찮은데 그걸 알아서 클릭만하면 그려주기 때문에 데이터 분석할때 시간적으로 가성비가 진짜 최고인듯하다. (클릭클릭만 하면 꽤 괜찮아보이는 그래프 그려주고 한눈에 보기에도 좋음)
단점 :
- 파이썬 코드를 집어넣어서 진행하는 전처리는 사실 쥬피터에서 하는게 더 나아보였다.
- 데이터 분석까지는 최고인데 데이터 전처리부분은 사실 완벽하지는 않은 느낌이였음.
그외에 3. Bring Your Own Script, 4. Bring Your Own Container 시간에는 아래 실습을 진행했다.
일단 하라는대로 돌리긴 다돌렸는데 100% 다 이해하진 못했음.
아직까지는 연구실 서버는 공짜인데 sagemaker 쥬피터랑 콘솔을 쓰면 하나부터 열까지 돈이라 부담스럽고 비싸서 실제로 서버대용으로 사용하지는 못할거같다...
[ 그리고 강의에서 공유해주신것들 ]
- 앵간한 코드는 여기서 복붙하면된다고 알려주신 사이트
- 실습링크보다 더 다양한 example이 있어서 참고하라고 알려주심
'<Cloud> > AWS' 카테고리의 다른 글
AWS Spot Instance Start (0) | 2024.03.29 |
---|---|
[EC2 CLI] aws ec2 run-instances (0) | 2022.07.11 |
AWS 보안서비스 종류들 (0) | 2022.05.19 |
AWS ECS 간단이해 (0) | 2022.05.18 |
Lamdba Cold start 예방하는 방법 2가지 (0) | 2022.05.18 |