2022 aws 리인벤트에서 알게된걸로
- H100 gpu가 신규gpu로 곧 출시한다고한다 ( https://www.nvidia.com/ko-kr/data-center/h100/ )
- 또 Tao toolkit이라는게 있다는걸 새롭게 알게되었다. (https://developer.nvidia.com/ko-kr/tao-toolkit )
- 또 nemo megatron 이라는것도 새로 출시한다는데 NLP 모델같이 좀많이 큰 모델전용인듯하다.
- TAO Toolkit은 학습과 관련된 hyperparameter들을 수정하여 custom AI model을 생성할 수 있고 또한 CV 모델에서 model pruning을 통해 모델의 전체 크기를 줄일 수도 있다.
TAO Toolkit 이란 ?
TensorFlow 및 PyTorch를 기반으로 구축된 NVIDIA TAO Toolkit은 AI/딥 러닝 프레임워크 복잡성을 추상화하여 모델 트레이닝 프로세스를 가속화하는 NVIDIA TAO 프레임워크의 로 코드 버전입니다.TAO Toolkit을 사용하면 AI 전문 지식이나 대규모 트레이닝 데이터 세트 없이도 전이 학습을 활용하여 NVIDIA 사전 학습 모델을 자체 데이터로 미세 조정하고 추론을 최적화할 수 있습니다.
또한 자신의 데이터로 pretrained model을 fine-turning하고 edge device를 통해 TensorRT 기반 inference를 위해 export 할 수 있는 Python package
Transfer learning 전이학습이란?
cnn으로 학습을 시키기위해서는 엄청나게 많은 양의 데이터가 필요함. 그런데 이걸 처음부터 학습시키기에는 돈과 시간이 부족함. 그걸 해결하기위해 사용한게 전이학습. 이미 많은 데이터를 가지고 pre-trained 모델을 가지고와서 조금 튜닝해서 사용하는것. 적은 데이터를 가지고 추가트레이닝을 시키고 가중치를 미세하게 조정시키거나 마지막 출력게층을 손봐서 조금만 수정하고 이 변경된 레이어만 다시 재트레이닝시키는걸 말함.
TensorRT란?
학습된 딥러닝 모델을 최적화하여 NVIDIA GPU 상에서의 추론 속도를 수배 ~ 수십배 까지 향상시켜 딥러닝 서비스를 개선하는데 도움을 줄 수 있는 모델 최적화 엔진. 흔히들 우리가 접하는 Caffe, Pytorch, TensorFlow, PaddlePaddle 등의 딥러닝 프레임워크를 통해 짜여진 딥러닝 모델을 TensorRT를 통해 모델을 최적화하여 TESLA V100 같은 NVIDIA GPU 에 올린다.
Tao toolkit 예제는 이거 참조하면될듯?
'<Activity> > 2022 AWS REINVENT' 카테고리의 다른 글
2022 AWS Reinvent 참석겸 리스베가스 관광후기 (3) | 2022.12.10 |
---|---|
[끄적끄적] choosing the right accelerator for training and inference (0) | 2022.12.08 |
[끄적끄적] CodeCatalyst (0) | 2022.12.07 |
Deep Racer 간단 실습 (0) | 2022.12.07 |
AWS Sagemaker Canvas 간단실습 (0) | 2022.12.07 |