AWS Community Day 참관 사진
2019년 1월 25일(금) 오후 1시~6시 세종대 컨벤션 광개토홀에서 진행되었습니다.
세부일정은 이곳에서 확인할 수 있습니다.
인사말
AWS re:Invent 2018를 통해 본 개발자들이 원하는 4가지 클라우드 동향
- 컴퓨팅 - 다양한
선택의 폭
과낮은 개발 비용
- 요구사항에 맞는 데이터베이스
선택의 자유
- 좀 더
자동 및 실용적 AI 플랫폼
제공 - 미래 산업에 대한
진입 창벽 철폐
AWS 서비스 특징 및 트렌드
- PRIMITIVES
- FULLY-MANAGED
- SERVERLESS
AWS 서비스 특징 및 트렌드
점점 Serverless 쪽으로 이동하고 있다.
마이크로 서비스를 위한 다양한 컨테이너 선택 옵션 제공
사용자 요구에 따라 다양한 옵션을 제공한다.
서버리스 및 컨테이너 구현을 위한 두가지 접근법
Firecracker
아키텍처 및 이점
- Firecracker 마이크로 VM은 KVM과 동일한 보안 기능 제공
- 불필요한 기능을 줄이고 빠른 시작 시간을 위해 설계
- 컨테이너 및 람다 함수 최적화로 125ms 이내
- 초당 150개 부터 수 천개까지 동시에 VM 생성 가능
다양한 데이터베이스 선택 옵션 제공
진정한 데이터베이스 자유를 위한 시점 도래
모든 개발자를 위한 인공 지능 도구 제공
Amazon SageMaker
- 손쉬운 기계 학습 모델 생성, 훈련 및 서비스 배포 완전 관리 서비스
인공지능/딥러닝 세션을 들었는데, 거의 SageMaker에 대한 이야기였습니다.
Amazon SageMaker Ground Truth
Amazon SageMaker RL
AWS RoboMaker - 지능형 어플리케이션 손쉽게 개발, 테스트 및 배포 서비스
AWS Ground Station - 우주 산업 서비스
딥러닝@EDM페스티발, 누가누가 잘노나?
AWS DeepLens 소개
Amazon SageMaker 소개
딥렌즈 아키텍처
구성도
결과
데이터 라벨링 노가다는 이제 그만
Amazon SageMaker Ground Truth
- 머신러닝과 Amazon SageMaker
- 데이터와 라벨링 작업
- Amazon Sagemaker Ground Truth 소개
- Amazon Sagemaker Ground Truth 속의 데이터과학
머신러닝과 Amazon Sagemaker
Build
- 사전에 빌드된
Jupyter 노트북 인스턴스
- Tensorflow, mxnet, Pytorch, Glueon 등 머신러닝을 위한 환경 구성되어 있음
- 최적화된 머신러닝 알고리즘 제공
- 자신만의 환경 셋업도 가능
Train
- 학습을 위한 클러스터 구성 및 관리
- 여러 인스턴스를 사용할 수 있는 분산 학습 알고리즘
- 대용량 데이터를 수용할 수 있는 확장성 구조
- 모델 결과물에 대한 보안
Tune
- 하이퍼파라미터 최적화 작업 단순화
- 최적화 작업 병렬처리
- 기존에 값들을 조정해가며 반복적으로 변경의 효과를 관찰하는 시간과 비용 절감
Deploy
- 추론을 위한 인스턴스 구성 및 관리
- 확장성 있는 추론 API
- 모델 버져닝과 성능추적
- 엔지니어링 노력이 필요없는 손쉬운 배포
왜 라벨링 작업은 힘들까?
- 사람이 이미지에서 색상을 분류하는 것은 쉽다.
- 사람이 수천/수만장의 이미지의 색상을 분류하는 것은 어렵다.
- AWSKRUG Hands-on Lab 2018 - 색상분류모델 만들기
- https://github.com/yansonz/2018-handson-data-02
그럼에도 불구하고 왜 라벨링 작업은 중요할까?
좋은 ML모델이 좋은 결과를 이끄는 만큼 좋은 학습 데이터가 좋은 결과를 만든다.
- Imagenet:
14M 이미지
, 22K 카테고리 - Microsoft COCO:
33K 이미지
, 80 카테고리 - MNIST:
70K 이미지
, 10 카테고리 - Open Images Datasets:
9M
URL 이미지, 5K 카테고리 - CIFAR-10:
60K
이미지, 10 카테고리 - Fashion-MNIST:
70K
이미지, 10 카테고리
자신의 비지니스 문제를 ML
로 해결하기 위해서는 데이터셋을 만드는 때가 온다.
가능한 라벨링 작업
Active Learning 과 Auto Data Labeling
아직 서울 리전에 없습니다.
Labeling Consolidation: Probabilities
SageMaker로 강화학습(RL) 마스터링
목차
- 강화학습(Reinforcement Learning)
- SageMaker RL
- Demo - SageMaker RL & Auto Scaling
- DeepRacer
Amazon SageMaker
Build
- 학습 데이터 수집 및 준비
- 데이터 라벨링 및 일반적인 문제를 위한 기본 노트북
- 최적화된 머신러닝 알고리즘 제공
- 모델 및 알고리즘 마켓 플레이스, 고성능 알고리즘 내장
Train
- 학습을 위한 클러스터 구성 및 관리
- 고성능 인프라에서 원클릭 학습
- 모델 학습 및 튜닝
- 한 번의 학습을 통해 어디서나 실행, 모델 최적화
Deploy
- 프로덕션 환경에 모델 배포
- 확장성 있는 추론 API
- 모델 버져닝과 성능추적
- 엔지니어링 노려이 필요없는 손쉬운 배포
최신 알고리즘을 사용한 RL 모델 훈련
시뮬레이션 환경 통합
Example: Auto Scaling
목표: 적절한 Scale up & out 을 통해 트랜잭션 손실과 비용낭비를 최소화
- Environment: 로드프로필 & 인스턴스
- Action: 인스턴스 추가/제거
- State: (인스턴스 용량, 실패한 트랜잭션)
- Reward: R(인스턴스 용량, 실패한 트랜잭션)