AWS Community Day 참관 사진

2019-01-25

AWS, Community, Day, 참관

AWS Community Day 참관 사진

2019년 1월 25일(금) 오후 1시~6시 세종대 컨벤션 광개토홀에서 진행되었습니다.

세부일정은 이곳에서 확인할 수 있습니다.

행사 세부 일정

인사말

AWS re:Invent 2018를 통해 본 개발자들이 원하는 4가지 클라우드 동향

컴퓨팅 - 다양한 선택의 폭과 낮은 개발 비용
요구사항에 맞는 데이터베이스 선택의 자유
좀 더 자동 및 실용적 AI 플랫폼 제공
미래 산업에 대한 진입 창벽 철폐

AWS 서비스 특징 및 트렌드

PRIMITIVES
FULLY-MANAGED
SERVERLESS

AWS 서비스 특징 및 트렌드

점점 Serverless 쪽으로 이동하고 있다.

마이크로 서비스를 위한 다양한 컨테이너 선택 옵션 제공

사용자 요구에 따라 다양한 옵션을 제공한다.

서버리스 및 컨테이너 구현을 위한 두가지 접근법

Firecracker 아키텍처 및 이점

Firecracker 마이크로 VM은 KVM과 동일한 보안 기능 제공
불필요한 기능을 줄이고 빠른 시작 시간을 위해 설계
컨테이너 및 람다 함수 최적화로 125ms 이내
초당 150개 부터 수 천개까지 동시에 VM 생성 가능

다양한 데이터베이스 선택 옵션 제공

진정한 데이터베이스 자유를 위한 시점 도래

모든 개발자를 위한 인공 지능 도구 제공

Amazon SageMaker - 손쉬운 기계 학습 모델 생성, 훈련 및 서비스 배포 완전 관리 서비스

인공지능/딥러닝 세션을 들었는데, 거의 SageMaker에 대한 이야기였습니다.

Amazon SageMaker Ground Truth

Amazon SageMaker RL

AWS RoboMaker - 지능형 어플리케이션 손쉽게 개발, 테스트 및 배포 서비스

AWS Ground Station - 우주 산업 서비스

딥러닝@EDM페스티발, 누가누가 잘노나?

AWS DeepLens 소개

Amazon SageMaker 소개

딥렌즈 아키텍처

구성도

결과

데이터 라벨링 노가다는 이제 그만

Amazon SageMaker Ground Truth

머신러닝과 Amazon SageMaker
데이터와 라벨링 작업
Amazon Sagemaker Ground Truth 소개
Amazon Sagemaker Ground Truth 속의 데이터과학

머신러닝과 Amazon Sagemaker

Build

사전에 빌드된 Jupyter 노트북 인스턴스
Tensorflow, mxnet, Pytorch, Glueon 등 머신러닝을 위한 환경 구성되어 있음
최적화된 머신러닝 알고리즘 제공
자신만의 환경 셋업도 가능

Train

학습을 위한 클러스터 구성 및 관리
여러 인스턴스를 사용할 수 있는 분산 학습 알고리즘
대용량 데이터를 수용할 수 있는 확장성 구조
모델 결과물에 대한 보안

Tune

하이퍼파라미터 최적화 작업 단순화
최적화 작업 병렬처리
기존에 값들을 조정해가며 반복적으로 변경의 효과를 관찰하는 시간과 비용 절감

Deploy

추론을 위한 인스턴스 구성 및 관리
확장성 있는 추론 API
모델 버져닝과 성능추적
엔지니어링 노력이 필요없는 손쉬운 배포

왜 라벨링 작업은 힘들까?

사람이 이미지에서 색상을 분류하는 것은 쉽다.
사람이 수천/수만장의 이미지의 색상을 분류하는 것은 어렵다.
AWSKRUG Hands-on Lab 2018 - 색상분류모델 만들기
https://github.com/yansonz/2018-handson-data-02

그럼에도 불구하고 왜 라벨링 작업은 중요할까?

좋은 ML모델이 좋은 결과를 이끄는 만큼 좋은 학습 데이터가 좋은 결과를 만든다.

Imagenet: 14M 이미지, 22K 카테고리
Microsoft COCO: 33K 이미지, 80 카테고리
MNIST: 70K 이미지, 10 카테고리
Open Images Datasets: 9M URL 이미지, 5K 카테고리
CIFAR-10: 60K 이미지, 10 카테고리
Fashion-MNIST: 70K 이미지, 10 카테고리

자신의 비지니스 문제를 ML로 해결하기 위해서는 데이터셋을 만드는 때가 온다.

가능한 라벨링 작업

Active Learning 과 Auto Data Labeling

아직 서울 리전에 없습니다.

Labeling Consolidation: Probabilities

SageMaker로 강화학습(RL) 마스터링

Amazon SageMaker

Build

학습 데이터 수집 및 준비
데이터 라벨링 및 일반적인 문제를 위한 기본 노트북
최적화된 머신러닝 알고리즘 제공
모델 및 알고리즘 마켓 플레이스, 고성능 알고리즘 내장

Train

학습을 위한 클러스터 구성 및 관리
고성능 인프라에서 원클릭 학습
모델 학습 및 튜닝
한 번의 학습을 통해 어디서나 실행, 모델 최적화

Deploy

프로덕션 환경에 모델 배포
확장성 있는 추론 API
모델 버져닝과 성능추적
엔지니어링 노려이 필요없는 손쉬운 배포

최신 알고리즘을 사용한 RL 모델 훈련

시뮬레이션 환경 통합

Example: Auto Scaling

목표: 적절한 Scale up & out 을 통해 트랜잭션 손실과 비용낭비를 최소화

Environment: 로드프로필 & 인스턴스
Action: 인스턴스 추가/제거
State: (인스턴스 용량, 실패한 트랜잭션)
Reward: R(인스턴스 용량, 실패한 트랜잭션)

보상(Reward)

Observation, Reward

Training

Momentous for the future

ETCConference

AWS Community Day 참관 사진

AWS Community Day 참관 사진

인사말

딥러닝@EDM페스티발, 누가누가 잘노나?

데이터 라벨링 노가다는 이제 그만

머신러닝과 Amazon Sagemaker

왜 라벨링 작업은 힘들까?

그럼에도 불구하고 왜 라벨링 작업은 중요할까?

SageMaker로 강화학습(RL) 마스터링

목차

Amazon SageMaker

Example: Auto Scaling