배치성 데이터를 처리하고자 한다.
이벤트 로그를 분석하고자 한다.
빠른시간내에 데이터 처리하고자 한다.
대용량 데이터 처리
실시간 데이터 처리
저장장치 S3 사용
Spot Fleets 사용 (다양한 인스턴스사용)으로 비용절감
AutoScaling 사용
시각화 도구 사용
1
서비스 구성도
S3로 받아 EMR로 분석 한다.
ec2-52-79-148-140.ap-northeast-2.compute.amazonaws.com SSH
비용이 나오지 않도록 실습종료후 만들어진 EC2는 반드시 삭제한다.!!!
https://brunch.co.kr/@topasvga/2005