brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Nov 10. 2020

 7탄-데이터-Redshift 6/7

<1> Redshift 알아보기

<2> EMR , Redshfit 실습



<1> Redshift 알아보기


데이터베이스와 데이터 웨어 하우스의 차이


1

DW사용시 분석작업과 트랜잭션 작업이 리소스 경합을 일으키지 않습니다.


2

트위터, 페이스북-------판매 데이터 베이스 ------- 광고 ROI분석


3

사용사래

여러 소스의 분류 필요성을 줄여 시간 절감 ---- 의사 결정을 수행하기 쉽도록 해주는것이다.


4

Redshift

 페타 바이트 규모의 데이터를 처리. 처리량을 의미함.  저장소를 의미하지 않음. 대규모 병렬 처리

완전 관리형


5

Redshift 아키텍처


6

처리는 컴퓨팅 노드가 한다.

데이터는 컴퓨팅 노드에 로컬 하드에 있다.


7

예제


8

emr과 redshift 비교 ?

EMR는  비구조화 데이터

Redshift는 구조화된 데이터 , SQL


9

보안 ?

사용자가

ssl true로 하면 보안화 강제화 할수 있다.


VPC보안 그룹을 사용 필요




<2> EMR , Redshfit 실습


https://brunch.co.kr/@topasvga/1228


https://brunch.co.kr/@topasvga/1229


https://brunch.co.kr/@topasvga/1226


https://brunch.co.kr/@topasvga/1284


https://brunch.co.kr/@topasvga/1195


https://brunch.co.kr/@topasvga/1285


https://brunch.co.kr/@topasvga/1231




다음과정

https://brunch.co.kr/@topasvga/1320



https://brunch.co.kr/@topasvga/2698



감사합니다.

매거진의 이전글 7탄-데이터-Spark, Glue 5/7
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari