brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Feb 04. 2023

26탄-15. 민감 데이터 검색 Amazon Macie

S3에 있는 개인정보나 민감정보를 Macie로 찾아보자.


<1> Amazon Macie?

<2> 테스트

<3>  지원되는 스토리지 클래스 4가지  (2023년  1월 현재)

<4> 비용

<5> 아쉬운점

<6> Amaon Macie 워크숍



<1> Amazon Macie?


1

기계 학습 및 패턴 일치를 사용하여 민감한 데이터를 검색

데이터 보안 위험에 대한 가시성 제공 및 데이터 보호 하는 서비스


2

기본적으로  S3에 통합되어 있다.


3

오가니 데이션을 지원한다.

다른 계정도 확인할 수 있다.


4

이벤트 허브나 시큐리티 허브에 전달하는 기능도 제공한다.



<2> 테스트


1

S3 버킷에 민감정보가 있는 파일 2개를 올려보자.

주민번호, 휴대전화 번호


2

사용자 지정 데이터 식별자 생성 하자 - 주민등록 번호

사용자 지정 데이터 식별자 생성 하자 - 휴대전화 번호


3

S3 버킷 선택


4

S3 검토 및 예상 비용 확인


5

검색 작업을 실행한 범위 구체화.

일별, 주별, 월별 등 지정한다.


6

Sampling Depth?

분석할 S3 객체의 비율을 지정한다.

1000개 중 80% 라면 800개 분석한다.

객체가 일관성 있는 데이터라면 비율을 낮춰 비용을 낮춘다.


7

관리형 데이터 식별자 선택

민감한 데이터 카테고리  전체 또는 선택  


8

사용자 지정 데이터 식별자 선택 가능하다.

 주민등록 번호, 휴대전화 번호 식별자를 선택한다.


9

허용목록 선택 - 허용 목록 선택.


10

작업 이름 입력

제출


11

작업의 상태 확인

결과 표시 버튼을 통해 결과를 볼 수 있다.



<3>  지원되는 스토리지 클래스 4가지  (2023년  1월 현재)


1

S3 Standard

S3 Standard-IA

S3 Intelligent-Tiering

S3 On Zone-IA


지원되지 않는 스토리지 클래스는 건너뛰고 지원하지 않는 스토리지라고 나온다.


2

지원되는 파일 및 스토리지 형식

빅데이터 -. avro ,. parquet

압축 또는 아카이브 -. gz , gzip , tar , zip

문서- doc , docx, pdf, xls , xlsx

텍스트 - csv , htm, html , json, jsonl, tsv, txt , xml 및 기타



<4> 비용


30일 무료 평가판 제공

서울 리전 제공

버킷/월  비용 - 버킷당 0.1 달러 비용

매월 데이터 검사  비용 - 처음 50, TB/월 GB당 1.15 달러  

자동화된 데이터 검색 개체 모니터링 비용



<5> 아쉬운점


한국에 맞는 키워드는 아직 미지원이라  사용자  식별자를 사용해야 한다.

검색 결과 확인 시 어떤 규칙에 의해 어떤 오브젝트에서 검출되었는지 알 수 있지만 , 오브젝트 내에 어떤 부분에서 탐지되었는지는 결과잧에서 직관적으로 알기  어렵다.



<6> Amaon Macie 워크숍


https://catalog.us-east-1.prod.workshops.aws/workshops/9982 e0 dc-0 ccf-4116-ad12-c053 b0 ab31 c6/en-US




다음 과정

https://brunch.co.kr/@topasvga/2998


감사합니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari