brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Jan 26. 2023

네이버 10탄-네이버의 빅데이터 활용하기 32/35


네이버의 빅데이터를 우리 비즈니스에 활용하기 (Data Box)



<1> 서비스 혁신을 위해 데이터 기반의 의사 결정이 중요

<2> Cloud Data Box라는 종합 솔루션 제공.

<3> Data Box 이용 시 주의할 사항, 잘 이용하기

<4> 성공적인 분석을 위한 제언



<1> 서비스 혁신을 위해 데이터 기반의 의사 결정이 중요


내가 집중해야 할 고객은?

내 고객의 관심사는?

내가 몰랐던 시장은?



<2> Cloud Data Box라는 종합 솔루션 제공.



1

Cloud Data Box?

네이버 데이터 제공  + 분석 인프라 + 고객 데이터 연계 + 전문 파트너를 함께 제공 = Cloud Data Box라는 종합 설루션 제공.


2

Data Box Frame  서비스?

고객이 자사의 데이터를 여러 분석자에게 열림 시키되, 분석자들이 원본 데이터를 임의로 반출할 수 없도록 통제할 수 있는 Data Box Frame이라는 안전한 분석 환경을 만들 수 있습니다.

분석 결과는 고객의 승인을 거쳐 반출할 수도 있다.



<3> Data Box 이용 시 주의할 사항, 잘 이용하기


1

Data Box내에 데이터 보안?

접근 통제

콘솔 접근 - VDI접근, SSL VPN으로 접근.

데이터를 VDI로 옮겨갈 수 없다.



2

10 테라, 20 테라, 30 테라의 데이터이다.

시간은 곧 비용이다.

효과적인 분석이 필요하다.

Parquet 포맷 사용한다.

많은 시간이 필요하다.

데이터 박스의 서비스별로 디렉터리 구조를  잘 알아야 한다.

Hadoop 관련 분석 도구 제공 - Ambari. Hue, ranger, Spark, Pig, Hive   제공.

웹기반 노트북 분석 도구 -  Zeppelin , Jupyter  



<4>  성공적인 분석을 위한 제언


1

샘플 데이터 적극 활용.

데이터가 대용량이므로 적은 데이터 사용하라.


2

분석 사이클을 중첩시켜, 지속적으로 Job을 돌려 사용하라.

여러 잡을 돌려 사용하라.



다음

https://brunch.co.kr/@topasvga/2972


감사합니다.

매거진의 이전글 네이버 10탄-뉴노멀 시대의 초개인화 31/35

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari