네이버의 빅데이터를 우리 비즈니스에 활용하기 (Data Box)
<1> 서비스 혁신을 위해 데이터 기반의 의사 결정이 중요
<2> Cloud Data Box라는 종합 솔루션 제공.
<3> Data Box 이용 시 주의할 사항, 잘 이용하기
<4> 성공적인 분석을 위한 제언
<1> 서비스 혁신을 위해 데이터 기반의 의사 결정이 중요
내가 집중해야 할 고객은?
내 고객의 관심사는?
내가 몰랐던 시장은?
<2> Cloud Data Box라는 종합 솔루션 제공.
1
Cloud Data Box?
네이버 데이터 제공 + 분석 인프라 + 고객 데이터 연계 + 전문 파트너를 함께 제공 = Cloud Data Box라는 종합 설루션 제공.
2
Data Box Frame 서비스?
고객이 자사의 데이터를 여러 분석자에게 열림 시키되, 분석자들이 원본 데이터를 임의로 반출할 수 없도록 통제할 수 있는 Data Box Frame이라는 안전한 분석 환경을 만들 수 있습니다.
분석 결과는 고객의 승인을 거쳐 반출할 수도 있다.
<3> Data Box 이용 시 주의할 사항, 잘 이용하기
1
Data Box내에 데이터 보안?
접근 통제
콘솔 접근 - VDI접근, SSL VPN으로 접근.
데이터를 VDI로 옮겨갈 수 없다.
2
10 테라, 20 테라, 30 테라의 데이터이다.
시간은 곧 비용이다.
효과적인 분석이 필요하다.
Parquet 포맷 사용한다.
많은 시간이 필요하다.
데이터 박스의 서비스별로 디렉터리 구조를 잘 알아야 한다.
Hadoop 관련 분석 도구 제공 - Ambari. Hue, ranger, Spark, Pig, Hive 제공.
웹기반 노트북 분석 도구 - Zeppelin , Jupyter
<4> 성공적인 분석을 위한 제언
1
샘플 데이터 적극 활용.
데이터가 대용량이므로 적은 데이터 사용하라.
2
분석 사이클을 중첩시켜, 지속적으로 Job을 돌려 사용하라.
여러 잡을 돌려 사용하라.
다음
https://brunch.co.kr/@topasvga/2972
감사합니다.