프로젝트조이스 '함께 SQL!' 후기
데이터를 분석하기 위해 꼭 어려운 프로그래밍 언어나 머신러닝 알고리즘을 공부해야 하는 건 아닙니다. 내게 필요한 데이터 분석이 무엇인지 이해하고, 데이터를 보는 데 가장 기본이 되는 SQL을 배우는 것만으로도 전략적 의사결정과 업무 효율화에 도움을 줄 수 있죠.
오늘은 SK텔레콤 데이터 애널리스트 이원지 님의 리딩으로 진행되는 프로젝트조이스, <함께 SQL!>의 후기를 전해드리려고 합니다. 헤이조이스 커뮤니티 리포터 김희은 님께서 작성해주신 후기를 통해 데이터의 기본 개념과 내 업무에 적용할 수 있는 데이터 분석을 알아보세요!
대량의 데이터 가운데 내가 원하는 데이터를 뽑고 분석하거나, 관련 부서에 필요한 데이터를 요청하는 능력은 업종에 관계없이 (특히 마케팅 직군에게는) 굵직한 업무역량이 되고 있다. 이러한 데이터 기반 업무에서 기본 Tool이 되는 것은 바로 "SQL(Structured Query Language)"인데, 이 SQL을 한마디로 정의하자면 데이터베이스(데이터의 집합)에 접속하기 위해 컴퓨터상의 문법, 약속된 언어이다.
내가 프로젝트 <함께, SQL>을 신청한 이유는 현업에서 종종 마주하는 불편함 때문이었다. 나는 마케팅본부 소속이라 아침에 출근하면 쿼리나 Dashboard로 제품 관련 공정, 생산현황을 업데이트해서 보곤 한다. 부서에 전입직원이 오는 등 쿼리문을 수정할 일이 있으면 (빠짐없이 필요한 문법을 넣은 것 같은데도) 이상하게 늘 에러가 발생했다. SQL을 배우면 매번 쿼리를 잘하는 다른 사람한테 부탁하지 않아도 되고, 데이터 볼 줄 알는 문과생이라는 있어bility까지 채울 수 있을 것 같았다.
SQL을 배우면 좋은 점
SQL 이 중요한 것은 알겠는데, SQL을 "왜" 해야 하는지 의문이 들 수 있다.
우리가 SQL을 배워야 하는 이유는 5가지로 요약할 수 있다.
먼저, 회사에서의 커뮤니케이션이 쉬워진다. 상부 보고를 준비하기 위해서는 늘 숫자, 데이터가 필요한 법이다. 그럴 때 데이터팀을 찾아가 요청할 때마다 보이는 흔한 풍경은 이러하다.
[데이터를 요청할 때 흔한 풍경]
무슨 데이터를 요청할지 모르겠는데 일단 요청한다
→ 요청하면 오래 걸려서 답답하다
→ 실컷 기다려서 받아보면 원하던 게 아니다
→ 더 자세한 데이터를 받기 위해 다시 요청을 하고 무한 루프를 반복한다.
만약 우리가 그들(데이터 직군, 개발자)의 세계와 언어를 이해한다면,
미스커뮤니케이션과 작업시간이 훨씬 줄어들 수 있다.
두 번째, 전략적 의사결정이 가능하다.
"사람을 움직이는 것은 명확한 숫자"라는 원지님 말에 격하게 공감한다.
상사에게 "A안으로 중요하고 필요하니 진행해야 합니다"라는 말보다는
"A안으로 하시면 00% 수익 개선, N명의 고객 유치가 가능합니다"라는 말이 훨씬 설득력 있다.
SQL을 통해 필요한 데이터를 추출한 다음, 당면한 문제를 분석하고, 해결점을 찾아 데이터 위주로 사람들을 설득한다면 상사 입장에서도, 회사 입장에서도 훨씬 전략적으로 판단하기가 쉬워진다.
세 번째, 업무 효율화다.
엑셀과 데이터베이스는 유사해 보이지만 수동/자동이냐, 컴퓨터가 표인지 아닌지의 인식여부에서 그 차이점이 나뉜다.
엑셀은 구조화된 데이터이다. 데이터를 알아보기 편하지만, 가공에 수작업이 필요하고 실시간 연동이나 버전 관리가 안된다. 범위 설정이 잘못되어 있거나, 수식이 잘못 걸려있으면 모든 데이터에 오류가 발생할 수 있어 수시로 점검해야 한다.
반면, 데이터베이스는 구조화된 데이터(=엑셀)의 시스템화 된 버전이라 자동화가 가능하다. 데이터베이스는 테이블(표)의 여러 집합이고, 컴퓨터가 테이블이라고 인식해서 값이 늘어나도 자동으로 인식, 업데이트가 가능하다.
네 번째, 범용성이 좋다.
모든 데이터베이스는 SQL이라는 표준 문법에서 시작된다. 빅데이터(Hadoop)나 클라우드 환경(GCP, AWS)에서의 데이터베이스에서도 동일하다. 회사에서 필요한 데이터의 대부분은 SQL로 생성 가능하고, 구글 애널리틱스, 태블로 같은 데이터 툴을 더 잘 쓸 수 있다.
다섯째, 배우는데 (상대적으로) 진입장벽이 낮다. 요즘 많이 언급되는 Phython(파이썬), R, Hadoop보다 훨씬 배우기 쉽다. 위에 언급된 기술들은 빅데이터를 전문적으로 분석하기 위한 기술이고, SQL은 그보다 더 기본적인 기술이다. 탈잉이나 오픈컬리지에 파이썬 클래스가 많이 오픈되고 있으나, 기본적으로 SQL을 배워야 프로그래밍 언어나 알고리즘의 단계로 넘어갈 수 있다.
데이터 기반으로 일하기 - 지표 설계
데이터 기반으로 일한다는 것은 무엇인가?라는 질문에 원지님은 경영학 원로 형님 피터 드러커의 말을 인용하셨다.
"측정 가능해야 관리할 수 있다(what gets measured gets managed)"
우리는 시각화에 약한 동물이라는 점을 잊어서는 안 된다. 일단 눈에 보여야 관리할 수 있다. 데이터는 측정할 수 있는 것으로 구성되어야 한다. 데이터를 기반으로 일하려면 지표 설정이 중요하다. 기준점이 되기 때문이다. 문제점을 발견하고, 왜라는 질문을 계속하고, 문제점을 깊숙이 파고든다. 문제점과 관련된 업무 하나씩 쪼개다 보면 내가 해야 할 업무의 지표가 나오고, 나에게 필요한 일을 구분할 수 있다.
[용어 정리]
1. 지표 : 무엇을 측정(meausre)하는 것
- 지표 ↔ 보조지표(ex. 지표 : CS 처리, 보조지표 : CS 처리시간, CS 콜 횟수)
- 좋은 지표 : 간단하고 명확하며, 충분히 합의된 정의를 갖는다. 쉽게 측정 가능해야 한다.
2. KPI(Key Performance Index*) : 조직 혹은 R&R이 반영된 지표
- 책임자가 목표 달성을 위한 성장을 정의하고 측정할 수 있게 도와줄 지표
- 여러 측정값을 요약하여 책임자가 쉽고 빠르게 현재의 상황을 판단할 수 있도록 만든 간단한 지표
3. OMTM (One metric that matters)
- 조직과 비즈니스의 현재 상태를 반영하여 지금 이뤄내야 할 단기 지표
* 출처 : 12 experts define Key Performance Indicators : Lean analytics
1회차 모임 소감
SQL 1회차 수업을 들으며 느낀 것은 역시나 이러한 기술도 결국은 커뮤니케이션을 위한 TOOL이라는 것. 효과적인 의사소통을 위해서는 데이터를 활용하고, 데이터를 통해 인사이트를 뽑아내는 것이 핵심이었다. 그 핵심을 찾기 위해서는 스스로 분석하고 판단할 수 있는 논리적인 사고력이 가장 필요하다.
이날 너무 많은 것을 습득하여 포스팅 하나로 정리가 안되어서, 데이터의 형태나 SQL 기본 문법은 후속 편(#2)에서 올리는 것으로 마무리하겠다.
▼아래 링크▼에서
프로젝트조이스 리더 이원지 님의 추천 도서 리스트와 프로젝트 후기 전문을 확인하실 수 있습니다!
https://m.blog.naver.com/mirasol_marisol/221723566538
지금 참여 가능한 프로젝트조이스가 궁금하다면?
▼아래 홈페이지▼에서 만나보세요!