포트폴리오의 완성도를 높이는 4가지 팁
월간 데이터리안 2023년 2월 [데이터 분석가 어떻게 준비해야 할까?] 세미나에서 발표한 내용을 재구성해 글로 정리했습니다.
이전 편이 궁금하시다면 아래 링크에서 확인하실 수 있어요.
- 데이터 분석 프로젝트 이것만 알면 끝 (1) 데이터 찾기
- 데이터 분석 프로젝트 이것만 알면 끝 (2) 문제 정의하기
- 데이터 분석 프로젝트 이것만 알면 끝 (3) 분석하기
이전 글(데이터 분석 프로젝트 이것만 알면 끝 (3) 분석하기)에서 데이터 분석 프로젝트를 하기 위해 데이터를 찾고, 그 데이터로 풀 문제를 정의한 후에, 어떻게 분석하는지 이야기 해봤어요. 그럼 이제 분석한 내용을 정리해서 포트폴리오로 만들 차례입니다.
데이터리안에서 운영하는 SQL 데이터 분석 캠프에서는 수강생 분들의 프로젝트 피드백을 해드리고 있는데요. 프로젝트 피드백을 계속하다 보니까 많은 분들이 자주 하는 실수가 눈에 띄더라고요. 이 글에서는 몇 가지 예시와 함께 자주 하는 실수가 어떤 것이 있는지 보여드리고, 어떻게 하면 이런 실수를 피할 수 있는지, 그리고 완성도를 높이는 팁 4가지까지 알려드릴게요
본격적인 이야기에 앞서, 데이터 분석가로 준비를 이제 막 시작하신 분들이라면 포트폴리오라는 말이 생소하신 분들도 계실 수 있을 것 같아요. 포트폴리오는 ‘작업물을 모아서 보여줄 수 있는 모음집’입니다. 앞에서 이야기한 것처럼 데이터 분석 프로젝트를 하고 다른 사람들에게 보여주기 위해 그 내용을 정리한 문서라고 생각해 주시면 됩니다.
포트폴리오에는 분석의 목표, 결과, 근거, 진행 과정, 어떤 데이터를 썼는지, 팀으로 참여했다면 내가 기여한 부분이 어떤 부분인지 등을 적어주세요. 형식은 어떤 것이라도 상관없어요. 여러분이 편한 방식을 선택해 주세요. 저는 노션으로 작성했는데, 블로그에 올리는 분도 있고, PPT 장표로 작성할 수도 있고요.
좋은 분석을 했는지 못지않게 어떻게 보여주는지도 중요합니다. 포트폴리오를 쓰는 목적이 다른 사람들이 내 포트폴리오를 읽어보고 어떤 분석을 했는지 그 분석을 얼마나 잘했는지 알아봐 줘야 하는 거니까요.
프로젝트 피드백을 계속하다 보니까 많은 분들이 자주 하는 실수가 눈에 띄더라고요. 이 글에서는 몇 가지 예시와 함께 자주 하는 실수가 어떤 것이 있는지 보여드리고, 어떻게 하면 이런 실수를 피할 수 있는지 알려드릴게요!
예를 들어, 그래프를 그리는데 제목이 없다거나 축이 없다거나 수치에 단위가 빠져있다거나 범례가 없다거나 하는 경우가 있습니다. 생각보다 정말 많이 하는 실수예요. 이렇게 되면 그래프에 있는 정보를 제대로 전달할 수가 없습니다.
표에 있는 컬럼명에 정보가 없어서 무슨 값인지 알아볼 수 없는 경우도 생각보다 자주 있어요. 열심히 분석한 결과를 잘 전달하기 위해서는 컬럼명도 구체적으로 작성해 주시는 게 좋습니다.
명확하게 표현해 주는 게 중요해요. 같은 의미를 나타내기 위해 비슷한 용어를 여러 개 섞어서 쓰고 있다든지, 영문과 한글 표기를 섞어서 하는 것도 읽는 사람의 집중력을 흐리게 할 수 있어요.
좋은 제목도 중요합니다. 프로젝트의 첫인상을 결정하는 만큼 신경 써서 정해주세요. 광고 카피처럼 창의력을 요하는 건 아니에요. 간결하게 필요한 내용을 모두 담아서 프로젝트의 핵심을 짚어주시면 돼요. 공개되어 있는 다른 프로젝트들을 많이 보시는 것도 도움이 될 것 같아요.
분석을 하다 보면 기준을 정할 일이 참 많아요. 분석에서 가장 어려운 부분이기도 합니다. 우리 서비스의 리텐션을 보는 프로젝트라고 하면 리텐션의 기준은 뭘로 정할지, 방문이어야 할지 다른 액션이어야 할지, 또 일별 리텐션을 볼지, 주별 리텐션을 볼지, 월별 리텐션을 볼지 등등 정해야 하는 기준이 참 많습니다.
그런데 이 기준을 정하는 건 데이터 밖의 영역일 때가 많습니다. 우리 서비스의 맥락과 비즈니스 목표와 연결되는 부분이에요. 단순히 평균 재방문 주기가 일주일이니까, 라고 하는 건 좋은 기준이 아닙니다. ‘우리가 일주일에 한번씩 콘텐츠를 업로드하니까 일주일에 한번씩 재방문 하는지 살펴보자’ 는 식으로 비즈니스적 맥락이 있어야 좋은 기준을 정할 수 있습니다. 그래서 실무에서도 이런 기준은 데이터 분석가 개인이 혼자 세우기보다 팀 단위로, 혹은 더 큰 조직 단위에서 결정될 때가 많아요.
외부 데이터를 활용한 분석 프로젝트를 할 때는 데이터 밖의 상황은 주어지지 않기 때문에 당연히 이 부분이 어려울 수밖에 없을 거예요. 그렇기 때문에 가능하다면 현업에 종사하고 있는 분들께 물어보는 걸 추천드리고요. 그게 어려우시다면 관련 산업에 대해서, 분석하고 있는 지표에 대해서 리서치를 많이 해보시는 걸 추천드립니다.
“데이터 분석을 시작하려는데 어떤 툴을 배워야 할까요?” 같은 질문을 정말 많이 받아요. 특히 시각화에 대해서는 유명한 툴, 멋진 툴로 작업을 해야 할 것 같다고 생각하는 분들이 많이 계신 것 같은데요. 멋진 툴을 쓴다고 좋은 시각화가 되는 건 아닙니다. 좋은 시각화는 도구를 가리지 않아요. 특정 툴을 내가 사용할 수 있고 그 능력을 어필하고 싶다면 프로젝트에 사용하시면 좋겠지만, 그게 아니라면 굳이 어려운 툴을 배워서 사용하실 필요는 전혀 없습니다.
프로젝트도 그렇지만 실무에서는 더더욱 어떤 툴을 썼느냐가 중요하지 않아요. 그 사람이 어떤 분석을 했고 어떤 결과를 냈는지가 중요하니까요. 실무에서도 간단한 시각화에는 구글 스프레드시트를 진짜 많이 씁니다.
멋진 분석 기법으로 프로젝트를 하고 싶어서 잘 모르는 분석 기법을 써서 프로젝트를 하면 오히려 잘 모른다는 사실이 보여서 마이너스가 될 수 있어요. 면접에서도 “왜 이 방법으로 분석하셨어요?” 하는 질문을 받을 수 있으니까 분석을 하면서 이런 부분도 염두에 두시면 좋을 것 같아요.
용어도 마찬가지예요. 이 사람이 이 용어의 뜻을 알고 썼는지, 잘 모르고 썼는지 포트폴리오를 읽어보면 보이거든요. 꼭 대단한 용어나 기술이 있어야 돋보이는 게 아니니까 그런 것에는 연연하지 않으셨으면 좋겠어요. 꼭 쓰고 싶다면 잘 찾아보고 쓰시는 걸 추천드려요.
대표적인 실수로 읽는 사람은 관심 없는 이야기를 너무 길게 하는 경우가 있어요. 어떤 맥락으로 했는지 모를 EDA 한 내용을 몇 페이지에 걸쳐서 다 써놓는다든지, 프로젝트 과정에서 있었던 트러블 슈팅 과정을 세세하게 기록한다든지, 결론이 너무 뒤에 나와서 읽다 지치게 되는 경우도 있고요. 모든 과정을 세세하게 적는 마음도 이해는 돼요. 저도 취준생 때는 뭐라도 보여줘야 할 것 같고, ‘이 프로젝트 이렇게 열심히 했어요!’ 하고 보여주고 싶었거든요. 근데 읽는 사람 입장에서는 그런 정보가 뜬금없이 느껴진다거나 맥락 연결이 안 돼서 오히려 이해를 방해할 수 있어요.
반대로 읽는 사람에게 꼭 필요한 정보가 누락되는 경우도 자주 있어요. 아무 설명 없이 표나 그래프만 덩그러니 있다거나, 여기서 왜 갑자기 이 데이터를 보는지 흐름이 연결이 안 된다거나, 개인 데이터 분석을 하는데 분석의 배경이 되는 정보를 충분히 전달해 주지 못했다거나 하는 경우들이요.
이런 부분은 프로젝트를 작성한 사람 혼자서 보기에는 어려운 점이 많아요. 프로젝트를 하다 보면 나는 이 데이터에도, 이 분석 내용에도 너무 익숙해져서 어떤 설명이 더 필요하고, 처음 보는 사람은 뭐가 궁금해할지 알기 어렵거든요. 그럴 때는 이 분석 프로젝트에 참여하지 않은 사람, 데이터 분석에 대해 아예 모르는 사람에게 보여주고 피드백을 받아보는 것도 한 가지 방법이 될 수 있을 것 같아요.
이렇게 포트폴리오를 쓸 때 자주 하는 실수 6가지를 살펴봤습니다. 그 실수들을 다 피하고 나서 내 포트폴리오의 완성도를 높일 수 있는 팁 4가지를 이야기해 볼게요.
오탈자가 보이면 전체적으로 완성도가 확 떨어져 보여요. 경우에 따라서 의미 전달이 어려워질 수도 있고요. 내용을 다 작성하시고 나서 맞춤법 검사를 해주시면 완성도를 높이실 수 있을 거예요.
일관성을 주는 게 가독성을 높이는 방법 중 하나예요. 아래 표에서 왼쪽과 오른쪽 중에 어느 쪽이 더 눈에 잘 들어오시나요? 본문에서 텍스트를 강조하는데 어떤 때는 밑줄, 어떤 때는 볼드, 어떤 때는 이탤릭 이렇게 여러 가지를 섞어서 사용하면 오히려 가독성을 해칠 수 있어요. 강조 표시는 꼭 필요한 곳에만 하고 되도록이면 한 가지 방식으로만 해주는 게 좋습니다.
두 번째 예시입니다. 아래 표에서 왼쪽과 오른쪽 중에 어느 쪽이 더 눈에 잘 들어오나요? 왼쪽은 형식이 제각이고, 오른쪽은 날짜와 숫자 각각 통일해줬습니다. 숫자나 날짜를 표현할 때는 표시 형식을 맞춰주시면 좋아요.
그래프를 그릴 때는 색상을 맞춰주는 것으로 일관성을 줄 수 있습니다. 유입 채널별 웹사이트 방문자 수 비중과 유입 채널별 매출 비중을 그래프로 그려봤습니다. 각각의 유입 채널 비중이 방문자 수와 매출에서 어떻게 달라지는지 보여주고 싶어요.
위 그래프와 아래 그래프 중 어느 쪽이 더 좋은 표현 방법 같으신가요?
언뜻 보면 <예시 1>이 더 예쁜 시각화로 보일 수 있을 텐데요. 좋은 시각화는 <예시 2>입니다. 이 그래프를 그릴 때 우리가 전체 방문자 수와 매출에서 유입 채널별 비중이 어떻게 달라지는지 보여주고 싶다고 했어요. <예시 1>에서는 그 비중이 어떻게 달라졌는지 확인하기 쉽지 않아요. 방문자 수는 모두 파란색 계열, 매출은 모두 빨간색 계열로 설정해서 유입 채널별로 보려면 레이블을 일일이 읽어봐야 합니다.
<예시 2>는 어떨까요? 두 그래프에서 모두 유료 광고는 파란색, 네이버 검색은 빨간색, 친구 추천은 노란색으로 설정해서 유료 광고는 방문자 수 비중이 80% 정도 되지만 매출 비중은 30% 정도로 크게 줄었다는 게 한눈에 들어옵니다. 반대로 네이버 검색은 방문자 수 비중에서는 16% 정도이지만 매출 비중은 50%인 것도 눈에 들어오죠. 이렇게 그래프에서 색상을 잘 사용하는 것만으로도 읽는 사람에게 정보를 훨씬 쉽고 빠르게 전달할 수 있습니다. 좋은 시각화를 하는 방법이 궁금하신 분들이 계시다면 <월스트리트 저널 인포그래픽 가이드(도나 M. 웡 저)>라는 책을 추천드려요.
‘프로젝트에 액션 아이템이 꼭 있어야 하나요?’ ‘얼마나 자세하게 적어야 하나요?’ 물어보시는 분들이 종종 계시는데요. 데이터 분석 프로젝트에 필수는 아니라고 생각해요. 하지만 앞에 얘기한 것들을 다 하고 나서 뭔가 좀 더(!) 어필해 보고 싶다면 액션 아이템을 추가해 보라고 말씀드리고 싶어요. 데이터 분석 캠프에서도 액션 아이템까지 생각해 보는 연습을 해보시라는 이야기를 많이 드리고 있는데요. 분석한 결과만 전달하는 것보다는 간단하게나마 제안을 하면서 논의를 시작할 수 있기 때문이에요. 분석 내용을 좀 더 명확하게 전달할 수도 있고요. 분석한 내용이 보고서로만 남지 않고 실제 액션으로 이어지게 만들기도 쉬워집니다.
실무에서 데이터 분석가가 혼자 명확한 액션 아이템까지 내야 하는 건 아니고, 그럴 수도 없어요. 분석만 한다고 액션 아이템을 낼 수 있는 건 아니고 비즈니스에 대한 이해도가 필요하기 때문에 또 다른 방면으로 공부가 필요해요. 어려운 만큼, 포트폴리오에 명확한 액션 아이템이 쓰여 있으면 확실히 흥미를 줄 수 있는 것 같아요. 비즈니스에 대한 관심, 이해도, 열정을 보여줄 수도 있고요. 대신, 그만큼 리서치도 많이 해보셔야 할 거고요. 그래서 관심 있는 분야에서 분석 프로젝트를 해보시는 게 가장 추천드려요. 평소에 내가 사용하는 서비스라든지, 산업에 대해서 분석해 보시면 자연스럽게 관심과 열정이 녹아들 수 있을 것 같아요.
“데이터에 이런 컬럼이 있다면 추가 분석을 할 수 있었을 텐데 못해서 아쉬워요”, 라든지 프로젝트를 하시는 상황에서 이런 저런 제약 때문에 아쉬움을 표현하는 분들이 많으신데요. 이럴 때는 한계점에 대해서 언급하고 그 아쉬움이 해소된 상황이라면 어떻게 했을지 개선 아이디어에 대해 포트폴리오에 적어보는 것도 좋은 방법입니다.
이런 얘기가 프로젝트에 들어있다면, 보는 사람도 ‘이런 부분을 더 봤으면 좋았을텐데 아쉽네’ 하고 보다가 이런 언급이 있는 걸 보면 ‘아, 이 사람도 이걸 알고 있구나, 그럼 이런 상황이 해결되면 이렇게까지 할 수 있는 사람이구나’ 하는 생각을 하게 해줄 수 있습니다.
데이터 분석 공부를 하고 열심히 프로젝트를 하고 막상 지원할 때가 되어서 포트폴리오를 정리하다보면, 예전에 했던 프로젝트가 내가 보기에도 부족해 보일 때가 있는데요. 그럴 때도 그때는 여기까지밖에 못했지만, 지금 다시 한다면 이런 이런 추가 분석을 더 해볼 수 있다는 식으로 덧붙여주는 것도 좋은 방법입니다.
장장 4개 글에 걸쳐서 프로젝트 이야기를 아주 길게 해봤습니다.
“프로젝트는 몇 개 해야 할까요?”
“큰 프로젝트 하나가 나을까요 작은 프로젝트 3-4개가 나을까요?”
“아직 프로젝트가 완성이 안돼서 지원을 못하고 있어요.”
이런 이야기를 종종 듣는데요. 일단 기본적으로는 열심히 노력해서 준비를 해야겠지만, 취업이 되고 말고는 운과 타이밍의 영역이에요. 프로젝트가 몇 개 이상이어야 한다든가, 프로젝트 규모가 어느 정도 되어야 한다든가, 하는 식으로 몇 점 이상 되면 합격! 아니면 불합격! 이렇게 딱 잘라 이야기할 수 없어요. 분명 좋은 프로젝트 덕분에 합격하는 분들도 계시겠지만, 꼭 프로젝트가 있어야 합격하는 것도 아니고요.
그렇다면 데이터 분석 프로젝트 할 필요 없는 건가요? 하고 물어보실 수도 있겠네요. 데이터 분석 프로젝트의 본질은 데이터 분석 공부를 위한 거라는 걸 잊지 않으셨으면 합니다. 강의를 듣고 연습문제를 풀면서도 성장하지만 프로젝트를 하면서 데이터 분석 역량이 가장 많이 성장했을 거예요. 이렇게 잘 쌓은 역량을 바탕으로 그다음은 공부하고 준비하신 내용을 잘 다듬어서 도전해 보실 차례입니다.
프로젝트를 몇 개 더 완성시키고 지원해야지, 하고 자꾸만 지원을 미루고 계신 분이 혹시나 있다면 그러지 마세요. 어느 정도 해봤으면 지원해 보시고, 안 된다면 보완해서 다시 지원해 보고, 또 보완해서 다시 지원해 보고… 이렇게 지원을 많이 해보시라는 말씀을 꼭 드리고 싶어요.
현업 데이터 분석가가 알려주는 취업준비 꿀팁 더 알고 싶으신가요?
문예창작과를 전공한 데이터 분석가 이보민님이 잡플래닛에 어떻게 취뽀 할 수 있었는지 알려드릴게요. 실무자가 알려주는 데이터 분석가 취업 꿀팁이 알고 싶다면, 월간 데이터리안 9월 세미나에서 만나요!