데이터 분석 리포트 작성방법 -『 증권사 리포트 』리뷰
글의 순서가 바뀌었지만 데이터 분석 리포트 작성 프로젝트(4부작)를 계속 이어나갑니다.
조금 Academic 하지만 목적이 있는 글쓰기의 또 다른 묘미를 함께 느껴보시면 좋겠습니다.
데이터 분석 리포트 작성방법은 크게 1. 논리구조 2. 데이터 분석 프로세스 3. 인사이트 도출 4. 데이터 소스 정리로 나눠서 설명할 수 있습니다. 오늘은 그중 "데이터 분석 프로세스"에 대해 함께 알아볼 차례입니다.
데이터 분석 프로세스는 다양한 방법으로 설명이 가능하지만, 여기서는 실무에서 데이터 분석 리포트를 작성할 때 슬라이드를 어떻게 구성하는지 구체적인스킬을 설명드리겠습니다.
첫 시간에 알아본 바바라 민토의 피라미드를 기반으로 한 데이터 분석 리포트는 구조 기억하시나요?
다시 복습하면 첫 번째 슬라이드에서 핵심 메시지를 전달하고, 뒷받침 주장 1, 2, 3을 기술한 슬라이드들이 서로 중복이나 누락 없이 근거를 제시합니다. 그리고 각 뒷받침 주장의 슬라이드에 대해 데이터를 표현합니다. 이때 각 데이터는 그 종류와 수에 따라 다음과 같이 구조화할 수 있습니다.
우리는 오늘 데이터가 포함된 슬라이드의 구성방법을 알아보고 실제 공공기관의 데이터 분석리포트와 증권사 리포트를 통해서 데이터 분석 프로세스를 실무적으로 파악해 보겠습니다.
먼저 첫 번째 노란색으로 표시한 슬라이드를 상세히 살펴보겠습니다. 이 슬라이드는 하나의 데이터 A로 구성된 슬라이드입니다. 여러분들이 데이터 분석(사실 이 과정은 데이터 분석이 아닙니다.)을 통해 Python 또는 Excel로 그래프를 그렸습니다. 그럼 여러분들은 무엇을 해야 할까요?
네, 데이터에서 인사이트를 도출해야 합니다.
그렇다면 데이터에서 인사이트를 도출한다는 의미는 무엇이고, 어떻게 표현해야 할까요? 그것은 "결과와 결론"으로 구분하여 설명드리겠습니다.
알록달록 그래프가 무슨 의미지?
우리는 앞선 데이터 작업(?)을 통해서 모으고, 자르고, 집계해 보고 나서 예쁘게 알록달록 그래프도 그렸습니다. 본격적인 데이터 분석은 이제부터가 시작입니다. 사실 데이터 분석 = 코딩 = Python이라고 인식하는 경우가 많은데 데이터 분석은 해당 도메인 지식을 기반으로 의사결정이나 행동을 이끌어내는 것을 그 목표로 하는 일련의 과정입니다.
앞선 작업으로 그래프를 그리고, 우리는 그 그래프에서 상관관계라던지, 표준편차, t-검정, 신뢰도, p-value와 같은 학문적인 그리고 기술통계에서 부터 model, architecture, learning rate, activation function 등 ML/DL 관련 용어로 불친절을 자처합니다. 하지만 이런 용어들로 과연 의사결정을 이끌어 낼 수 있을까요?
다음 슬라이드 예시를 보겠습니다.
데이터에서 우리는 시각화를 통해 멋진 그래프를 그렸습니다. 애초부터 해당 근거를 제시한 목적이 있었습니다. 즉 말하고자 하는 바는 바로 결론입니다. 이때 데이터에서 얻어낸 시각화 성과물이 나타내는 의미를 객관적으로 기술합니다.
이를 테면,
"00년부터 00년까지 상승의 흐름을 보이고, 00년 이후에는 하락 흐름을 보인다.", "상승기 변화는 00% ~00% 이고, 하락기에는 00%이다. 이는 역대 최대 하락폭의 절반 수준이다."
라고 말합니다. 이것을 우리는 데이터에 기반한 사실로서의 "결과"라고 말합니다.
결과는 데이터와 결론을 이어주는 징검다리
데이터 분석에서 중요한 것은 목적입니다. 데이터는 분석하는 목적과 맞아야 합니다. 그렇다면 데이터를 분석한 목적에 대한 답을 줄 수 있어야 합니다. 그럼 이 모든 어려운 용어들을 요약해서 한 줄로 표현해 주면 어떨까요? 이것이 바로 결론입니다.
즉, 결론과 데이터는 일치해야 합니다. 사용하는 데이터가 말하고자 하는 결론과 일치할 때, 결론을 뒷받침하는 논리적 설득력을 갖출 수 있습니다. 그리고 데이터와 결론의 중간에 들어가는 과정이 바로 ‘결과’입니다.
결과는 데이터에서 결론을 이어주는 과정이자, 데이터를 설명하고 과학적으로 결론까지 이어주는 징검다리 역할을 합니다. 데이터를 설명하는 결과가 나오고, 결과를 기반으로 결론을 맺게 됩니다.
넌 너무 많은 것을 알아, 죽어줘야겠어!
그냥 데이터로부터 바로 결론을 말하면 안 되냐고 반문할 수도 있을 것 같습니다. 하지만 결론을 도출할 때, 중간 과정 없이 훌쩍 뛰어넘는다면 듣는 사람이 불편하거나 이해하기 어려워집니다. 데이터 분석 경험이 많지 않은 이들은 오히려 전문용어나 통계 관련 지식을 섞어서 이야기하는 경향이 있습니다.
하지만 생각해 보면 사장님께서, 고객들이 그러한 용어를 편하게 받아들여줄 수 있는 게 현실일까요? 전문지식이 오히려 역작용을 부르는 이른바 ‘지식의 저주(Curse of Knowledge)’로 이어지는 것이 현실입니다.
이렇게 우리는 다양한 데이터의 종류와 수에 따라서 데이터 → 시각화 → 결과 → 결론의 흐름(노란색 화살표)으로 슬라이드를 구성할 수가 있습니다. 아래 그림은 위 논리구조에서 데이터의 수에 따른 슬라이드 구성 예시입니다.
데이터 → 시각화 → 결과 → 결론
해당 Skill 은 『 나는 처세술 대신 데이터 분석을 택했다 』의 7장. "분석 결과 말고 결론을 말하라" 및 "데이터 기반 주장과 사실의 차이" 이론을 기반으로 하고 있습니다.
마지막으로 공공기관과 대형 증권사의 부동산과 주식 리포트를 리뷰해 보겠습니다. 출처는 자료하단에 표시되었고, 내용 자체보다는 분석 리포트의 구성방식에 대해 봐주시기 바랍니다.
앞서 설명한 데이터의 종류와 수에 따라 데이터 분석 리포트가 실무에서 구성되는 것을 확인할 수 있었습니다. 데이터 분석의 목적 또는 결론(녹색 box), 그리고 데이터에 기반한 사실인 결과(파랑 box), 그리고 데이터 시각화 자체(빨강 box)에 대해 표현되었습니다.
어떠셨나요? 1. 논리구조를 선택하고, 2. 데이터 분석 프로세스에 따라 슬라이드를 구성한다. 어느 정도 감이 오셨나요? 다음은 3. 위에 표현된 슬라이드의 데이터 시각화 성과물에서 인사이트를 도출하는 4가지 실무스킬 크기, 추세, 편차, 비율에 대해 알아보겠습니다.
https://brunch.co.kr/@writerjeong/212