brunch

You can make anything
by writing

C.S.Lewis

by 정경문 Apr 28. 2022

13 연구논문에서 데이터 활용방법

연구논문 역시 '스토리 텔링'과 '데이터'의 결합체

코로나 백신 부스터 샷은 효과가 있을까?


코로나 백신 부스터 샷(백신의 효과를 높이기 위해 일정시간 뒤 추가접종하는 것)은 효과가 있을까요?


이에 대한 답을 표현할 때 우리는 데이터를 사용 합니다. 아래와 같이 빨간색과 파란색 그래프가 다르다는 것은 누구나 인식할 수 있습니다. 그렇다면 무엇이 다른 걸까요?

화이자 백신의 추가접종에 의한 결과 (출처 : 와이넷 Ynet)


빨간색 그래프는 1차 백신을 맞은 후 부스터 샷을 맞지 않은 사람이며, 파란색 그래프는 부스터 샷을 접종한 사람들입니다. X 축은 시간(경과일 수)이고, Y축은 사망위험 정도입니다.


우리는 상세정보를 보지 않고도 부스터 샷을 맞지 않으면 맞은 경우에 비해 시간에 따라 사망 위험도 높아지는 것을 인지할 수 있습니다. 그래서 "연구결과 부스터 샷이 사망률을 크게 낮춘다. 부스터 샷을 맞아야 한다."라는 결론에 도달하게 됩니다.



# 01. 연구논문 역시 '스토리 텔링'과 '데이터'의 결합체


연구논문은 "연구결과를 논리적으로 표현한 문서"입니다.

연구논문은 과학, 의학, 기술, 경제 등 다양한 주제에 대해 사실을 탐구하여 인류에 기여하는 역할을 합니다.

오늘날 우리가 누리고 있는  과학과 의학 기술은 연구논문이라는 형태로 최초 검증이 되었습니다. 이러한 연구논문은 연구의 결과를 논리적으로 전달하는 것이 매우 중요합니다.


대다수의 논문들이 다음의 5가지 단계를 거쳐 작성됩니다.

1. 연구목적 2. 문제정의 3. 연구방법 4. 연구결과 및 검증 5. 결론



명확한 논문을 작성하기 위해 가장 먼저 해야 할 일은 생각 흐름을 구성하는 것입니다.

생각의 흐름을 일목요연하게 표현하는 것은 다른 말로 '논리적 사고'라고 합니다. 연구 논문은 "만약 연구한 방법을 적용하면 이러할 것이다"라는 가설을 수립하고 검증하는 과정을 거치게 됩니다.


내가 왜 이 연구를 시작했으며(1. 목적), 기존의 연구에서의 한계점과 문제는 이러했고(2. 문제정의), 그래서 나는 특별히 이런 방법으로 해결을 시도했다.(3. 연구방법) 그래서 다음과 같은 결과가 나왔고, 데이터로 검증되었다.(4. 연구결과 및 검증) 따라서 결론은 이렇다.(5. 결론)


이러한 단계로 미뤄 봤을 때, 연구논문은 연구에 대한 스토리 텔링인 동시에 데이터로 그 결과를 도출하고 검증하는 데이터 스토리 텔링입니다.



# 02. "내 심장(데이터)을 쏴라" 핵심은 데이터


내가 말하고 싶은 결론을 전달하는데 필요한 데이터


연구논문에서 핵심은 결과에 대한 검증입니다. 그래서 앞의 단계를 추상화해보면 2단계가 됩니다.

"나는 A라고 생각한다"

"데이터 B가 내 생각을 검증하기 때문에 A는 옳다."


앞서 살펴본 코로나 백신 부스터 샷에서 여러분들은 어떤 부분을 보셨나요? 그렇습니다. 연구목적, 기존 연구, 연구방법보다 그 결과 데이터를 확인하고 바로 결론을 내렸습니다. 이처럼 데이터는 핵심이고 결론이며, 어떤 주장의 설득력(힘)은 데이터에서 나온다고 할 수 있습니다.

사실 연구과정에서 다양한 관찰과 실험을 통해 데이터를 습득합니다. 연구를 해보신 분들은 아시겠지만 연구에 몰입하는 그 순간에 엄청난 집중력과 노력을 투자합니다. 그러면서 수많은 데이터가 생성되죠. 따라서 연구자는 필요 이상으로 훨씬 많은 데이터가 있습니다. 하지만 이 모든 것들에 대한 그래프를 그려서 넣을 수는 없습니다. 자신의 이야기에 어울리는 데이터를 논문에 넣어야 합니다.


결론적으로 내가 하고 싶은 이야기와 어울리는 데이터가 필요합니다. "결론 = 데이터"  즉, 결론이 데이터와 같아야 합니다. 아무리 많은 데이터가 있다고 할지라도 내가 말하고자 하는 바와 다르면 어떨까요? 그것은 데이터 그리고 그것으로 그린 그래프, 그림들의 나열일 뿐 의미를 전달하기 어렵습니다.

그렇다면  어떤 데이터를 어떻게 넣어야 할까요?



# 03. 데이터를 표로 넣을까 그래프로 넣을까?


표와 그래프

1) 이럴때 표를 사용해요


표는 가로(행)와 세로(열)의 그 격자 안에 수치나 정보를 넣은 것을 말합니다. 이 경우 원인이 결과에 영향을 미치는 영향을 자세히 볼 수가 있습니다.  표는 보는 사람으로 하여금 정확한 값을 찾고, 비교하도록 할 수 있습니다. 보는 사람 입장에서는 다소 집중력과 시간이 필요하지만, 원하는 데이터를 뽑아 볼 수 있다는 장점이 있습니다. 예를 들면 평균, 표준편차, 통계량 등 전문적인 지식을 가진 사람에게는 더 깊은 가능성을 제공합니다. 데이터의 일부분에만 초점을 맞춘 경우, 전반적인 관계를 설명하는 그래프가 더 나을 수 있습니다.


* 장점 : 정확한 값이 필요한 경우, 원하는 데이터를 직접 확인 가능. 2차 가공과 판단 가능

* 단점 : 파악에 다소 집중력과 시간 소요, 전체적인 추세를 나타내는데 불리



2) 이럴 때 그래프가 필요해요


그래프는 점과 선으로 이루어진 자료구조를 말합니다. 전체적인 추세를 보여주는 데 유용합니다. 또한 보는 사람으로 하여금 많은 양의 데이터가 나타내는 결과를 빠르게 전달할 수 있습니다. 예를 들면 데이터가 나타내는 경향(오르고 내리는), 예외(특별히 높거나, 낮은), 패턴(반복되는 주기) 등을 손쉽게 알려줍니다. 또한 나타내고자 하는 데이터의 종류나 쌍이 어려 개라면 이들 간의 관계를 설명하기 용이합니다. 따라서 데이터 분석을 통해 막대그래프, 원그래프, 상자 수염 그림, 산점도 등 다양한 방식으로 우리가 원하는 결과를 보여줄 수 있습니다.


* 장점 : 전체적인 경향/예외/패턴 등을 보여주는 데 효과적, 여러 데이터 쌍 간의 관계를 설명 가능

* 단점 : 세부적인 수치 확인 어려움. 통계지표는 필요시 별도 표현

* 유형별 용도

  - 원 그래프(Pie graphs) : 전체에 대한 각 부분의 백분율을 표현

  - 막대그래프 (Bar graphs) : 연속적이지 않은 유형의 데이터별 값을 표현

  - 선 그래프 (Line graphs) : 연속 범위 또는 시간에 대한 변화를 설명

  - 산점도 (Scatter plots) : 연속된 두 데이터 간의 관계를 설명



오늘 우리는 지난 시간에 이어 연구논문을 통해 스토리텔링과 데이터의 결합을 알아보았습니다. 그리고 내가 말하고 싶은 결론을 전달하는데 필요한 데이터를 넣어야 한다. "결론 = 데이터"라는 개념을 이해했습니다.

마지막으로 언제 표를 사용하고 그래프를 사용하는지 구체적으로 알아보았습니다.

다음 시간에는 "데이터야 팩트체크를 부탁해"를 통해, 사실과 주관적 해설을 구분하여 말하는 방법에 대해 알아보겠습니다.


매거진의 이전글 12 데이터는 ㅇㅇㄱ를 사랑합니다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari