brunch

You can make anything
by writing

C.S.Lewis

by 순순 Nov 04. 2023

논문, 어떻게 생긴 친구지? (중)

Chapter 2. 메디컬라이터(MW)의 기본, 논문을 알아보자


지난 시간에 논문 방법론을 머릿속에 간직하며 가볍게 읽어보는 방법을 익혀봤다.

오늘은 논문 결과표 분석 이야기를 시작하려고 한다.


결과에는 그림 영역인 Figure와 표 영역인 Table이 있다.

어떤 논문은 Figure가 없기도 하고, Table을 이미지 파일로 만들어 Figure만 있는 논문도 있다.


보통은 Figure로 방법론을 설명하고 Table로 연구 수집 결과를 보여주고, Table의 내용 중 그래프로 보여주고 싶은 시각화 자료는 Figure로 표현한다.


Figure - Table - Figure의 순서를 띤다.


문제는 한 페이지에 욱여넣은 표와 그림은 글씨도 너무 작고, 무슨 뜻인지 해석하기 난해해 보인다. 이럴 땐 하나하나 뜯어보면 쉽다.





<예시논문 출처: Lancet. 2014 July 26; 384(9940): 319–328. doi:10.1016/S0140-6736(14)60421-9.>




연구대상자 모집 순서도가 난해하다.  위에서부터 하나씩 차근차근 보자.





전체 556명에서 137명이 제외되었다.  

    기준에 맞지 않아서(124명)  

    동의서에 사인을 하지 않아서 (9명)  

    부작용이 있어서(4명)   


----

그렇게 남은 419명을 무작위로 배정하고 두 개의 그룹으로 나눴다



한 그룹은 소라페닙을 투여했고 (209명), 나머지 한 그룹은 가짜약을 투여하였다 (210명)



----

그 아래 적혀있는 "무작위 배정 두 번 (2명)", "절대 치료 안 받은 사람 (1명)"

이건 다 무엇인가..?

알 수 없다고 생각하는 내용은 Figure를 설명하는 캡션을 읽거나 방법론 본문 내용을 찾아본다.



그렇게 해서 남은 사람은 소라페닙을 받은 207명과 가짜약을 받은 209로 나뉜다. ~한 사람, ~명, 왜 그렇게 됐는지, 그렇게 된 사람이 몇 명인지 써놓았다.





이런 식으로 화살표를 따라가면서 읽고 모르는 건 표시하고, 캡션과 본문을 찾아보면 된다. 처음엔 당연히 이 과정이 서툴다. 하지만 이 과정을 따라가며 정보를 알아가는 재미를 느낀다면 메디컬라이터로서 자질이 있는 것이고, '아 죽어도 모르겠다' 라며 알아내기를 포기한다면.. 아쉽지만 다른 길을 찾아보는 걸 추천드린다. 이러한 작업이 메디컬라이터가 된다면 계속 반복될 것이기 때문이다. 포기하지 않았다면 계속해서 결과표를 확인해 보자.





어, 그런데 이 논문은 다음 장면에 Table이 안 나오고, Figure 2가 나오네요?

아까 위에서 Figure-Table-Figure라면서요? 거짓말했네?


노노, 저널마다 양식이 달라서 그렇다.

우리가 입사지원서를 회사마다 양식이 다르게 쓰는 것처럼 저널마다 원하는 양식과 순서가 다르다. 마찬가지로 저널마다 편집 순서가 다를 순 있다.



순서대로 봐도 상관없지만 앞서 말한 대로 Figure 1을 봤다면, Table 1으로 옮겨가서 보면 된다.



내용은 간단하다. 나이, 성별, 인종 등 기초 정보를 정리한 것이기 때문이다.

조사 대상자의 인구특성을 보여주어 흔히 Table 1은 ‘인구통계학적 변수’라고 말한다.


‘아 간단하네. 그냥 대충 넘겨야지.’

라고 생각하면 다음 표부터 굉장히 복잡해지니 1번 표부터 비판적 사고를 하며 읽어보길 바란다.



----

연습을 해보자면, 이런 것이다.



→ 자, 보자. 소라페닙이 약 이름이니까 실험약을 먹은 그룹이네. Placebo는 가짜약을 먹은 그룹이네. 여자만 써놨네? 성별은 보통 남/녀 두 개로 나누니까 여자만 써 놔도 남자가 몇 명인지 알 테니까 그렀구먼.

약물 투여군은 49.8%고, 가짜약은 54.8%네. 거의 반반이긴 한데, 약물은 남자가 더 많네? 갑상선암은 남자가 더 걸리나?


→  다음은 나이네. 63세가 중간나이라고, Median이니까 평균이 아니네. 가운데 값이니까 60대가 주로 있나 보군. 근데 갑상선암이 노령 인구에서 많나?


→ 다음은, 인종이네. 아, 맞다. 이거 여러 국가 데이터 합친 거라 했지. 약물 그룹이나 가짜약 그룹이나 비슷한 분포로 인종이 있네.


----


이런 식으로 표를 읽어보면서 생겨난 의문점들을 ‘간직’하는 것이다.

그리고 본문을 읽어나가며 그러한 의문점들이 ‘해소’되는지 확인하며 논문을 보면 기억에 남기기 쉽다.



만약, ‘해소’가 잘 안 됐다면 본문과 지피티(챗GPT) 선생님을 찾아가서 물어보면 되고, ‘해소’를 못 시켜준 논문일수록 좋은 논문은 아니다. 그러니 다음 논문부터는 좋은 논문을 구분할 눈을 갖추게 되는 것이다.


이런 식으로 ‘안목’이 생겨나면 논문을 읽는 게 쉬워지고, 재밌어진다.

결과적으로 논문을 보며 하는 일인 메디컬라이터를 지속할 수 있게 도와준다.


만약 본인이 이런 식의 논문 읽기에 흥미를 들였다면 결국 대학원에 도달할 거라는 기쁘고도 슬픈 소식을 미리 말씀드린다.


대학원에 발을 담그지 않고도 논문의 흥미를 디벨롭할 수 있는 방법은 수도 없이 많지만, 그렇지 않으면 현실적으로 논문의 '재미'를 공유할 수 있는 방법이 많지 않기 때문이다.





다음으로 Table 2를 보자.

두 번째 표를 보면 이 논문에서 봐야 할 결과표는 끝이다.




약 먹고 생겨난 부작용을 빈도로 정리한 것이다.

여기서 ‘grade’로 나눈 것은 무엇일까?

갑상선 암의 단계별 부작용 빈도이다.

흔히 표현하는 암 1기, 2기, 3기.. 를 말하는 것이다.


표에서는 1기, 2기는 없고, Any grade와 3기, 4기로 나누었다.

무슨 기준으로 그렇게 나눈 걸까?


연구자가 참고문헌을 보고 정한다.

같은 주제로 논문을 낸 문헌을 참고하여 정하는 것이다.

그러나 절대적인 기준은 없기에 연구 분석에 따라 1기, 2기, 3기, 4기로 할 수도 있고, 1-3기, 4기로 할 수도 있다. 이건 본인이 연구하는 데이터에 따라 달라질 수 있는 부분이다.



1기와 2기의 대상자 수가 많지 않으며, 굳이 둘을 나누는 게 차이가 없다면 합친다. 하지만 두 기수의 결과가 확연히 달라서, 연구자가 판단할 때 따로 보여줘야 한다고 생각한다면 나누면 된다.


또한 논문이 연구자 혼자의 생각만으로 완성되지 않는다. 동료 연구자 및 지도 교수님 그리고 연구 책임자의 의견도 반영되고, 논문을 내고 나면 동료검토(peer review)라고 해서 또 다른 연구자들의 심사를 통해 수정된다.


고로, 지금 보는 논문이 초판이라고 생각하지 마시길. 많은 사람들의 의견이 모아져서 만들어진 결과물이다. "연구자의 주관이 반영된다"라는 말에서 '연구자'에는 많은 사람들이 해당된다.





마지막으로, 남은 Figure들을 살펴보도록 하자.


'도대체 이게 무슨 선이고…' 하는 생각만 든다.

앞의 표들을 떠올리며 파란 선과 빨간 선의 의미를 캐치해 보자.

보기만 해도 무시무시해 보이는 그림들 1



보기만 해도 무시무시해 보이는 그림들 222,,,



딱 봐서는 어디가 높고 낮은지 알 수 없지만, y축과 x축의 의미를 익히고 오른쪽으로 갈수록 높은 게 좋은지, 낮은 게 좋은지를 확인하면 된다.


이렇게 물어볼 수 있다.

'그런데 말이죠.. 앞서나 온 표 결과에서 중요한 것을 그래프로 보여준다면서, 이 내용들은 표에 없어요!'


이것 또한 연구자의 주관과 저널 양식에 따른 차이이다.

표의 개수 제한 때문일 수도 있고, 어차피 그래프 아래에 점수를 넣어뒀으니 따로 표를 안 만든 걸 수도 있다.


----


<Figure 2>를 먼저 보자. 오른쪽으로 갈수록 두 개의 선이 쭉쭉 떨어지는 것 (Progression-free survival by central review (a))은 생존곡선이다.


  *생존곡선: 그래프의 유형 중 하나. 말 그대로 생존율을 나타내는 곡선그래프라고 보면 된다.

*progression-free survival (PFS) 무진행 생존율: 질병이 악화하지 않은 채 환자가 생존해 있는 기간


생존곡선은 시간이 지날수록 얼마나 살아있냐를 보여주는 것이다.

위 그림의 y축은 PFS, 즉 질병이 악화하지 않은 채 생존해 있는 확률이고, x축은 기간이다. 시간이 흐르면서 암이 진행될 테니 PFS는 떨어질 수밖에 없다.

그러니 오른쪽으로 갈수록 그래프가 축축 쳐진다.


여기에서 두 그룹의 차이가 보인다. 진짜약 그룹인 빨간색 선이 가짜약 그룹인 파란색 선보다 항상 위에 위치한다. 생존자가 파란색보다 더 많다는 것이다.

결론은 소라페닙 먹은 암환자들의 연구기간 동안의 생존확률이 계속 높은 걸 알 수 있다.


이런 식으로 그래프가 지닌 의미를 파악하면 논문이 원하는 정보를 흡수할 수 있다.


----


다음 그림은 Forest plot(숲 그림)이라는 그래프이다.  

도표가 여러 선들이 모여 있는 숲처럼 보여서 그런 이름이 붙었다고 한다.


생긴 건, 가운데 동그라미 점이 있고 양옆으로 가로선이 있다.

동그라미 점은 계산된 ‘값’이고, 왼쪽/오른쪽 선은 ‘신뢰구간’의 최저값과 최댓값이다.




(중략)




‘신뢰구간’이란?

우리가 추정한 값이 95% 확률로 이 구간 안에 있을 것으로 예상되는 범위이다.


'값이 맞으면 맞는 것이고, 아니면 아닌 거지 그게 무슨 말이야?'


통계는 ‘진실’을 구하는 방법이긴 하지만, 실제 ‘진실’을 구할 수 없다.

2023년부터 2033년까지 소라페닙으로 치료받은 지구상 ‘모든’ 갑상선 암환자의 치료율과 생존율을 구할 수 없다. 그만큼의 돈과 인력은 둘째 치고, ‘모든’ 갑상선 암환자가 연구에 참여할 리 없기 때문이다.


이런 식이다.

우리가 연구를 통해 갑상선 암환자의 치료율을 구한 값이 95%의 신뢰도를 갖는다면,

소라페닙을 썼을 때 갑상선 암환자의 치료율은 어떤 범위를 가질 것이다.

예를 들어 치료율의 범위가 30%에서 35% 정도 나왔다고 쳐보자.


그럼 앞으로 소라페닙을 갑상선 암환자에게 썼을 때, 치료가 될 확률이 30%에서 35% 사이에서 나올 확률 자체의 신뢰도가 95%라는 것이다.



따라서, 통계는 이러한 ‘영원히 알 수 없는 진실’을 찾기 위한 방법이다. 진실에 최대한 가까워지게 노력할 뿐이다. '영원히 알 수 없는 실제 진실'에 가까워지려면 전수조사(조건에 해당하는 모두)를 조사해야 하는데, 조건에 해당하는 모두를 '모집단'이라고 한다. 그 모집단 중 일부를 조사하는 걸 '표본수집'이라고 한다.

진실에 가까워지려면 표본이 모집단과 비슷한 성질을 띄어야 하며, 그 수가 최대한 많을수록 좋다.


이 연구에서는 소라페닙을 ‘사용하는 모든 환자’가 ‘모집단’이 되며 실제로 모집단의 결과를 알 수 없으니 18개 국가의 207명이라는 ‘표본’을 조사해서 논문으로 보여준 것이다.


----

다시 돌아가서 신뢰구간은 그렇기에 이 ‘진실’에 얼마나 가까운지를 보여주는 것이다.

그림에서 보면, B그림은 왼쪽으로 갈수록; 소라페닙을 쓸수록 ‘안 좋은 예후가 발생할 확률=HR’이 적었다는 이야기고(=소라페닙 킹왕짱), 오른쪽으로 갈수록; 소라페닙이 별로였다는 뜻이다..


여기서 동그라미는 그 확률을 계산한 ‘값’이고 좌우 선 길이는 신뢰구간의 범위이다.

그 좌우 선이 가운데 'HR' 선보다 오른쪽으로 가면 (기준을 넘으면) "소라페닙 킹왕짱"이라고 말하기 애매한 것이다. 예상한 범위가 아닌, 좀 튀는 답이 나왔다고 보면 된다.

 (= 95% 확률로 '진실'이 있다는 말이 모호하다 = 소라페닙이 별로이다)


좌우 선이 가운데 'HR'선보다 왼쪽으로 가면 (기준 내에 있으면) "소라페닙 킹왕짱"이라고 할 수 있다.

 (= 95% 확률로 '진실'이 있다는 말이 참이다 = 소라페닙이 킹왕짱이다)


B그림의 대부분의 점이 왼쪽에 위치했으니 소라페닙을 쓸수록 PFS위험 즉, 치료기간 동안 합병증 등 예후가 안 좋은 일이 발생할 위험이 적어졌다는 뜻이다.

북미에 사는 사람들은 소라페닙 때문에 좋아졌다고 하긴 확실치 않고, 유럽과 아시아에 거주하는 사람들은 소라페닙이 좋았구나, 하고 얘기한다.



요런 느낌들을 익혀가며 결과를 읽어줄 수 있다.

Figure는 순서대로 위에서 아래, x와 y좌표 내용을 파악하며 보면 된다.


Table과 Figure에 쓰여 있는 글자들은 간단하게 써둔 것이라 Table 하단 각주(Footnote)나 Figure의 캡션을 참고하여 이해하면 된다.


결국, 중요한 건 ‘소라페닙 효과 킹왕짱 대박’이라는 결과를 얻기 위해 어떤 사람들의 결과를 수집해, 그 사람들의 특징은 무엇이며, 실제 비교를 했을 때 얼마나 차이가 있었는지를 독자들이 알아가는 것이다.


고로, 독자인 우리는 연구자들의 의도에 맞게 읽어주면 논문의 1차 목표를 달성한 것이다.





그렇다고 연구자가 말한 ‘의도’만 보고 넘어가선 안된다.

배경부터 시작해 결과까지 쭉 기술한 것을 보고 우리에게 생겨난 의문들을 마무리하고 논문을 덮어야 한다.


초록과 배경, 방법론을 읽으며 생겨난 의문점이 결과나 표 안에서 해소되었을 수도 있지만 더 중요한 이야기는 Discussion; 고찰에 있다.


말 그대로 논문의 연구결과를 볶아도 보고, 튀겨도 보고, 삶아도 보자는 것이다.

어떻게? 기존의 문헌들과 함께!

이쯤 되면 아실 것이다.


‘기존의 문헌이 중요하구나~’


그렇기에 우리가 지금 하는 이 행위, 논문을 보는 이 행위가 참으로 중요한 행위이다.

그리고 이것을 집합하여 작성하는 건 고찰에서 빛을 발한다.


우리 결과는 소라페닙이 킹왕짱인데 다른 연구에서도 그랬어. 근데 어떤 연구에선 안 그랬어. 근데 그 연구는 우리 연구랑 다르게 연령대가 낮았어. 연령대가 낮아서 안 좋은 예후가 있다고 또 다른 연구에서 보고했어.


요런 식으로 진행이 된다.


마지막 단에는 연구의 한계점을 적고, 그럼에도 가지는 강점을 적으며 결론을 짓는다.

‘그런 거 적어주면 까이는 거 아냐?’


그렇지 않다.

연구는 솔직해야 한다.

그래서 독자가 읽고 객관적인 판단을 할 수 있게 이바지해야 한다.


거짓말로 한계를 감추고 설명하지 않는다면 논문이 될 수 없다.




여기까지 논문 결과 보는 방법과 고찰이 무슨 역할을 하는지 확인했다.

생각했던 것보다 쉬웠다고 보고,

‘논문, 그까짓 거.’

라는 마음으로 이 챕터를 끝까지 봐주시기 바란다.


그다음 당신이 가질 수 있는 또 다른 직업 중 하나인 메디컬라이터에 도전해 보길 진심으로 기원한다.






저자 소개

에이전시 메디컬라이터로 제약산업 마케팅의 메디컬 콘텐츠 생산자이자 메디컬 커뮤니케이터로 일하고 있다. 지방 4년제 간호학과를 꼴찌를 겨우 면하여 졸업한 뒤, 임상 1년을 쌓았다. 그 뒤로 코이카 해외봉사 1.8년, 환경역학 보건연구간호사 1년, 국제보건 사업관리자 10개월, 보건소 역학조사관 6개월, 발암물질 간행물 집필 연구원 6개월을 거쳐 지금의 회사로 왔다. 더불어 온라인 석사과정(영국) 1년과 국내 일반대학원 석박통합과정생 2년(ing)으로 박사학위를 위해 달려 나가고 있다.



편집자 소개

지방 4년제 간호학과를 막 졸업하고, 지방 종합병원의 VIP병동에서 8개월간 근무를 했다.

입사 6개월 차가 되던 때에 취미로 사이드 프로젝트를 하나 시작했다. '나는 직장생활이 불행한데, 다들 그런가'라는 순수한 궁금증에서 비롯된 인터뷰 프로젝트였다. 간호사가 아닌 다른 직종에서 근무하는 사람들에게 자신의 일에 만족하는지, 좋아하는 일을 하고 사는지 인터뷰를 하고 다녔다. 그러던 중, 운이 좋게 저자와 만나 '편집자'라는 거창한 칭호까지 받으며 본 매거진 집필에 참여하게 됐다. 



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari