You can make anything
by writing

C.S.Lewis

악플이 달렸다 (1)

유튜브도 아닌 논문에

by 단호박 Feb 15. 2025

"Congratulations on your recent publication! “

작년 이맘때, 우여곡절 끝에 논문 한 편을 출판했다. 동료평가 (peer review)에서 제안된 추가 실험을 하느라 제출부터 출판까지 꽤 긴 시간이 걸렸던 논문이었다. 무사히 출판이 되어 제1 저자인 학생은 학위를 받고 취업에도 성공했다. 기쁘고 홀가분했다. 

논문이 온라인에 공개되고 얼마 지나지 않아 한 통의 이메일이 도착했다. 미국 W 대학의 A 교수. 낯이 익은 이름이었다. 관련 연구를 많이 하는 사람이어서 우리 논문에도 그 팀의 연구를 여러 편 인용했던 터였다. 이메일의 내용은 간단했다. 

”논문을 흥미롭게 읽었고 출판을 축하한다. 몇몇 결과에 대해 좀 더 알고 싶은데 원데이터 (raw data)를 공유해 줄 수 있을까? “

보통 논문에는 Data availability statement를 싣기 때문에 이런 요청이 오면 데이터를 제공한다. 나는 A 교수에게 그 팀의 연구를 통해 많이 배우게 되어 고맙고 공유하는 데이터는 K 학생의 실험 결과라는 것을 명시해서 이메일을 보냈다.      


뒤통수를 세게 맞았다     

K 학생이 취업을 해서 실험실을 떠난 지도 몇 달이 지나, 가을이 한참 무르익던 어느 날이었다. 논문을 실었던 학술지의 에디터로부터 뜻밖의 이메일이 도착했다.

"당신들의 논문에 대한 Commentary(논평)가 접수되었습니다. 이에 대해 답변을 제출하고 싶다면 Response(답변)를 작성할 수 있습니다."

Commentary? 

순간 눈을 의심했다. 작성자는 다름 아닌 데이터를 요청했던 A 교수 팀이었다. 


그 글은 단연코, 그동안 내가 읽어본 학술지에 실린 글 중 가장 악의가 느껴지는 글이었다. 한 땀 한 땀 정성스럽게 수놓은 영문 악플이라니. 게다가 이 글이 동료 평가까지 마친 논문이라니, 어이가 많이 없었다. 아니, 나를 언제 봤다고, 왜 이러는 거지? 그런데, 악플을 정성스럽게도 쓴 데 비해 주장은 간단했다. 

우리가 연구한 단백질이 자기들이 주로 연구하는 같은 족(family)에 속한 다른 단백질과 다른 특성을 보이기 때문에 우리가 보고한 결과가 전적으로 잘못되었다는 것이다. 

보통 과학자로 훈련받은 사람들은 자신이 시험하지 않은 것에 대해 단정적으로 말하지 않는다. (생각해 보니, 자기가 시험한 것도 단정적으로 말하기는 어렵다. 내가 아는 범위, 내가 시험한 범위 안에서는 이렇다,라고 말하게 된다) 그런데, 이 사람들은 우리와 동일한 단백질로 재현실험을 한 것도 아닌데, 자기들이 연구하는 다른 단백질의 결과에 비추어 ”이 연구는 틀렸다. “라고 결론을 내리고 있었다. 이게 무슨... 


뒤통수가 얼얼했다. 데이터를 요청할 때는 비교 연구라던가, 추가 연구에 활용하려는 줄 알았지 이런 걸 써서 저널에 보낼 줄은 예상하지 못했다. 물론, 연구 결과를 공개할 때는 이 연구가 다른 연구자들에게 검증이 될 수 있고, 이 일을 바탕으로 후속 연구가 진행될 수 있다는 것을 당연히 알고 있다. 학회에서 구두 발표를 하고 논쟁을 벌이는 일도 흔한 일이다. 의심할 수 있고 (또 의심해야 하고), 의문을 제기할 수 있다. 하지만 논리적으로 부족한 가정 위에 세운 결론이 한 논문의 신뢰도를 부정하는 근거가 될 수는 없다고 생각했다.      


"강의평가 악플은 귀여운 수준이구만."

출판한 논문수가 어느새 나이보다 많아진 나도 이런 일은 처음 겪는데, 학위 논문을 막 마치고 신입사원이 된 K 학생은 얼마나 당황스러웠을까? 일단 내용을 공유하고, 어떻게 대응할지는 내가 계획을 세우기로 했다. 언짢은 기분을 뒤로하고 commentary를 여러 번 꼼꼼하게 읽고 분석했다. 

그런데, 읽으면 읽을수록, 이상하게 기분이 슬슬 좋아지기 시작했다. 으흐흐흐. 여기저기 논리의 허점이 보였기 때문이다. 머릿속에 commentary에서 사용된 논리를 그대로 사용해 반박할 수 있는 지점들이 떠오르며 살짝 즐거워지기까지 했다. 뭐야, 나의 도파민은 이런 때 나오는 건가?  

  

단백질은 20개의 아미노산으로 구성되는데 각각 고유한 서열(sequence)을 가지고 있다. 재미있게도 우리가 연구한 단백질이 속한 족(family)은 서열이 조금만 달라져도 특성이 크게 달라진다는 점이 알려져 있었고, commentary에서도 이 사실을 언급하며 인정하고 있었다. 그런데 A 교수팀은 우리가 사용한 단백질과 자신들의 단백질의 서열이 얼마나 유사한지 비교해 보지도 않고, 자신들이 연구에 사용한 단백질의 특성에 기대어 논리를 전개하고 있었다. 요즘 또 기계학습은 얼마나 발전했는지, 서열을 입력하면 특성을 예측하는 프로그램도 있다. 서열과 특성을 예측해 보니 실제로 서열의 차이가 크고 특성도 다르게 예측되었다. 즉 A 교수팀에서 연구한 단백질의 결과를 바탕으로 같은 족(family)의 다른 단백질도 같은 특성을 가질 것이라고 단정하는 것은 무리였다.     


우리가 연구한 단백질은 다른 단백질의 응집(aggregation)을 막아주는 효과가 있었다. 응집이란 단백질이 여러 요인에 의해 서로 뭉쳐서 수용액 상에서 용해되지 않고 작은 입자나 섬유(fiber) 구조 등을 만드는 현상이다. K는 특정 효소 단백질을 얼렸다 녹이거나, 말렸다가 다시 물에 녹여서 응집을 유도했다. 여기에 우리가 연구한 단백질을 처리해서 응집을 막는데 효과가 있는지 분석하였다. A 교수팀은 이 중 말렸다가 녹여서 응집을 유도한 데이터만 통계 처리를 하고는,

“통계적으로 의미 있는 차이가 없다! 이 단백질이 효소 단백질의 응집을 막는 효과가 없다!”라고 주장했다. 

...???

재미있는 것은 우리에게 데이터를 다 받아갔기 때문에, 얼렸다가 녹이는 과정이 말리고/물에 녹이는 과정보다 응집을 "통계적으로 유의미하게" 많이 일으킨다는 것을 쉽게 알 수 있었을 것이다. 얼렸다가 녹이는 과정에서 우리 단백질을 처리하면 "통계적으로 유의미하게" 단백질의 응집을 막는 효과가 관측된다는 것도. 그럼에도 불구하고 일부 데이터만 사용해서 원하는 방향으로 주장을 하고 있었다. 


“통계로 시비를 걸어오니, 우리도 통계로 대응을 하자. 돌려주는 맛이 나쁘지 않은데?”

스트레스받아하면서도 점점 즐거워하는 나를 학생들이 수상쩍게 바라봤다.      


K와 실험실 학생들의 도움을 받아 검증을 마무리하고, 논리뿐만 아니라 글의 까지 고려해 답변을 작성해 보냈다. 곧 편집자로부터 우리의 답변을 내부적으로 평가한 뒤 어떻게 진행할 것인지 알려주겠다는 회신이 왔다. 그로부터 거의 두 달이 흐르는 동안 아무 연락이 없어 궁금해하고 있었는데,


Commentary 가 수정되었습니다. 새로운 버전을 확인하시고 답변해 주세요.

... 뭐라고?      

(2편에서 계속)          

매거진의 이전글 뒤늦은 감사의 말

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari