과학이나 의학계 연구자들은 자신의 논문을 동료 평가(peer review)를 받는다. 과거에는 학술저널에 논문을 투고하고 심사받고 게재되는 모든 과정이 우편으로 진행되었다. 그래서 학술지의 편집자는 얼마든지 남의 연구결과를 가로챌 수 있었다. 접수된 논문을 잠시 보류해 두고 편집자가 거의 똑같은 내용의 논문을 써서 먼저 출판한다든지, 편집자가 투고자에게 공동저자로 함께 논문을 내자고 제안하기도 한다. 물론 편집자가 투고자의 업적을 가로채는 일은 극히 예외적인 사례이다.
1990년대 초반 인터넷이 보급되고 이를 이용해 ‘예비’ 논문(preprint)을 별도의 저장소(arxiv.org)에 보관하면서 상황이 달라졌다. 처음에는 미국 로스앨러모스 연구소(Los Alamos National Laboratory)에서 관리하다가 지금은 코넬대학에서 운영 중이다.
사전공개 논문(preprint)은 동료 평가를 거치지 않은 연구 논문이다. 학술지에 정식으로 게재하기 전 동료들의 평가를 거치지 않은 상태에서 연구결과를 공개한 것이다. 아카이브(arXiv)와 바이오아카이브(bioRxiv)가 대표적인 논문 사전공개 사이트다.
논문을 쓰면 전자논문 형태로 사전공개 사이트에 먼저 등록한다. 모든 사전공개논문에는 고유번호가 부여되어 누가 언제 무슨 논문을 등록했는지 거의 실시간으로 알 수 있다. 등록한 순서대로 고유번호가 찍히기 때문에 연구에 대한 우선권이나 기여도를 평가하는 데에 도움이 된다. 남의 ‘예비’ 논문을 보고 벼락치기로 자신의 이름으로 비슷한 ‘예비’ 논문을 작성해 등록하는 도둑질이 있을 수는 있다. 이렇게 앞서거나 뒤서거니 나오는 논문들은 동시발견의 업적으로 인정받을 수도 있다. 어느 시스템이나 구멍이 전혀 없을 수는 없다. 사전공개제도는 이런 도둑질의 개연성을 훨씬 줄였다.
문제는 사전공개 논문(preprint)은 나중에 철회되거나 결론이 바뀌는 경우가 있다는 점이다. 아직 동료평가를 받지 않았기 때문이다. 이를 기초로 뉴스가 나오거나 인용된 경우 잘못된 정보일 수 있어 유의하여야 한다. 일반인들은 사전공개 논문의 의미를 잘 모른다. 미국의 성인들 중 약 30%만이 사전공개논문이 무엇인지를 정확하게 안다. 설령 일반인에게 사전공개 논문이 무엇인지 설명하더라도 논문에 대한 신뢰에서 차이가 나지도 않는다. 사전공개 논문을 정확히 이해하지도 못하기 때문이다. 사전공재 논문을 기초로 쓰인 기사라면 나중에 어느 저널에 실렸는지 확인하여야 한다. 바쁜 일반인에게는 무리이다. 과학기사를 인용하는 사람들이 확인하고 수정 기사를 내야하지만 그런 것을 거의 본적이 없다.