brunch

You can make anything
by writing

C.S.Lewis

by ChulW Jan 18. 2024

또 대유행 시작한 논문 표절 이야기.

2015년 8월 8일에 쓴 거 다시 옮겨옴.

/$ 2015년 8월 경에 쓴 걸 다시 가져 옴/

모 장관 후보자 논문들을 이런 논문 표절 검색 사이트라는 곳을 활용하여 표절율 이야기가 있어 갑자기 흥미가 생겨 요즘 유행하는 표절 검색 사이트에 2000년 2월에 나온 내 박사 학위 논문 (클릭하면 제 박사학위 논문 전체를 다운받을 수 있습니다.) 갖고 표절율을 체크해봤다.

먼저 ‘초록’ 부분을 돌려 봤더니 표절율 45%라는 놀라운 수치가 나왔고,


2000년 2월에 나온 내 박사 학위 논문의 초록 부분을 모 표절 검색 사이트에 돌려 봤을 때 나온 결과, 표절율 45%의 의미는 과연 무엇일까???

이어서 ‘문헌연구’의 일부분을 돌려봤더니 표절율 78%라는 또 놀라운 수치가 나왔다.


내 학위논문의 문헌연구 부분의 일부만을 갖고 돌려봤을 때 나온 표절률 78%???? ㅎㅎㅎㅎㅎㅎ

일단 결론만 먼저 이야기하자면, 여기에 나온 수치들은 완벽하게 틀렸다.

왜 완벽하게 틀렸는지는 옆에 나온 소위 ‘표절 소스;라는 것의 정체 문제 때문이다.  

먼저 모든 항목에 공통적으로 나온 표절한 소스라고 나온 게 바로 내 박사 논문이었기 때문이다. 그렇다면, 표절율 100%가 나왔어야 하는데, 왜 100%가 안나왔냐 하고 항변하는 바보들이 있을 것이다. 그 이유는 붉은 색으로 표절 소스라고 당당하게 표시된 글의 문장 내용을 보면 쉽게 알 수 있는데, 저 사이트들이 어디서 내 박사 논문을 구했나 했더니, 서울대학교 도서관에 있는 내 학위논문 PDF를 구해 DB를 만든 모양인데, 내가 당시에 제출할 때는 Adobe Acrobat이 요즘보다 안좋아서 ‘IMAGE’ 모드로 만들어 제출했다. 이게 무슨 뜻인가 하면, ‘글꼴 정보가 없는 PDF’란 의미로 PDF에서 ‘Text extraction’을 하지 못하게 해놨었다. 그러다 보니 이들이 OCR 프로그램을 활용하여 스캔한 후 그걸 갖고 괴발개발로 편집해서 소스로 쓰고 있는 모양이다. 어떻게 보면 저기에 표절율이라 되어 있는 수치는 나에게 한하여, 저 업체가 갖고 있는 내 박사논문 PDF의 OCR 인식률이라고 볼 수 있겠다.

그럼 그 외에 나와 있는 다양한 유사 문장들은 무엇인가 하면, 내 박사 논문의 문헌 연구를 내 랩 및 주변 과 후배들이 많이 가져다가 그대로 썼는데, 그런 애들의 최소 3명에서 수십 명의 학위 논문과 겹친다고 나온 것이다. 참고로 랩 후배 녀석들이 표절의 전형적인 수법을 써서 한 녀석이 한둘 있었나 본데, 한두놈은 내 논문에 있는 문헌 연구 참고 문헌을 다 날리고 문장을 쓴 것이다. ㅋㅋㅋㅋㅋ, 그래서 왼쪽의 내 논문엔 붙어 있는 참고문헌이 없이 문장이 구성되어 있다.

또 그외에 2가지 정도가 새로이 발견되었는데, 2000년에 나온 내 학위 논문을 가져다가 2014년에 고려대 공대 김모 교수가 수업 자료로 그대로 문장을 복사해 쓰고 있는 모양이다. 그 친구가 에너지, 환경 전공도 아니면서 자기가 에너지와 환경 수업하려고 내 학위 논문 내용을 복붙하여 가져다 쓰는 사례가 추적되었다 볼 수 있겠다. 어떻게 보면, 꺼꾸로 표절한 자료가 추적된 사례라 할 수 있겠다. 그럼 여기서 또 멍청하게 주장하는 이들이 있겠지만, 2014년의 고려대 공대 수업 자료와 내 2000년 학위논문을 비교했을 때, 내가 2000년에 2014년의 고려대 공대 교수가 수업 자료를 만들 것을 더 미래로 타임머신을 타고 가서 해킹해서 갖고 왔다는 황당한 시나리오가 성립하는 경우를 제외하고는 2000년에 나온 내 학위 논문이 원전이 될 수 밖에 없게 된다.

또다른 하나의 표절자료로 지질자원연구원의 2005년 과제 결과 보고서에도 내 학위 논문 문헌 연구가 그대로 복붙되어 쓰이고 있었다. 그럼, 2005년에 나온 걸 내 2000년 학위 논문이 표절한 거임. 주객이 전도된 것이지.


외려, 내 학위 논문이 우측 표절 검색 사이트에 있는 자료들의 ‘소스이자 원전’임에도 저 사이트에 넣어 기계적으로 돌리면, 내 2000년 학위 논문의 초록과 문헌 연구는 표절율 (사실상 내 학위논문의 OCR 인식률인.)이 45%, 78%라는 황당한 상황이 전개된다. 그럼, 논문에 관해 이해도 없는 이들이 이런 사이트를 무분별하게 이용하여 이 사이트는 신뢰할 수 있다 주장하며, 내 학위 논문도 표절율도 초록은 45%, 문헌연구는 78%라는 아스트랄한 수치가 나오는 것이다.


결국 이런 사이트들은 ‘최근에 작성된 논문 혹은 문건’의 표절율을 체크하는 것 말고는 지금으로선 할 수 있는 게 없다. 아니면, 적어도 체크할 때 표절 체크 대상 논문이나 문건의 ‘작성시점’을 변수로 입력할 수 있게 해줄 필요가 있다.

여하간에 황당한 수치를 보고 배꼽을 잡았는데, 이런 사이트를 갖고 기출간된 논문들의 표절율을 잡는다는 것은 진짜 학자들 말고는 불가능에 가깝다고 보면 된다.

요 며칠, 모 장관 내정자의 논문 표절율이 78%라는 기사가 나온 걸 본 적 있는데 우연찮게도 내 학위논문의 문헌연구 표절율과도 일치한다.

덧붙여, 이 사이트들에 아쉬운 점은 사용하는 OCR 프로그램의 성능이 좋았다면, 표절율 100%라는 수치를 볼 수 있었을텐데, 성능이 너무 떨어져서인지 45%와 78%라는 아쉬운 표절율(실제로는 내 학위논문 OCR 인식률)을 얻었다는 점이다.

논문의 표절에 관해 여러 사람들이 이야길 하는데, 입진보 측의 무지랭이들도 그렇고, 애국보수라 하는 애들의 멍청한 방식의 표절 주장, 모두 추잡할 뿐이다. 양측다 논문에 관해 모르는기는 매한가지니까.

그만들 했으면 좋겠다.


매거진의 이전글 괴학의 시대
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari