brunch

논문 통계, 본질을 알고 접근하는 것이 좋다.

논문 통계를 접근하는 추천 방법과 비추천 방법

by 킴익스피어

양적 연구를 진행하는 경우, 논문 통계 결과가 결론을 좌우하게 된다. 그러나 자료 수집을 하는 단계에서는 통계 결과값이 어떻게 나올지 전혀 알 수 없다. 원래대로라면 연구 가설을 세우고 그 가설에 따라 통계를 돌리며, 원하는 값이건 아니건 그 결과를 결론으로 작성하는 것이 정석일 것이다.


간혹 연구 가설 전부가 기각된 연구 논문을 볼 수 있다. 사실, 가설이 기각됐을지라도 분명 그 연구도 학술적 가치가 있는 것이다. 기각되면 기각되는 대로 그 방향으로 결론을 내리면 되기 때문이다. 그러나 대부분의 학위 논문과 학술지 논문은 기본적으로 1~2개 정도의 가설은 지지된 경우가 다수이다. 보통 3개 중 2개 정도는 지지, 1개는 기각된 경우가 많다.


그렇다면, 어떻게 원하는 결과를 얻을 수 있을까?


통계 멘토님께 이 부분에 대해서 상담을 한 적이 있다. 멘토님은 코딩한 값에 대하여 이러저러한 통계 명령어를 쭉 입력하고 한 번에 엑셀로 추출하여 결과값 중 유의수준이 높은 것을 뽑아내는 방법이 있다고 했다. 이것을 픽킹? 이라고 했던가? 정확하게 기억나지는 않는다.


나는 통계 멘토님께 통계를 돌리는 방법을 배운 것이고, 지속적으로 수정하고 보완하며 결과값을 만들어내는 것은 내 몫이었기 때문에 정말 정말 골치가 아팠다. 내가 저런 픽킹을 어떻게 한단 말인가? 결국 생전 처음 써보는 프로그램(STATA)을 갖고 몇 달 동안 씨름했다.


자료를 수집하면서 ‘아 왠지 이런 결과 값이 나올 것 같은데?’라고 생각했던 부분도 막상 통계를 돌려보니 유의수준이 그리 높지 않은 값이 나와 좌절하기도 했다. 그러나 포기하지 않았다. 이런저런 가설을 계속 만들어내면서 수백 번은 돌렸다.


통계 폴더 안에 들어가 보면 그 당시 밤 늦게까지 고민하며 작업했던 흔적이 남아있다. 결국은 손품이다. 가설을 이것저것 계속 만들고 그 가설에 맞는 명령어를 입력하여 통계를 계속 뽑아대는 것이다.



이것이 다가 아니다. 그 결과를 지도 교수님께서 오케이해 주셔야 한다. 지도 교수님이 승인하지 않으시면 그 이후 진도를 나갈 수가 없다. 정말 다행히도 여러 번의 보완 작업 후 지도 교수님이 이 정도면 이제 써도 될 것 같다고 말씀해 주셨다.(물론 예비심사 이후 한번 뒤집어서 다시 돌리기는 했다. 사진의 폴더를 보면 알겠지만 최종이 여러 번 등장한다. 끝날 때까지 끝난 게 아니다.)


그 과정에서 STATA 사이트, 엄청난 구글링, 각종 통계 관련 유튜브의 도움을 받았다. 1차적으로 찾아볼 수 있는 것은 전부 찾아보고, 정 모를 때는 통계 멘토님께 도움을 요청했다. 이렇듯 논문 통계는 쉽지 않다. 자료 수집부터 시작하여 결과물로 만들어내는 데 있어서 논문의 중추적인 역할을 하기에 더욱 그렇다.


그래서 처음부터 제대로 접근하는 것이 좋다. 논문 통계를 접근하는 추천 방법과 비추천 방법으로 마무리해볼까 한다.


<추천 방법>

논문 통계 과외를 받는다. 물론 혼자 책을 보며 독학할 수 있으면 그렇게 해도 좋다.(열정 넘치고 책임감 있는 분을 만나면 금상첨화이다. 논문이 다 끝날 때까지 AS가 가능한 분으로, 본인의 성향과 잘 맞는 분으로 정하는 것이 포인트다.)


<비추천 방법>

논문 통계를 의뢰한다. 결과물까지 만들어달라고 한다.

(논문을 작성하는 몇 개월 동안, 수정 보완해야 하는 사항이 나올 때마다 지속적으로 의뢰할 생각인가? 지도 교수님은 몇 마디만 얘기해 봐도 직접 돌린 통계인지 아닌지 아실 것이다.)




keyword
이전 12화카피킬러(copykiller) 역활용하기