# 1편에 이어
논문 얘기가 나왔으니 논문을 읽는 방법에 대해 보다 구체적으로 이야기를 해보자. '아니, 논문을 그냥 읽으면 되지 읽는 방법이 어디 따로 있나'라는 반문을 할 수도 있지만 극한의 효율충인 우리는 1분 1초 한시도 허투루 쓸 수 없다. 따라서 논문을 그냥 소설처럼 처음부터 순서대로 읽어 내려가서는 안되며 비문학 독해를 풀듯이 그렇게 전략적으로 읽어야 한다. 지난번에 논문들의 트리 구조를 이야기하면서 전체적인 판을 까는 연습을 했다면, 여기서는 한 편의 논문을 읽을 때 어떻게 하면 효율적으로 공부를 할 수 있을지를 한 번 이야기해 보도록 하자.
# 논문의 구성요소
우선 논문을 효율적으로 공부하기 위해서는 논문이라는 학술 문서가 가지고 있는 정형적인 구조에 대해 살펴볼 필요가 있다. 이 구조만 제대로 파악하고 있어도 논문 공부의 효과가 한층 높아진다. 일반적인 논문의 구조는 아래와 같은 순서로 구성되어 있다.
1) 제목(Title)
2) 초록(Abstract)
3) 서론(Introduction)
4) 문제 정의 및 연구 목표(Problem Statement)
5) 연구 배경(Background/Literature Review)
6) 연구 방법(Data and Methodology)
7) 연구 결과(Result)
8) 결론(Conclusion)
9) 참고문헌(References)
10) 부록(Appendix)
# 논문 독법 101
이렇게 논문에는 일정한 구조, 즉 일정한 템플릿이 존재한다. 따라서 우리는 논문 상에서 각 절의 구체적인 내용을 샅샅이 읽어보지 않아도 그 절이 어떤 목적의식을 가지고 있는가를 알 수 있다. 그렇다면, 이러한 정형화된 구조를 가진 논문이라는 녀석, 어떻게 읽어야 할까? 효과적인 논문 독법은 다음과 같이 크게 네 가지 단계를 거친다.
1) 제목/초록/그림/표
우선 논문을 볼 때 가장 처음 읽어야 할 부분, 당연히 제목과 초록이다. 우리가 서점에 가서 책을 고를 때 우선적으로 그 책의 표지에 있는 제목을 먼저 보는 것처럼 논문의 제목 또한 그 논문이 담고 있는 내용을 한 마디로 표현하고 있다. 또한 제목과 더불어 논문의 맨 앞에 나오는 것이 바로 초록이다. 초록은 논문에서 예고편과 같은 역할을 한다. 따라서 초록을 읽으면 해당 논문이 어떤 주제로 어떤 내용을 말할 것인가를 짧은 시간 내에 파악할 수 있다.
그다음에 봐야 할 부분은 바로 다름 아닌 시각적인 요소들, 즉 그림과 표다. 왜 본문에 있는 텍스트를 읽기 전에 우선 그림과 표를 들여다봐야 하는 것일까? 그 이유는 그림과 표야말로 연구 결과를 압축적으로 임팩트 있게 보여줄 수 있는 방식이기 때문이다. 그림과 표, 그리고 이에 딸려 있는 조그만 설명들을 읽으면서 연구의 전개 방식 혹은 연구 결과를 직관적으로 인식할 수 있다. 퀀트와 관련한 논문들에서 자주 볼 수 있는 그림 혹은 표는 백테스팅 결과, 시뮬레이션 분석 결과, 매개변수 변화에 따른 헤징 효과 결과 등 실무적으로 퀀트가 프로그래밍을 통해 구현해 내는 내용들이기에 이를 주의 깊게 살펴본다면 향후 스스로 분석이나 구현을 해보기 전 많은 영감을 받을 수 있다.
2) 서론과 결론
제목과 초록, 그리고 시각적 결과를 한 번 스윽 살펴봤다면, 이제 비로소 논문의 시작과 끝을 담당하는 서론과 결론을 읽을 차례다. 그다음으로 서론과 결론을 읽어야 하는 이유는 여기에 논문 저자의 의도와 전반적인 연구 과정 및 그 결과가 일목요연하게 정리되어 있기 때문이다. 사실 논문을 전부 읽지 않더라도 이 정도까지 온다면 이 논문의 핵심 내용과 줄기를 손쉽게 추출해낼 수 있다. 그만큼 목적의식이나 주제에 대한 정보 함유량이 가장 많은 부분이 바로 이 서론과 결론이다. 이 연구가 성공적이었는지 그렇지 못했는지, 저자는 이 연구를 통해 소기의 목적을 달성했는지 그렇지 못했는지를 단시간에 파악함으로써 우리는 이 논문을 더 들여다볼지 아니면 다른 논문을 좀 더 검색해 볼지 우리의 입장에 맞게 추론해 볼 수 있다.
3) 데이터 및 방법론
만약 1번과 2번 과정을 통해 이 논문의 전반적인 내용이 마음에 들었고 보다 구체적으로 논문 저자가 어떤 데이터 혹은 테크닉을 사용해 연구 분석을 진행했는지 알고 싶다면 이제 해야 할 일은 바로 연구 방법 섹션으로 넘어가 논문 저자의 구체적인 실험 과정을 따라가보는 것이다.
데이터는 어떤 주기, 어떤 종류의 데이터를 사용했는지, 데이터 전처리는 어떻게 수행했는지, 어떤 모델이나 기법을 사용해 데이터를 분석했는지 등을 생각하며 이 부분을 읽어 내려간다. 특히나 이 부분에서는 구체적인 모델이나 분석 기법이 나올 것이기 때문에 수식적인 요소들이 등장할 것이다. 만약 이러한 수식들을 보면서 금방 이해가 안 된다면, 나중에 추가적인 공부를 위해 그 수식이 어떤 개념을 말하고 있는지 혹은 그 모델의 이름을 기억해두도록 하자. 또한 데이터 및 방법론 섹션을 보면서 나라면 이를 어떻게 실제로 구현해낼지에 대한 고민을 해보는 것도 좋다.
4) 그 외 디테일
만약 위의 과정을 전부 거쳤는데 이 논문의 내용이 너무 마음에 들고 이에 대해 더 알아보고 싶다면 그 외의 다른 내용들도 시간이 날 때 읽어보면 된다. 앞서 언급했지만 논문을 소설처럼 순서대로 읽을 필요는 없다. 아니, 순서대로 읽는 것이 되려 좋은 방법은 아니라고 본다. 실무를 위한 공부를 할 때만큼은 완벽주의를 내려놓자.
사실 다른 논문들을 하나도 보지 않고 어떤 한 편의 논문을 완벽하게 이해하는 일이란 굉장히 어려운 일이다. 따라서 논문을 읽을 때는 어떤 주제와 관련된 여러 편의 논문을 빠르게 훑어보며 우리 뇌가 여기에 익숙해지도록 만드는 게 급선무다. 따라서 논문 공부를 할 때는 논문들의 트리 구조를 만들어나가는 동시에 각 논문들에 대한 이해도를 점진적으로 높여나가는 방식이 좋다. A 논문의 이해도를 10% 쌓아놓고 B 논문으로 넘어가 또 10%, C 논문으로 넘어가 또 10%, 이제 A 논문으로 다시 돌아와 20% 이런 식으로 말이다.
개념 이해의 정도란 사실 익숙함의 정도다. 뇌는 가소성을 가지고 있음을 잊지 말자. 5편에서 20편 정도의 논문을 보면 어떤 개념에 대해 익숙해지기 때문에 남들에게 그 정의를 간단하게 설명할 정도가 되며, 50편에서 100편 정도의 논문을 본다면 그 개념을 비교적 심오한 수준까지 이해할 정도가 된다. 수능을 치기 위해 문제집을 단 한 권만 사는 학생은 없지 않은가. 똑같은 논리다.
# 논문 정리노트
또한 논문을 읽으면서 우리는 계속해서 자기 자신과 계속 대화를 해야 한다. 여기서 말하는 대화란 질문과 대답이 반복되는 Q&A를 뜻한다. 논문을 읽으면서 혹은 논문을 다 읽고 난 뒤에 우리는 다음과 같은 질문들에 대답할 준비가 되어 있어야 한다.
이 논문은 어떤 문제를 해결하고자 하는가?
그 문제를 해결하기 위해 어떤 데이터, 모델 혹은 아이디어를 사용했는가?
어떤 환경과 맥락 속에서 그러한 모델이 탄생하게 되었는가?
이 모델은 이전 세대 모델의 어떤 점을 개선했는가?
이 모델이 상정하고 있는 가정은 무엇이며, 특성은 무엇이고, 그 한계는 무엇인가?
현재 내가 가진 문제를 풀기 위해 이 모델을 어떻게 활용할 수 있을까?
내가 이 논문에서 이해한 부분과 이해하지 못한 부분은 각각 어디인가?
여기서 이해하지 못한 부분을 해결하기 위해 무엇을 좀 더 공부해야 할까?
이러한 질문들을 염두에 두고 논문을 읽어야 하는 이유는 학생 때의 공부와 실무의 공부는 달라야 하기 때문이다. 다시 말해, 학생 때의 공부가 A to Z의 정해진 커리큘럼 대로 쉬운 개념부터 시작해 어려운 개념까지 나아가는 공부 방식이라면, 반대로 실무의 공부는 내가 현재 가지고 있는 문제를 해결하기 위해 그 문제를 보다 작은 문제들로 쪼갠 다음에 그 소문제들을 각개격파하기 위한 이른바 찾아가는 공부다. 공부에 대한 인식의 전환이 필요하다.
또한 논문들을 볼 때마다 각 논문들에 대한 Q&A가 간단하게 정리되어 있는 정리노트를 만들어보는 것 또한 개인적으로 추천하는 좋은 공부 방법 중 하나다. 물론 이 정리노트가 실제 물리적인 공책일 필요는 없다. 개인적으로는 워드를 통해 작성해놓고 구글 드라이브 같은 클라우드에 올려놓는 것을 선호한다. 인터넷만 있다면 언제 어디서든 다시 꺼내볼 수 있기 때문이다. 물론 노션이나 옵시디언 같은 애플리케이션을 활용하는 방법도 있다. 정리노트를 만들어 가는 방식은 개인의 취향에 따라 선택하면 된다. 정작 중요한 것은 어떤 도구를 선택할까가 아닌 그러한 습관을 유지하는 것이니 말이다.