brunch

You can make anything
by writing

C.S.Lewis

by 퀀트대디 Jan 18. 2024

퀀트의 공부법 #2.

# 1편에 이어

논문 얘기가 나왔으니 논문을 읽는 방법에 대해 보다 구체적으로 이야기를 해보자. '아니, 논문을 그냥 읽으면 되지 읽는 방법이 어디 따로 있나'라는 반문을 할 수도 있지만 극한의 효율충인 우리는 1분 1초 한시도 허투루 쓸 수 없다. 따라서 논문을 그냥 소설처럼 처음부터 순서대로 읽어 내려가서는 안되며 비문학 독해를 풀듯이 그렇게 전략적으로 읽어야 한다. 지난번에 논문들의 트리 구조를 이야기하면서 전체적인 판을 까는 연습을 했다면, 여기서는 한 편의 논문을 읽을 때 어떻게 하면 효율적으로 공부를 할 수 있을지를 한 번 이야기해 보도록 하자.



# 논문의 구성요소

우선 논문을 효율적으로 공부하기 위해서는 논문이라는 학술 문서가 가지고 있는 정형적인 구조에 대해 살펴볼 필요가 있다. 이 구조만 제대로 파악하고 있어도 논문 공부의 효과가 한층 높아진다. 일반적인 논문의 구조는 아래와 같은 순서로 구성되어 있다.


1) 제목(Title)

2) 초록(Abstract)

3) 서론(Introduction)

4) 문제 정의 및 연구 목표(Problem Statement)

5) 연구 배경(Background/Literature Review)

6) 연구 방법(Data and Methodology)

7) 연구 결과(Result)

8) 결론(Conclusion)

9) 참고문헌(References)

10) 부록(Appendix)



# 논문 독법 101

이렇게 논문에는 일정한 구조, 즉 일정한 템플릿이 존재한다. 따라서 우리는 논문 상에서 각 절의 구체적인 내용을 샅샅이 읽어보지 않아도 그 절이 어떤 목적의식을 가지고 있는가를 알 수 있다. 그렇다면, 이러한 정형화된 구조를 가진 논문이라는 녀석, 어떻게 읽어야 할까? 효과적인 논문 독법은 다음과 같이 크게 네 가지 단계를 거친다.


1) 제목/초록/그림/표

우선 논문을 볼 때 가장 처음 읽어야 할 부분, 당연히 제목과 초록이다. 우리가 서점에 가서 책을 고를 때 우선적으로 그 책의 표지에 있는 제목을 먼저 보는 것처럼 논문의 제목 또한 그 논문이 담고 있는 내용을 한 마디로 표현하고 있다. 또한 제목과 더불어 논문의 맨 앞에 나오는 것이 바로 초록이다. 초록은 논문에서 예고편과 같은 역할을 한다. 따라서 초록을 읽으면 해당 논문이 어떤 주제로 어떤 내용을 말할 것인가를 짧은 시간 내에 파악할 수 있다.


그다음에 봐야 할 부분은 바로 다름 아닌 시각적인 요소들, 즉 그림과 표다. 왜 본문에 있는 텍스트를 읽기 전에 우선 그림과 표를 들여다봐야 하는 것일까? 그 이유는 그림과 표야말로 연구 결과를 압축적으로 임팩트 있게 보여줄 수 있는 방식이기 때문이다. 그림과 표, 그리고 이에 딸려 있는 조그만 설명들을 읽으면서 연구의 전개 방식 혹은 연구 결과를 직관적으로 인식할 수 있다. 퀀트와 관련한 논문들에서 자주 볼 수 있는 그림 혹은 표는 백테스팅 결과, 시뮬레이션 분석 결과, 매개변수 변화에 따른 헤징 효과 결과 등 실무적으로 퀀트가 프로그래밍을 통해 구현해 내는 내용들이기에 이를 주의 깊게 살펴본다면 향후 스스로 분석이나 구현을 해보기 전 많은 영감을 받을 수 있다.


2) 서론과 결론

제목과 초록, 그리고 시각적 결과를 한 번 스윽 살펴봤다면, 이제 비로소 논문의 시작과 끝을 담당하는 서론과 결론을 읽을 차례다. 그다음으로 서론과 결론을 읽어야 하는 이유는 여기에 논문 저자의 의도와 전반적인 연구 과정 및 그 결과가 일목요연하게 정리되어 있기 때문이다. 사실 논문을 전부 읽지 않더라도 이 정도까지 온다면 이 논문의 핵심 내용과 줄기를 손쉽게 추출해낼 수 있다. 그만큼 목적의식이나 주제에 대한 정보 함유량이 가장 많은 부분이 바로 이 서론과 결론이다. 이 연구가 성공적이었는지 그렇지 못했는지, 저자는 이 연구를 통해 소기의 목적을 달성했는지 그렇지 못했는지를 단시간에 파악함으로써 우리는 이 논문을 더 들여다볼지 아니면 다른 논문을 좀 더 검색해 볼지 우리의 입장에 맞게 추론해 볼 수 있다.


3) 데이터 및 방법론

만약 1번과 2번 과정을 통해 이 논문의 전반적인 내용이 마음에 들었고 보다 구체적으로 논문 저자가 어떤 데이터 혹은 테크닉을 사용해 연구 분석을 진행했는지 알고 싶다면 이제 해야 할 일은 바로 연구 방법 섹션으로 넘어가 논문 저자의 구체적인 실험 과정을 따라가보는 것이다.


데이터는 어떤 주기, 어떤 종류의 데이터를 사용했는지, 데이터 전처리는 어떻게 수행했는지, 어떤 모델이나 기법을 사용해 데이터를 분석했는지 등을 생각하며 이 부분을 읽어 내려간다. 특히나 이 부분에서는 구체적인 모델이나 분석 기법이 나올 것이기 때문에 수식적인 요소들이 등장할 것이다. 만약 이러한 수식들을 보면서 금방 이해가 안 된다면, 나중에 추가적인 공부를 위해 그 수식이 어떤 개념을 말하고 있는지 혹은 그 모델의 이름을 기억해두도록 하자. 또한 데이터 및 방법론 섹션을 보면서 나라면 이를 어떻게 실제로 구현해낼지에 대한 고민을 해보는 것도 좋다.


4) 그 외 디테일

만약 위의 과정을 전부 거쳤는데 이 논문의 내용이 너무 마음에 들고 이에 대해 더 알아보고 싶다면 그 외의 다른 내용들도 시간이 날 때 읽어보면 된다. 앞서 언급했지만 논문을 소설처럼 순서대로 읽을 필요는 없다. 아니, 순서대로 읽는 것이 되려 좋은 방법은 아니라고 본다. 실무를 위한 공부를 할 때만큼은 완벽주의를 내려놓자.


사실 다른 논문들을 하나도 보지 않고 어떤 한 편의 논문을 완벽하게 이해하는 일이란 굉장히 어려운 일이다. 따라서 논문을 읽을 때는 어떤 주제와 관련된 여러 편의 논문을 빠르게 훑어보며 우리 뇌가 여기에 익숙해지도록 만드는 게 급선무다. 따라서 논문 공부를 할 때는 논문들의 트리 구조를 만들어나가는 동시에 각 논문들에 대한 이해도를 점진적으로 높여나가는 방식이 좋다. A 논문의 이해도를 10% 쌓아놓고 B 논문으로 넘어가 또 10%, C 논문으로 넘어가 또 10%, 이제 A 논문으로 다시 돌아와 20% 이런 식으로 말이다.

개념 이해의 정도란 사실 익숙함의 정도다. 뇌는 가소성을 가지고 있음을 잊지 말자. 5편에서 20편 정도의 논문을 보면 어떤 개념에 대해 익숙해지기 때문에 남들에게 그 정의를 간단하게 설명할 정도가 되며, 50편에서 100편 정도의 논문을 본다면 그 개념을 비교적 심오한 수준까지 이해할 정도가 된다. 수능을 치기 위해 문제집을 단 한 권만 사는 학생은 없지 않은가. 똑같은 논리다.



# 논문 정리노트

또한 논문을 읽으면서 우리는 계속해서 자기 자신과 계속 대화를 해야 한다. 여기서 말하는 대화란 질문과 대답이 반복되는 Q&A를 뜻한다. 논문을 읽으면서 혹은 논문을 다 읽고 난 뒤에 우리는 다음과 같은 질문들에 대답할 준비가 되어 있어야 한다.


            이 논문은 어떤 문제를 해결하고자 하는가?          

            그 문제를 해결하기 위해 어떤 데이터, 모델 혹은 아이디어를 사용했는가?          

            어떤 환경과 맥락 속에서 그러한 모델이 탄생하게 되었는가?          

            이 모델은 이전 세대 모델의 어떤 점을 개선했는가?          

            이 모델이 상정하고 있는 가정은 무엇이며, 특성은 무엇이고, 그 한계는 무엇인가?          

            현재 내가 가진 문제를 풀기 위해 이 모델을 어떻게 활용할 수 있을까?          

            내가 이 논문에서 이해한 부분과 이해하지 못한 부분은 각각 어디인가?          

            여기서 이해하지 못한 부분을 해결하기 위해 무엇을 좀 더 공부해야 할까?          


이러한 질문들을 염두에 두고 논문을 읽어야 하는 이유는 학생 때의 공부와 실무의 공부는 달라야 하기 때문이다. 다시 말해, 학생 때의 공부가 A to Z의 정해진 커리큘럼 대로 쉬운 개념부터 시작해 어려운 개념까지 나아가는 공부 방식이라면, 반대로 실무의 공부는 내가 현재 가지고 있는 문제를 해결하기 위해 그 문제를 보다 작은 문제들로 쪼갠 다음에 그 소문제들을 각개격파하기 위한 이른바 찾아가는 공부다. 공부에 대한 인식의 전환이 필요하다.


또한 논문들을 볼 때마다 각 논문들에 대한 Q&A가 간단하게 정리되어 있는 정리노트를 만들어보는 것 또한 개인적으로 추천하는 좋은 공부 방법 중 하나다. 물론 이 정리노트가 실제 물리적인 공책일 필요는 없다. 개인적으로는 워드를 통해 작성해놓고 구글 드라이브 같은 클라우드에 올려놓는 것을 선호한다. 인터넷만 있다면 언제 어디서든 다시 꺼내볼 수 있기 때문이다. 물론 노션이나 옵시디언 같은 애플리케이션을 활용하는 방법도 있다. 정리노트를 만들어 가는 방식은 개인의 취향에 따라 선택하면 된다. 정작 중요한 것은 어떤 도구를 선택할까가 아닌 그러한 습관을 유지하는 것이니 말이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari