brunch

You can make anything
by writing

C.S.Lewis

by 에이아이스쿨 Jan 13. 2023

딥러닝 논문구현 참고 - Papers With Code

딥러닝 논문 구현을 위한 참고 사이트 - Papers With Code

딥러닝 논문 구현을 위해 참고할 수 있는 Papers With Code 사이트에 대해 살펴봅시다.


딥러닝 논문 구현 능력 쌓기

딥러닝 논문 구현 능력을 향상 시키기 위해서는 다음과 같은 과정을 거쳐야만 합니다.


논문 읽기 : 딥러닝 논문을 읽고 딥러닝 논문의 내용을 이해하는 것은 논문 구현에 앞선 필수적인 선행과정입니다. 논문을 읽을 때는 논문에 적힌 아이디어, 알고리즘, 실험 결과를 정확히 이해하는 것이 중요합니다.

다양한 논문 구현 코드 분석 : 다른 사람들이 논문을 구현한 코드들을 분석하면서 논문의 모델구조와 알고리즘을 구체적으로 이해하고, 논문에 적힌 내용이 코드로 어떻게 구현되었는지 알 수 있습니다.


Papers With Code

이때 다른 사람들이 논문을 어떻게 구현했는지를 참조할 때 Papers With Code 사이트를 이용하면 많은 도움을 받을 수 있습니다. Papers with Code는 연구의 재현성(Reproducibility)을 향상시키기 위한 웹 사이트로, 연구자들이 발표한 논문과 관련된 코드, 데이터를 공유할 수 있는 플랫폼입니다.


Papers With Code 사이트에 YOLO 논문을 검색한 결과



YOLO(You Only Look Once) 논문 구현 코드 살펴보기

예를 들어, YOLO(You Only Look Once) 논문의 구현 코드들을 살펴보고 싶을 경우에 Paper With Code에 YOLO 논문을 검색하면 아래와 같은 YOLO 구현 코드들을 확인할 수 있습니다.


Papers With Code에서 YOLO 논문 구현 코드들을 확인할 수 있습니다.

다양한 YOLO 구현 코드들에 대한 GitHub 링크를 Star가 많은 순으로 내림차순 정렬돼서 보여줍니다. 또한 해당 구현체에서 사용한 라이브러리가 TensorFlow인지 PyTorch인지도 구분해서 보여줍니다.


U-NET, GPT-1 논문 구현 코드 살펴보기

마찬가지 과정으로 U-NET(U-Net: Convolutional Networks for Biomedical Image Segmentation), GPT-1(Improving Language Understanding by Generative Pre-Training) 논문의 구현 코드를 살펴보면 아래와 같은 구현 코드들을 확인할 수 있습니다.


U-NET과 GPT-1 논문 구현 코드들을 확인할 수 있습니다.

이런 논문 구현 코드에 대한 참고 링크뿐만 아니라 각 데이터셋 별로 State-of-the-art(SOTA) 성능을 보여주는 모델들을 확인할 수 있는 리더보드도 제공합니다.


State-of-the-art(SOTA)란, 현재까지 알려진 기술 중 최신 기술을 말합니다. 즉, 현재까지 알려진 기술 중 가장 우수한 기술을 의미합니다. SOTA는 새로운 기술이 발전하면서 계속 변화하며, 특정 분야에서는 새로운 기술이 발명되면 다시 새로운 SOTA가 될 수 있습니다. 예를를 들면, YOLO v1 모델이 SOTA 성능을 보여주는 모델이었지만 이후에 YOLO v2이 새롭게 제안되면서 SOTA 성능을 보여주는 모델이 변경되었습니다. 


각 문제영역별 연도별로 SOTA(state-of-the-art) 성능을 보여주었던 모델들과 해당 모델들이 제안된 논문과 구현코드들을 확인할 수 있습니다.


따라서 딥러닝 논문 구현 능력을 향상시키고자 할 경우, Paper With Code 사이트를 활용하면 많은 도움을 받을 수 있습니다.


References

[1] https://paperswithcode.com/

[2] Redmon, Joseph, et al. "You only look once: Unified, real-time object detection." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.

[3] Ronneberger, Olaf, Philipp Fischer, and Thomas Brox. "U-net: Convolutional networks for biomedical image segmentation." International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015.

[4] Radford, Alec, et al. "Improving language understanding by generative pre-training." (2018).


 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari