brunch

You can make anything
by writing

C.S.Lewis

by 삼더하기일 Feb 21. 2024

[Review] 데이콘 경진대회 1등 솔루션

수준 높은 데이터 과학이란 무엇일까?

데이콘 경진대회 1등 솔루션

데이터 분석, 데이터 과학, 머신러닝, 딥러닝, AI에 대한 수요는 점차 늘어나고 있습니다. 이는, 이 분야에 종사하는 사람들 혹은 종사하기를 희망하는 사람들이 점차 늘어나고 있다는 것을 의미합니다. 이러한 배경으로 데이터 기반 경진대회를 개최하는 플랫폼들이 많이 생겨나기도 합니다. 최근에는 다양한 경진대회 플랫폼이 많지만 단연코 국내에서 가장 유명한 경진대회를 뽑으라고 하면 데이콘(https://dacon.io/)을 뽑을 수 있습니다. 데이콘을 통해 많은 사람들은 실제 데이터를 활용하고 AI 모델을 구축하는 것에 많은 경험 및 공부를 하고 있습니다.


요약

데이콘 경진대회 1등 솔루션은 데이콘에서 진행된 여러 경진대회 중 특정 대회들의 1등 수상자들의 코드를 집약하여 출간된 도서입니다. 실제로 진행된 각 대회의 설명과 더불어, 우승자들이 깔끔하게 정리해 둔 사용 코드와 이러한 코드를 구축하게 된 전체적인 의사결정 과정을 간접적으로 파악할 수 있습니다.


총평

(출판사 : 위키독스)

별다른 서론이나 기초 개념을 잡는 챕터 없이 바로 실제 경진대회 솔루션을 소개하는 것으로 시작해 실제 경진대회 솔루션을 소개하는 것으로 마무리되고 있습니다. 오로지 경진대회 솔루션을 담았다는 것이 이 책의 가장 큰 특징인 것 같습니다. 시중에 데이터와 인공지능의 개념을 소개하는 도서는 많지만 실무적인 관점에서 어떻게 데이터로부터 AI 모델을 구축할 때 최대의 효율을 뽑아낼 수 있는지에 대해 논하는 도서는 많지 않습니다. 그만큼 다른 도서에서는 제공하지 못하는 차별점을 가지고 있습니다.


다만, 이 책을 읽는 독자들의 타깃은 어느 정도 제한이 있는 듯합니다. 아예 데이터 과학 분야를 모르는 사람이 이 도서를 접하기에는 난도가 높을 수 있습니다. 흔히 말하는 '분석'에 초점을 맞추고 싶어 하는 사람들에게도 적합하지 않을 수 있습니다. 하지만 머신러닝과 관련해 니즈가 있는 독자라면 큰 만족도를 얻을 수 있습니다.

저 역시 이 도서의 저자 중 한 사람입니다. 실제 집필 과정에서도 대회를 준비한 모든 과정을 다 알차게 담았지만 초보자가 이해하기엔 어려울 수 있겠다는 생각을 지우긴 힘들었습니다.


장점

1) 앞서 언급했듯 머신러닝 분야를 깊게 이해하기에 큰 도움이 됩니다. 문제 정의부터 시작하여 성능 향상까지의 일관된 업무 프로세스를 상세히 보여줍니다. 

2) 다양한 도메인의 5개 솔루션을 소개하고 있어 관심이 있는 영역부터 흥미롭게 내용을 습득할 수 있습니다.

3) 기초 수준이 아닌 '1등 수상작 코드'를 사용함으로써 향후 코딩을 함에 있어 좋은 참고자료로 사용할 수 있습니다.


단점

1) 프로그래밍, 데이터 과학, AI 등을 아예 공부하지 않았다면 책의 내용을 이해하기 어렵습니다.

2) 최근 화두인 비정형 데이터(텍스트 혹은 이미지)를 다루는 AI 솔루션이 담겨 있지는 않습니다.


머신러닝에 초점을 맞추어 개론이나 입문 수준이 아닌 중/고급 스킬을 습득하고 싶은 분들 혹은 이론적인 차원이 아닌 실무적으로 AI를 공부하고 싶은 분들에게 추천드립니다. 

매거진의 이전글 [Review] 비전공자를 위한 빅데이터 가이드북
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari