brunch

캐글, Tabular Playground Series

Jan 2021

by hansung dev

Study With Me는 매일 학습한 내용을 정리하여 공유하는 매거진입니다.


Tabular Playground Series - Jan 2021!

캐글에서 월간 Tabular Playground competitions을 시작했습니다. 2021년 1월부터 시작했으며 매월 1일 새로운 대회가 개최됩니다. 매월 새로운 Tabular(=표) 데이터로 분석 및 예측할 수 있는 좋은 기회 같네요.

캐글 표-데이터 월간 대회

대회 규칙

대회 규칙은 아래와 같습니다.

문제 유형 : 지도학습 / 회귀 문제

데이터 : Tabular Data (=표 데이터)

평가 산식 : RMSE

일정 : 2021 연 1월 1일 ~ 1월 31일

상금 : 1~3등까지 캐글 기념상품 제공

메달 : Playground 대회로 대회 메달은 제공되지 않습니다.


데이터는 아래와 같습니다.

train.csv(83.46 MB) / test.csv(52.22 MB)

sample_submission.csv(2.06 MB)


학습 데이터(=train/test)의 컬럼을 살펴보니 id, cont1~14, target까지로 구성된 부분을 확인했습니다. 컬럼(=피처)들은 모두 비식별화되어있네요.

train.csv(왼쪽) / sample_submission.csv (오른쪽)

리더보드를 보니 0.69가 상위권 점수네요.


시작하기 ?

베이스라인 코드로 "Get Started: Jan Tabular Playground Competition"를 가이드하고 있네요.

학습 데이터를 불러와 훈련/검증 데이터로 분할 후 2가지 알고리즘으로 모델링 후 예측 결과를 제출하고 있습니다. 캐글 노트북에서 복사 후 결과 파일을 제출해보세요.

Get Started 베이스라인 흐름도


매일 규칙적으로 공부하는 습관 만들어봐요.


keyword
매거진의 이전글캐글CLiP, 이미지 대회 금메달 노하우