Jan 2021
Study With Me는 매일 학습한 내용을 정리하여 공유하는 매거진입니다.
캐글에서 월간 Tabular Playground competitions을 시작했습니다. 2021년 1월부터 시작했으며 매월 1일 새로운 대회가 개최됩니다. 매월 새로운 Tabular(=표) 데이터로 분석 및 예측할 수 있는 좋은 기회 같네요.
대회 규칙은 아래와 같습니다.
문제 유형 : 지도학습 / 회귀 문제
데이터 : Tabular Data (=표 데이터)
평가 산식 : RMSE
일정 : 2021 연 1월 1일 ~ 1월 31일
상금 : 1~3등까지 캐글 기념상품 제공
메달 : Playground 대회로 대회 메달은 제공되지 않습니다.
데이터는 아래와 같습니다.
train.csv(83.46 MB) / test.csv(52.22 MB)
sample_submission.csv(2.06 MB)
학습 데이터(=train/test)의 컬럼을 살펴보니 id, cont1~14, target까지로 구성된 부분을 확인했습니다. 컬럼(=피처)들은 모두 비식별화되어있네요.
리더보드를 보니 0.69가 상위권 점수네요.
베이스라인 코드로 "Get Started: Jan Tabular Playground Competition"를 가이드하고 있네요.
학습 데이터를 불러와 훈련/검증 데이터로 분할 후 2가지 알고리즘으로 모델링 후 예측 결과를 제출하고 있습니다. 캐글 노트북에서 복사 후 결과 파일을 제출해보세요.
매일 규칙적으로 공부하는 습관 만들어봐요.