두 사람이 만든 작은 결과물
살면서 한 번쯤은 ‘숙제’라는 걸 해봤을 것이다.
특히 대한민국에서 살아왔다면,
숙제는 인생의 일부였을지도 모른다.
그리고 아이러니하게도
어른이 된 지금도 숙제는 계속된다.
단지 달라진 것이 있다면,
누가 시키지 않고, 결과는 오롯이 내 몫이라는 점.
인공지능 사관학교.
이곳은 말 그대로 숙제 천국이다.
아니, IT 업계에서는 그것을 **‘프로젝트’**라 부른다.
과제가 없었던 하루는 손에 꼽을 정도다.
하지만 싫지 않다.
내가 이곳에 온 이유는 무언가를 배우고, 써먹기 위해서니까.
물론 때때로 벅찰 때도 있지만
끝내고 나면 묘한 뿌듯함이 남는다.
이번 조별 과제는, 전공 심화 과정 두 번째 프로젝트였다.
어제부터 본격적으로 시작되었고,
처음으로 랜덤 조 추첨이 있었다.
‘제발, 친한 사람들과 같이 되길…’
속으로 빌어봤지만 역시나.
한 번도 말해본 적 없는 사람들과 한 조가 되었다.
나는 원래 낯을 좀 가리는 편이다.
크면서 많이 나아졌다고는 하지만,
아직도 새로운 사람들과의 협업은 쉽지 않다.
조별 과제에는 늘 그런 흐름이 있다.
하는 사람이 정해져 있다.
그리고… 이번에도 그게 나였다.
온라인 수강 중인 조원들은 예상대로 참여율이 저조했다.
결국, 나와 오프라인 수강생 한 명,
단 두 명의 조별 과제가 시작됐다.
이번 프로젝트의 주제는 다음 중 하나였다:
자동차 보험 업계 – 분류 분석
중고차 시장 – 회귀 분석
우리는 자동차 보험 업계를 택했고,
다음과 같은 항목을 수행해야 했다.
밸류체인 분석
고객 세분화 (→ 클러스터링 활용)
라이벌사 포지셔닝 맵 작성 (Figma 활용)
자동차보험 가입 여부 데이터 분석
평가 지표 선정
머신러닝 모델(RandomForest, XGBoost 등) 적용
우리는 완벽을 추구하진 않았다.
이 과제의 핵심은 ‘성실도’와 ‘커뮤니케이션’이기 때문.
물론 커뮤니케이션만 평가한다면 나는 아마 빵점일지도 모른다.
그만큼 말이 적은 나는,
결과물로 이야기하려 노력했다.
https://colab.research.google.com/drive/1MC2u_DJgFkMAsid4HPUivfTPpdAsHYl6?usp=sharing
RandomForest와 XGBoost, 클러스터링 기법을 활용해
데이터 분석, 분류 모델링, 군집화를 수행해봤다.
RandomForest: 여러 개의 의사결정나무를 조합해 예측 성능을 높이는 앙상블 기법
XGBoost: 빠르고 정확한 Gradient Boosting 기반 모델
클러스터링: 라벨이 없는 데이터를 특성별로 군집화하는 비지도 학습 기법
https://www.notion.so/22a181139cea80acad8dd0e78a487b74?source=copy_link
정리 자료를 노션에 옮겼지만,
조회 오류로 시각화가 제대로 보이지 않는다.
필요하다면 직접 요청해주면 공유드릴 수 있다.
https://www.figma.com/board/QOS2Ew5N4dQYVeqnGJGV6Y/Untitled?t=eSmFWACAyaoox0vd-1
국내 자동차보험사 다섯 군데를 조건별로 위치 지어
포지셔닝 맵 형태로 시각화해봤다.
설명이 부족해서 다소 이해가 어려울 수 있다.
시간 나는 대로 보완해 업로드할 예정이다.
둘이서 하는 조별 과제는 쉽지 않다.
조금 더 사람이 많았다면 더 나은 결과가 나왔을까?
그럴 수도 있다.
그래도 이틀이라는 짧은 시간 안에
생각보다 그럴듯한 결과물이 나와
나름대로는 만족한다.
앞으로는
더 정교하고, 더 설득력 있는 결과물을 만드는 사람이 되고 싶다.